Baza elementelor de bază este codificarea ASCII și interpretările sale moderne. Aplicarea practică a codificării informațiilor

Relevanţă. Introducerea tehnologiei informației a afectat tehnologia fluxului de documente în cadrul și între organizații, precum și între utilizatorii individuali. Mare importanțăîn acest domeniu, gestionarea electronică a documentelor este în curs de achiziție, ceea ce face posibilă abandonarea suporturilor de hârtie (reducerea ponderii acestora în fluxul total) și schimbul de documente între entități din în format electronic. Avantajele acestei abordări sunt evidente: reducerea costurilor pentru procesarea și stocarea documentelor și a acestora cautare rapida. Cu toate acestea, abandonarea managementului documentelor pe hârtie a ridicat o serie de probleme legate de asigurarea integrității document transmisși autentificarea autenticității autorului său.

Scopul lucrării. Oferiți concepte de bază pe tema „Codificare” informații text„, reflectă capacitățile atacatorului atunci când implementează amenințări care vizează încălcarea integrității mesajelor transmise și sugerează modalități de rezolvare a problemei.

Ce este un cod? Cod este un sistem de simboluri pentru prezentarea informațiilor.

Codificare– este prezentarea informaţiei într-un mod convenabil formă alternativă folosind un anumit cod pentru transmitere, procesare sau stocare și decodare este procesul de restaurare a formei inițiale de prezentare a informațiilor.

Un computer personal procesează informații numerice, text, grafice, sonore și video. Într-un computer, este reprezentat în cod binar, deci dacă se folosește un alfabet de două caractere - 0 și 1. În codul binar este cel mai ușor reprezentat ca un impuls electric, absența (0) și prezența (1) a acestuia. Acest tip de codare se numește binară.

Elemente de informații codificate:

Litere, cuvinte și expresii din limbajul natural;

Semnele de punctuație, aritmetica și operatii logice, etc;

Informații ereditare etc.

Semnele de operare și operatorii de comparație înșiși sunt denumiri de cod, reprezentând litere și combinații de litere, numere, simboluri grafice, impulsuri electromagnetice, semnale luminoase și sonore etc.

Metode de codificare:numeric(folosind numere) simbolic(folosind caractere alfabetice text sursă) Și grafic(folosind imagini, pictograme)

Obiective de codare:

A) Comoditatea stocării, procesării, transmiterii și schimbului de informații între entități;

B) Vizualizarea afișajului;

C) Identificarea obiectelor și subiectelor;

D) Ascunderea informațiilor secrete.

Distinge cu un singur nivelȘi pe mai multe niveluri codificarea informațiilor. Codarea cu un singur nivel este utilizată pentru semnalele de semafor. Reprezentare pe mai multe niveluri a unei imagini vizuale (grafice) sub forma unui fișier foto. În primul rând, imaginea vizuală este împărțită în pixeli, fiecare parte individuală a imaginii este codificată de un element elementar, iar elementul, la rândul său, este codificat ca un set de culori (RGB: roșu - roșu, verde - verde, albastru - albastru) cu intensitatea corespunzătoare, care este reprezentată sub formă valoare numerică(seturile acestor numere sunt codificate în formate jpeg, png etc.). În cele din urmă, numerele rezultate sunt codificate ca semnale electromagnetice pentru transmisie prin canale sau zone de comunicație. Numerele în sine procesare software sunt prezentate în conformitate cu sistem acceptat codificarea numerelor.

Distinge reversibilȘi ireversibil codificare. Cu reversibil, este posibil să reconstruiți fără ambiguitate mesajul fără pierderea calității, de exemplu, codificare folosind codul Morse. Dacă este ireversibilă, restaurarea fără ambiguitate a imaginii originale este imposibilă. De exemplu, codificarea informațiilor audiovizuale ( formate jpg, mp3 sau avi) sau hashing.

Exista publicȘi secret sisteme de codare. Primele sunt folosite pentru a facilita schimbul de informații, cele din urmă - pentru a le ascunde de cei din afară.

Codificarea informațiilor text. Utilizatorul procesează text format din litere, cifre, semne de punctuație și alte elemente.

Pentru a codifica un caracter aveți nevoie 1 octet memorie sau 8 biți. Folosind o formulă simplă care conectează numărul de evenimente posibile (K) și cantitatea de informații (I), calculăm câte simboluri diferite pot fi codificate: K = 2^I = 28 = 256. Pentru a codifica informațiile text, se folosește un alfabet cu o capacitate de 256 de caractere.

Principiu codificare dată este că fiecare caracter (litera, semnul) are propriul cod binar de la 00000000 la 11111111.

Există cinci tabele de codificare diferite pentru codificarea literelor alfabetului rus (KOI - 8, SR1251, SR866, Mas, ISO). Textele codificate într-un tabel nu vor fi afișate corect într-o altă codificare:

Pentru un cod binar în mese diferite diferite simboluri corespund:

Tabelul 1 - Conformitate personaje diferite cod binar

Cod binar Cod zecimal KOI8 CP1251 CP866 Mas ISO
11000010 194 B ÎN - - T

Recodarea documente text programe încorporate în editori de textși procesoare. De la începutul anului 1997 Microsoft Office suportă noi Codificare Unicode, poate codifica nu 256, ci 655369 caractere (2 octeți au început să fie alocați pentru fiecare caracter).

Biți și octeți. Un număr perceput de o mașină conține o anumită cantitate de informații. Este egal cu un bit. Acest lucru se aplică fiecărui zero care alcătuiește una sau alta secvență de informații criptate. În consecință, cantitatea de informații în orice caz poate fi determinată pur și simplu prin cunoașterea numărului de caractere din secvența codului binar. Ele vor fi numeric egale între ele. 2 cifre din cod transportă 2 biți de informații, 10 cifre – 10 biți și așa mai departe. Principiul determinării volumului de informații:

Figura 1 – definirea volumului de informații

Problemă de integritate a informațiilor. Problema integrității informației a parcurs un drum destul de lung de la începuturi până în zilele noastre. cursă lungă. Inițial, au existat două moduri de a rezolva problema: folosind metode criptografice protecția informațiilor și stocarea datelor și controlul software și hardware al accesului la date și la resursele sistemului informatic. Merită să luăm în considerare faptul că la începutul anilor 80, sistemele informatice erau slab distribuite, iar tehnologiile de rețea locală erau la ei stadiul inițial dezvoltarea sa, iar aceste sarcini au fost rezolvate cu succes.

Metode moderne de prelucrare, transmitere și stocare securitatea informatiei a contribuit la apariția amenințărilor asociate cu posibilitatea de pierdere, denaturare și dezvăluire a datelor adresate sau aparținând altor utilizatori. Prin urmare, asigurarea integrității informațiilor este unul dintre domeniile de vârf ale dezvoltării IT.

Securitatea informației se referă la protecția informațiilor împotriva consumului ilegal: familiarizare, transformare și distrugere.

Distinge natural (independent de activitatea umană)Și artificial (cauzat de activitatea umană) amenintari la securitatea informatiei. În funcție de motivele lor, cele artificiale sunt împărțite în neintenționate (accidentale) și intenționate (intenționate).

Asigurarea că un mesaj nu a fost modificat în timpul transmiterii este necesară atât pentru expeditor, cât și pentru destinatar. e-mail. Destinatarul trebuie să fie capabil să recunoască faptul că au fost făcute distorsiuni în document.

Problema autentificării identității autorului unui mesaj este să se asigure că niciun subiect nu poate semna cu un alt nume decât al său. În fluxul obișnuit de documente pe hârtie, informațiile din document și semnătura de mână a autorului sunt strict legate de suportul fizic (hârtie). Pentru managementul documentelor electronice, nu există o legătură strictă între informație și suportul fizic.

Să ne uităm la metodele de hacking sisteme informatice, toate încercările sunt împărțite în 3 grupuri:
1. Atacurile de nivel sistem de operare: furt de parolă, scanare hard disk-uri computer, colectarea gunoiului (obținerea accesului la obiecte de la distanță din coșul de gunoi), rularea unui program în numele utilizatorului, modificarea codului sau datelor subsistemelor etc.
2. Atacul la nivelul sistemelor de management al bazelor de date: 2 scenarii, în primul caz rezultatele operatii aritmetice câmpurile numerice peste DBMS sunt rotunjite în jos, iar diferența este rezumată într-o altă înregistrare DBMS în al doilea caz, hackerul obține acces la datele statistice;
3. Atacuri la nivel de software de rețea. Reţea software(OFF) cel mai vulnerabil: interceptarea mesajelor pe router, crearea unui router fals, intruziunea mesajelor, refuzul serviciului

Să enumerăm capacitățile unui atacator atunci când implementează amenințări care vizează încălcarea integrității mesajelor transmise și autenticitatea autorului lor:

A) Interceptarea activă. Intrusul interceptează mesajele transmise prin schimbarea lor.

B) Mascaradă. Contravenientul trimite un document către abonatul B, semnând numele abonatului A.

ÎN) Renegati. Abonatul A susține că nu i-a trimis mesaje către abonatul B, deși de fapt a făcut-o. În acest caz, abonatul A este un atacator.

G) Substituţie. Modificări/formulare abonatului B document nou, pretinzând că l-a primit de la abonatul A. Utilizatorul necinstit este destinatarul mesajului B.

Pentru a analiza integritatea informațiilor, se utilizează o abordare bazată pe calcul suma de control mesaj transmis și funcție de hashing (un algoritm care permite ca un mesaj de orice lungime să fie reprezentat ca o valoare scurtă a unei lungimi fixe).

H și în toate etapele ciclu de viață există o amenințare la adresa CI (integritatea informațiilor):

La procesarea informatieiÎncălcarea DI apare din cauza defecțiunilor tehnice, algoritmice și erori de software, erori și acțiuni distructive ale personalului de service, interferențe externe, programe distructive și rău intenționate (viruși, viermi).

În curs transferuri informație - diferite feluri interferențe atât de origine naturală, cât și artificială. Este posibilă distorsiunea, distrugerea și interceptarea informațiilor.

În curs depozitare principala amenințare este acces neautorizatîn scopul modificării informațiilor, malware (viruși, viermi, bombe logice) și defecțiuni tehnice.

În curs îmbătrânire– pierderea tehnologiilor capabile să reproducă informații și îmbătrânirea fizică a purtătorilor de informații.

Amenințările la adresa informațiilor digitale apar pe parcursul întregului ciclu de viață al informațiilor, din momentul apariției acesteia și până la începutul eliminării.

Măsuri pentru prevenirea scurgerii de informații canale tehnice includ inspecții ale spațiilor pentru a detecta dispozitivele de ascultare, precum și o evaluare a securității spațiilor împotriva posibilelor scurgeri de informații folosind metode de la distanță interceptarea și cercetarea vehiculelor în care se poartă conversații confidențiale.

Asigurarea integritatii informatiilor. Pentru a asigura CI o conditie necesara este disponibilitatea de foarte fiabile mijloace tehnice(TS), inclusiv componente hardware și/sau software și diverse metode software, extinzând semnificativ capacitatea de a asigura securitatea informațiilor stocate. TS oferă toleranță ridicată la erori și protecție a informațiilor împotriva posibile amenințări. Acestea includ mijloace de protecție împotriva impulsurilor electromagnetice (EMP). Cel mai metoda eficienta reducerea intensităţii EMR este ecranare– amplasarea echipamentului într-o carcasă conductoare de electricitate care împiedică pătrunderea câmpului electromagnetic.

Metodele organizatorice includ controlul accesului, care organizează accesul la informații despre echipamentele folosite și presupune o listă destul de mare de activități, de la selecția angajaților până la lucrul cu echipamente și documente. Printre acestea se numără tehnologiile de protecție, procesare și stocare a documentelor, certificarea spațiilor și a zonelor de lucru și procedurile de protecție a informațiilor împotriva acțiunilor accidentale/neautorizate. O atenție deosebită este acordată protecției sistemelor de operare (OS), care asigură funcționarea aproape a tuturor componentelor sistemului. Cel mai eficient mecanism de control al accesului pentru sistemul de operare este izolat mediu software(IPS). Rezistența sistemului informațional la diverse programe distructive și rău intenționate mărește sistemul informațional, asigurând integritatea informațiilor.

Protecție antivirus. Momentan sub virus de calculatorînțeles în mod obișnuit codul programului, având capacitatea de a crea copii ale lui însuși și având mecanisme care încorporează aceste copii în obiecte executabile sistem de calcul. Programele rău intenționate (virușii) au multe tipuri și tipuri, care diferă doar în modurile în care afectează diverse fișiere, plasarea în memoria computerului sau în programe, obiecte de influență. Principala proprietate a virușilor, care îi deosebește de multe programe și îi face cei mai periculoși, este capacitatea lor de a se reproduce.

CI oferă utilizarea de programe antivirus, dar niciunul dintre ele nu garantează detectarea unui virus necunoscut. Scanerele euristice utilizate nu dau întotdeauna diagnosticul corect. Exemplu greseli similare- Două programe antivirus rulează pe același computer: fișierele de la un antivirus sunt acceptate ca malware alt antivirus.

Utilizare rețele locale cei fara conexiune la internet - Cel mai bun mod protectie impotriva virusilor. În același timp, este necesar să controlați cu strictețe diverse medii de stocare cu programe de aplicație care poate fi folosit pentru transmiterea unui virus.

Codare rezistentă la zgomot. Informația este cea mai vulnerabilă în timpul procesului de transmitere. Controlul accesului elimină multe amenințări, dar este imposibil atunci când este utilizat într-un canal

conexiuni de linie fără fir. Informația este cea mai vulnerabilă tocmai în astfel de zone ale ICS. Furnizarea de informații digitale se realizează prin reducerea volumului de informații transmise. Această reducere poate fi realizată prin codificarea sursă optimă.

Metoda compresiei dinamice. În această abordare, structura mesajului comprimat include un dicționar și informații comprimate. Cu toate acestea, dacă există o eroare în dicționar în timpul transmiterii sau stocării, atunci apare un efect de propagare a erorii, care duce la distorsiunea/distrugerea informațiilor.

Steganografie. Oricine lucrează în criptografie este familiarizat cu acest termen. Există trei domenii ale steganografiei: ascunderea datelor, filigranele digitale și anteturile. Odată cu transferul ascuns de informații, concomitent cu asigurarea confidențialității, se rezolvă și problema furnizării datelor digitale. Nu poți schimba ceea ce nu poți vedea - principalul argument pentru utilizarea steganografiei. A ei dezavantajul principal– volum mai mare al containerului. Dar acest lucru poate fi atenuat prin trecerea lui ca container Informatii utile, nu este critic pentru CI.

Rezervare utilizate în transmiterea și stocarea informațiilor. În timpul transmisiei, un mesaj poate fi repetat de mai multe ori într-o direcție sau trimis în toate direcțiile posibile. Această abordare poate fi considerată una dintre metodele PCI. La stocare, ideea de backup este destul de simplă - crearea de copii ale fișierelor primite și stocarea lor separat de documentele originale. Adesea, astfel de facilități de depozitare sunt create în locații dispersate geografic.

Dezavantajul rezervării este posibilitatea retragerii neautorizate a acesteia, deoarece informatii disponibile pe dispozitive externe stocarea este neprotejată.

Concluzie. Orice informație afișată pe monitorul unui computer, înainte de a apărea acolo, este supusă codării, care constă în traducerea informațiilor în limbajul mașinii. Este o succesiune de impulsuri electrice – zerouri și unu. Pentru codare diverse personaje sunt mese separate.

  • Andrianov, V.I. " Lucruri de spionaj„și dispozitive pentru protejarea obiectelor și informațiilor: carte de referință. indemnizatie / V.I. Andrianov, V.A. Borodin, A.V. Sokolov. Sankt Petersburg: Lan, 1996. – 272 p.
  • Baranov, A.P. Probleme de asigurare a securității informațiilor în sistemele informaționale și de telecomunicații motiv specialși modalități de a le rezolva // Societatea informaţională. - 1997. numărul 1. - Cu. 13-17.
  • Numărul de vizualizări ale publicației: Va rugam asteptati

    Ziua bună tuturor. Alexey Gulynin este în legătură. În ultimul articol la care ne-am uitat crearea de tabele în html. În acest articol aș dori să vorbesc despre o problemă pe care cu siguranță o vei întâlni (dacă nu ai întâlnit-o deja) în practica ta. Și această problemă este legată de codificare pe site. Această situație se întâmplă adesea: stai, vii cu ceva, iar în final gândurile tale sunt exprimate în cod scris. Vă deschideți creația în browser și există o prostie completă scrisă acolo, sau așa cum o numesc de obicei această prostie - „krakozyabry”. Un lucru este evident aici, că problema cu codificarea pe site. Cel mai probabil codarea dvs. implicită este windows-1251 (chirilic), iar browserul încearcă să vă deschidă fișierul în codificare utf-8. Pe scurt despre ce este codificarea. O codificare este un fel de tabel care atribuie fiecărui caracter un anumit Codul mașinii. În consecință, literele noastre rusești dintr-o codificare au un singur cod, în altele - un cod diferit. Prieteni, folosiți codarea utf-8 peste tot și veți fi fericiți. Utf-8 se mai numește și Unicode.

    Să creăm un document de testare în Notepad++ și să scriem următorul cod.

    Probleme de codificare

    Testarea problemelor de codificare



    În meniul Notepad++, asigurați-vă că „Codări” este în partea de sus - „Codificare în ANSI”. Acum vom crea artificial o problemă cu codificarea. Încercați să deschideți acest fișier în browser acum. Vom vedea hieroglife. Ideea aici este că am creat fișierul nostru în codificare ANSI (chirilic) și browserului i s-a spus că fișierul nostru este în codificare utf-8 ( ) .

    Motivele pentru care probleme cu codarea pe site:

    1) Valoarea incorectă a atributului set de caractere al etichetei meta.

    2) În meniul Notepad++, verificați dacă codificarea fișierului este utf-8. Acest lucru trebuie făcut „Codări” - „Codificare în UTF-8 (fără BOM)”. Pe Internet puteți găsi o definiție a ceea ce este „BOM”, dar nu este clară. Din câte am înțeles, la începutul documentului este scris spatiu de nerupere cu lățimea zero. Nu avem nevoie, așa că pune întotdeauna „fără BOM”.

    3) Se întâmplă ca primele două puncte să fi fost finalizate, dar tot mai apar prostii pe paginile site-ului. Aici problema poate fi în setările serverului, de exemplu. hosting transferă direct antetele fișierelor noastre și setează codarea implicită. Să încercăm să-l înțărcăm de la a face asta. Ar trebui să existe un fișier .htaccess în directorul rădăcină al site-ului. Folosind acest fișier, puteți face ajustări la operațiunea de găzduire. Dacă nu aveți acest fișier, atunci trebuie să îl creați. Este convenabil să faceți acest lucru în Editor de notepad++. ÎN acest fișier trebuie sa scrieti urmatorul cod:

    AddDefaultCharset UTF-8

    Cu această instrucțiune îi spunem serverului că codificarea noastră implicită este „utf-8”. Dacă acest lucru nu ajută, atunci trebuie să scrieți următorul cod în același fișier:

    Charset dezactivat pe AddDefaultCharset Off

    Aici încercăm să spunem serverului că nu dorim o codificare implicită. Dacă după aceste mașinațiuni nimic nu ajută, atunci trebuie să scrieți gazdei și să decideți această problemă cu el. Poate iti va spune ceva.

    Scopul lucrării: familiarizarea cu varietatea de coduri din jurul unei persoane, rolul și definirea domeniului de aplicare practică a codificării informațiilor.

    Relevanța acestei teme este determinată de necesitatea luării în considerare a problemelor legate de codificarea informațiilor, datorită importanței lor practice mari.

    Semnificație practică: materialul articolului poate fi folosit ca informații suplimentare atunci când se ia în considerare problematica de codificare a informațiilor sau ca material educațional atunci când se desfășoară o lecție de seminar.

    INTRODUCERE.

    O caracteristică fundamentală a civilizației este creșterea producției, consumului și acumulării de informații în toate sectoarele activității umane. Întreaga viață a unei persoane, într-un fel sau altul, este legată de primirea, acumularea și procesarea informațiilor. Orice face o persoană: fie că citește o carte, se uită la televizor, vorbește, primește și procesează în mod constant și continuu informații.

    Orice organism viu, inclusiv oamenii, este un purtător de informații genetice care este moștenită. Informația genetică este stocată în toate celulele corpului în molecule de ADN (acid dezoxiribonucleic). Molecula de ADN uman include aproximativ trei miliarde de perechi de nucleotide și codifică toate informațiile despre corpul uman: aspectul său, sănătatea sau predispoziția la boală, abilități etc.

    O persoană percepe lumea din jurul său, adică. primește informații folosind simțurile. Pentru a naviga corect în lume, el își amintește informațiile primite, adică. stochează informații, o persoană ia decizii, de ex. procesează informații și, atunci când comunică cu alte persoane, transmite și primește informații. Omul trăiește într-o lume a informațiilor.

    Pentru orice operațiune asupra informațiilor (chiar și ceva atât de simplu ca salvarea), aceasta trebuie să fie cumva reprezentată (înregistrată, înregistrată). Acest proces are un nume special - codificarea informațiilor.

    REPREZENTAREA ȘI CODIFICAREA INFORMAȚIILOR.

    Istoria codificării informațiilor începe în epoca preistorică, când omul primitiv a sculptat în stâncă imagini ale obiectelor din lumea înconjurătoare cunoscute de el.

    Codificarea informațiilor este extrem de diversă. Instrucțiunile pentru șoferul mașinii sunt codificate sub formă de indicatoare rutiere. O piesă muzicală este codificată folosind semne de notație muzicală au fost create sisteme speciale de înregistrare pentru a înregistra jocurile de șah și formulele chimice. Orice utilizator de computer competent știe despre existența codificărilor de caractere. O hartă geografică codifică informații despre o zonă. Necesitatea codificării informații despre vorbire a apărut în legătură cu dezvoltarea rapidă a tehnologiei comunicațiilor, în special a comunicațiilor mobile. Oamenii au venit cu coduri speciale: Braille, cod Morse, cod steag. Există multe astfel de exemple care pot fi date.

    Se știe că putem exprima aceleași informații în moduri diferite.

    De exemplu, cum puteți raporta un pericol?

    • Dacă ești atacat, poți pur și simplu să strigi: „Pază!!” (Englezul va striga „Ajută-mă!”).
    • Dacă dispozitivul este sub tensiune înaltă, trebuie lăsat un semn de avertizare (imagine).
    • Într-o intersecție aglomerată, un controlor de trafic ajută la evitarea unui accident folosind gesturi.
    • În teatrul de pantomimă, toate informațiile sunt transmise privitorului exclusiv prin expresii faciale și gesturi.
    • Dacă nava ta se scufundă, atunci vei transmite semnalul „SOS” (... – – –...).
    • Pe lângă codul Morse, marina folosește și semnalizarea cu semafor și pavilion.

    Un set de caractere în care este determinată ordinea lor se numește alfabet.

    Există multe alfabete.

    • Alfabetul de litere chirilice (A, B, V, G, D, E, ...)
    • Alfabet litere latine(A, B, C, D, E, F, ...)
    • Alfabetul cu cifre zecimale (0, 1, 2, 3, 4, 5, 6, 7, 8, 9)
    • Alfabetul semnelor zodiacale (^, _, `, a, b, c, d, e, f, g, h, i), etc.

    Există, totuși, seturi de caractere pentru care nu există o ordine general acceptată:

    • Un set de caractere Braille (pentru nevăzători);
    • Un set de ideograme chinezești;
    • Set de semne de planetă;
    • Set de semne de cod genetic (A, C, G, T).

    In mod deosebit important au seturi formate din doar două caractere:

    • O pereche de semne (+, –);
    • Pereche de caractere „punct”, „liniuță” (., –)
    • O pereche de cifre (0, 1).
    • Câteva răspunsuri (da, nu).

    Astfel, codificarea informațiilor este procesul de formare a unei reprezentări specifice a informațiilor. Importanța codării a crescut în ultimele decenii datorită introducerii computerelor.

    Odată cu apariția computerelor, a apărut nevoia de a codifica toate tipurile de informații cu care se confruntă atât un individ, cât și umanitatea în ansamblu. Scrisul și aritmetica nu sunt altceva decât un sistem de codificare a vorbirii și a informațiilor numerice. Informațiile nu apar niciodată în formă pură, este întotdeauna cumva reprezentat, cumva codificat.

    Principalele atribute de codificare sunt:

    • Un cod este un set de caractere, aranjate în conformitate cu anumite reguli ale unei anumite limbi, pentru a transmite informații.
    • Un semn este un semn, un obiect care denotă ceva (litera, număr, gaură). Un semn împreună cu semnificația lui se numește simbol. Există multe clasificări ale semnelor (Anexa 1).
    • Limba este un sistem complex simboluri, fiecare dintre ele având o semnificație specifică. Simboluri lingvistice, fiind general acceptate și, prin urmare, general înțelese în interior a acestei comunități, în procesul vorbirii sunt combinate între ele, generând mesaje care sunt diverse în conținutul lor.

    Codul, semnele și limba vă permit să transmiteți informații într-o formă simbolică convenabilă pentru codificarea acesteia

    Un computer poate procesa doar informații prezentate sub formă numerică. Toate celelalte informații (de exemplu, sunete, imagini, citiri ale instrumentelor etc.) trebuie convertite în formă numerică pentru procesare pe un computer.

    APLICAREA PRACTICĂ A CODIFICAREA INFORMAȚIILOR.

    Stenografia scrie rapid folosind caractere speciale atât de scurte încât pot fi folosite pentru a înregistra vorbirea live. Stenografia a venit la noi din cele mai vechi timpuri. Chiar și în Egiptul antic, scriitorii cursivi au înregistrat discursul faraonilor. Stenografia a devenit larg răspândită în Grecia Antică. În 1883, în Acropole a fost găsită o lespede de marmură, pe care au fost sculptate caractere stenografice. Potrivit oamenilor de știință, aceste înregistrări au fost făcute în anul 350 î.Hr. Dar ziua de naștere general acceptată a stenografiei este 5 decembrie 63 î.Hr. Apoi, în Roma Antică a apărut necesitatea înregistrării textuale a vorbirii orale. Autorul stenografiei romane antice este considerat a fi Tiron, secretarul celebrului orator Cicero.

    ÎN lumea modernă, în ciuda abundenței mijloacelor de înregistrare mecanică a cuvintelor (reportatoare, reportofoare), posesia abilităților de stenografie este încă apreciată. Scriem în medie de cinci ori mai încet decât vorbim. Stenografia compensează acest decalaj. Este util mai ales pentru a lua notițe la prelegeri, a vorbi în public, a conversațiilor, a scrie rapoarte, a pregăti articole etc.

    Există multe cazuri în care stenografia a oferit o asistență neprețuită persoanelor de diferite profesii. (Anexa 2).

    Plan de numerotare telefonică.

    În Rusia, se utilizează numerotarea închisă din zece cifre. Aceasta înseamnă că orice complet număr de telefon cu prefix sau rețea mobilă trebuie să aibă 10 cifre. Acesta se numește Numărul Național de Telefon. Când apelați un telefon cu un alt cod de regiune decât cel „de acasă”, va trebui să formați suplimentar codul de acces la distanță lungă („8”).

    Informații personale.

    ÎN În ultima vreme Problema datelor cu caracter personal este foarte relevantă. Datele personale ale unei persoane sunt înregistrate în pașaportul său.

    Sub fotografia din pașaport, etichetele magnetice cu informații înregistrate sunt vizibile la lumină, care este citită doar electronic și este inaccesabilă proprietarului documentului. Semnând această coloană în pașaport (necompletat încă din motive tehnice), o persoană își dă acordul să i se atribuie un cod în loc de un nume, de ex. Numele este înlocuit cu un număr.

    Codurile de bare.

    Cu dezvoltarea tehnologia de informație, introducerea pe scară largă a fondurilor tehnologia calculatoarelorÎn multe domenii de activitate, problema introducerii rapide și fiabile a informațiilor devine din ce în ce mai presantă. Introducerea manuală a unui cod de produs necesită multă muncă manuală, timp și adesea duce la erori.

    În prezent, se lucrează mult în Rusia și în străinătate pentru a crea sisteme automate de procesare a datelor folosind documente care pot fi citite de mașină (MRD), una dintre soiurile cărora sunt documente cu coduri de bare. Documentele care pot fi citite de mașină includ documente de expediere, etichete și ambalaje ale mărfurilor, carnete de cecuri și carduri de plastic pentru plata serviciilor și suporturi magnetice. În acest sens, au apărut termenii „extrase electronice”, „bani electronici” etc.

    Cea mai promițătoare și care se dezvoltă rapid direcția în automatizarea procesului de introducere a informațiilor într-un computer este utilizarea codurilor de bare.

    Codul de bare este o alternanță de dungi întunecate și deschise de diferite lățimi. Structura unui cod de bare este prezentată pe diapozitiv.

    Potrivit experților, sistemele de coduri de bare promit și oferă o oportunitate de a rezolva una dintre cele mai dificile probleme ale computerului - introducerea datelor.

    În prezent, codurile de bare sunt utilizate pe scară largă nu numai în producția și comercializarea mărfurilor, ci și în multe sectoare industriale.

    Un cod de bare de produs este atribuit unui produs (produs) în etapa de lansare a acestuia în producție. Codurile de bare au primit o utilizare practică pe scară largă în aproape toate domeniile activității umane (Anexa 3) :

    • Codare de bare ajută la prepararea medicamentelor;
    • Sortare excelentă;
    • Codurile de bare aduc ordine în depozit;
    • Poți deveni un cod de bare!
    • Codurile de bare țin copiii în siguranță;
    • Supravegherea generală a vieții private;
    • Serviciu de garanție pentru controlul codurilor de bare;
    • Codurile de bare la aeroport evită confuzia;
    • Coduri de bare și produse perisabile;
    • Carduri de securitate;
    • Codurile de bare urmăresc prizonierii;
    • Ziare în viitor;
    • Codurile de bare vă ajută să găsiți pret favorabil;
    • Codurile de bare ca artă;
    • Codurile de bare nu vor permite trecerea „iepurilor de câmp”;
    • Codurile de bare prinde absente;
    • Procesul de prescripție;
    • Cod de bare și medicamente;
    • Coduri de bare și curse de Formula 1;
    • Telefon mobilîn loc de bilet la concert;
    • Codul de bare protejează copiii;
    • Criptarea diagnosticelor de boală pe certificatele de concediu medical?

    Emoticoane.

    Emoticoanele (din zâmbet - zâmbet) de pe Internet sunt pictograme formate din semne de punctuație, litere și cifre, care denotă un fel de emoție.

    Un emoticon este cel mai bun mod de a-ți transmite sentimentele și emoțiile în timpul comunicării virtuale! Micile fețe amuzante care sunt introduse în text elimină nevoia de a scrie despre experiențele tale. Se crede că un emoticon este pentru internet ceea ce este o roată pentru umanitate. Este imposibil să faci fără ea în orice formă de comunicare virtuală. Este extrem de usor de folosit, informativ si, cu toata simplitatea ei, ofera un spatiu larg imaginatiei. Nu este de mirare că a fost adoptat prin comunicare prin SMS, publicitate, design, poștă obișnuită și la schimbul de note în clasă.

    Emoticoanele au devenit atât de ferm stabilite în viața noastră încât au migrat din spațiu virtual in stiinta. Deci, în psihologie, emoticoanele sunt folosite pentru a indica tipuri de temperamente sau pentru a urmări starea de spirit a unei persoane.

    CONCLUZIE.

    Știm cât de mari sunt capabilitățile computerelor și gama largă de aplicații ale acestora astăzi și putem doar ghici ce probleme vor putea rezolva în viitorul apropiat. Prin urmare, problema cunoașterii și înțelegerii modului în care informațiile sunt reprezentate într-un computer este deosebit de acută. Este necesar ca oamenii (nu numai programatorii profesioniști, ci și utilizatorii obișnuiți) să înțeleagă codificarea informațiilor și moduri posibile codificarea diferitelor tipuri de informații.

    Multe coduri au devenit foarte ferm înrădăcinate în viața noastră. Dacă sunteți interesat de problema codificării informațiilor, atunci puteți citi o serie de lucrări de ficțiune care ating problemele de codificare și decodificare a informațiilor.

    • Arthur Conan Doyle „The Dancing Men”;
    • Edgar Poe „The Gold Bug”;
    • Jules Verne „Călătorie în centrul Pământului”;
    • Valentin Kaverin „Împlinirea dorințelor”;
    • Dan Brown „Codul lui Da Vinci”;
    • David Kahn „Derupătorii de coduri”.

    Pentru claritatea prezentării materialului, diapozitivele de prezentare din

    Cuprins

    I. Istoricul codificării informațiilor………………………………………..3

    II. Codificarea informațiilor……………………………………………………4

    III. Codificarea informațiilor de tip text………………………….4

    IV. Tipuri de tabele de codificare………………………………………………………….6

    V. Calculul cantității de informații text………………………14

    Lista referințelor………………………………………..16

    eu. Istoricul codificării informațiilor

    Omenirea folosește criptarea textului (codificarea) chiar din momentul în care au apărut primele informații secrete. Iată câteva tehnici de codare a textului care au fost inventate în diverse etape dezvoltarea gândirii umane:

      criptografia este scriere secretă, un sistem de schimbare a scrisului pentru a face textul de neînțeles pentru cei neinițiați;

      Cod Morse sau cod telegrafic neuniform, în care fiecare literă sau semn este reprezentat de propria sa combinație de rafale elementare scurte de curent electric (puncte) și rafale elementare de durată triplă (liniuță);

    Una dintre cele mai vechi metode de criptare cunoscute este numită după împăratul roman Iulius Cezar (secolul I î.Hr.). Această metodă se bazează pe înlocuirea fiecărei litere a textului criptat cu alta, prin deplasarea alfabetului de la litera originală cu un număr fix de caractere, iar alfabetul se citește în cerc, adică după litera i se consideră a . Deci, cuvântul „octet”, atunci când este deplasat cu două caractere la dreapta, este codificat ca cuvântul „gwlf”. Procesul invers de descifrare a unui anumit cuvânt este necesar pentru a înlocui fiecare literă criptată cu a doua din stânga acesteia.

    II.Codificarea informațiilor

    Un cod este un set de convenții (sau semnale) pentru înregistrarea (sau comunicarea) unor concepte predefinite.

    Codarea informațiilor este procesul de formare a unei reprezentări specifice a informațiilor. Într-un sens mai restrâns, termenul „codificare” este adesea înțeles ca o tranziție de la o formă de reprezentare a informațiilor la alta, mai convenabilă pentru stocare, transmitere sau procesare.

    De obicei, fiecare imagine la codificare (uneori numită criptare) este reprezentată printr-un semn separat.

    Un semn este un element al unei mulțimi finite prieten grozav unul din celelalte elemente.

    Într-un sens mai restrâns, termenul „codificare” este adesea înțeles ca o tranziție de la o formă de reprezentare a informațiilor la alta, mai convenabilă pentru stocare, transmitere sau procesare.

    Puteți procesa informații text pe un computer. Când este introdusă într-un computer, fiecare literă este codificată cu un anumit număr, iar atunci când este transmisă către dispozitive externe (ecran sau imprimare), imaginile literelor sunt construite din aceste numere pentru percepția umană. Corespondența dintre un set de litere și numere se numește codificare de caractere.

    De regulă, toate numerele dintr-un computer sunt reprezentate folosind zerouri și unu (nu zece cifre, așa cum este de obicei pentru oameni). Cu alte cuvinte, computerele funcționează de obicei în sistem binar notație, deoarece în acest caz dispozitivele pentru procesarea lor sunt mult mai simple. Introducerea numerelor într-un computer și scoaterea lor pentru citire umană se poate face în forma zecimală obișnuită, iar toate conversiile necesare sunt efectuate de programe care rulează pe computer.

    III.Codificarea informațiilor text

    Aceeași informații pot fi prezentate (codificate) sub mai multe forme. Odată cu apariția computerelor, a apărut nevoia de a codifica toate tipurile de informații cu care se confruntă atât un individ, cât și umanitatea în ansamblu. Dar omenirea a început să rezolve problema codificării informațiilor cu mult înainte de apariția computerelor. Realizările grandioase ale omenirii - scrisul și aritmetica - nu sunt altceva decât un sistem de codificare a vorbirii și a informațiilor numerice. Informația nu apare niciodată în forma ei pură, este întotdeauna prezentată cumva, codificată cumva.

    Codarea binară este una dintre modalitățile comune de reprezentare a informațiilor. În calculatoare, roboți și mașini controlate numeric, de regulă, toate informațiile cu care se ocupă dispozitivul sunt codificate sub formă de cuvinte din alfabetul binar.

    De la sfârșitul anilor 60, computerele au fost din ce în ce mai folosite pentru a procesa informații text, iar în prezent majoritatea computerelor personale din lume (și de cele mai multe ori) sunt ocupate cu procesarea informațiilor text. Toate aceste tipuri de informații dintr-un computer sunt prezentate în cod binar, adică se folosește un alfabet cu puterea doi (doar două caractere 0 și 1). Acest lucru se datorează faptului că este convenabil să se reprezinte informația sub forma unei secvențe de impulsuri electrice: nu există impuls (0), există un impuls (1).

    O astfel de codificare este de obicei numită binară, iar secvențele logice de zerouri și unități în sine sunt numite limbaj mașină.

    Din punct de vedere informatic, textul este format din caractere individuale. Simbolurile includ nu numai litere (majuscule sau mici, latină sau rusă), ci și numere, semne de punctuație, caractere speciale precum „=", „(”, „&”, etc. și chiar (vă rugăm să rețineți Atentie speciala!) spații între cuvinte.

    Textele sunt introduse în memoria computerului folosind tastatura. Literele, cifrele, semnele de punctuație și alte simboluri cu care suntem familiarizați sunt scrise pe taste. Ei introduc RAM în cod binar. Aceasta înseamnă că fiecare caracter este reprezentat ca un cod binar de 8 biți.

    T În mod tradițional, pentru a codifica un caracter, se utilizează o cantitate de informații egală cu 1 octet, adică I = 1 octet = 8 biți. Folosind o formulă care conectează numărul de evenimente posibile K și cantitatea de informații I, puteți calcula câte simboluri diferite pot fi codificate (presupunând că simbolurile sunt evenimente posibile): K = 2 I = 2 8 = 256, adică pentru To reprezintă informații text, puteți utiliza un alfabet cu o capacitate de 256 de caractere.

    Acest număr de caractere este suficient pentru a reprezenta informații text, inclusiv litere mari și mici ale alfabetului rus și latin, numere, semne, simboluri grafice etc.

    Codarea constă în atribuirea fiecărui caracter unic cod zecimal de la 0 la 255 sau codul binar corespunzător de la 00000000 la 11111111. Astfel, o persoană distinge caracterele după conturul lor, iar un computer după codul lor.

    Comoditatea codificării caracterelor octet cu octet este evidentă deoarece un octet este cea mai mică parte adresabilă a memoriei și, prin urmare, procesorul poate accesa fiecare caracter separat atunci când procesează text. Pe de altă parte, 256 de caractere reprezintă un număr destul de suficient pentru a reprezenta o mare varietate de informații simbolice.

    În procesul de afișare a unui simbol pe ecranul unui computer, se efectuează procesul invers - decodificare, adică conversia codului simbolului în imaginea sa. Este important ca atribuirea unui simbol cod specific este o chestiune de acord, care este înregistrată în tabelul de coduri.

    Acum se pune întrebarea, ce cod binar de opt biți să aloce fiecărui caracter. Este clar că aceasta este o chestiune condiționată, puteți găsi multe metode de codare.

    Toate caracterele alfabetului computerului sunt numerotate de la 0 la 255. Fiecare număr corespunde unui cod binar de opt biți de la 00000000 la 11111111. Acest cod este pur și simplu numărul de serie al caracterului din sistemul de numere binar.

    IV. Tipuri de tabele de codificare

    Un tabel în care tuturor caracterelor alfabetului computerului li se atribuie numere de serie se numește tabel de codificare.

    Pentru tipuri diferite Calculatoarele folosesc tabele de codificare diferite.

    Tabelul de coduri ASCII (American Standard Code) a fost adoptat ca standard internațional. pentru informații Interchange - American Standard Code for Information Interchange), codificarea primei jumătăți a caracterelor cu coduri numerice de la 0 la 127 (codurile de la 0 la 32 sunt atribuite nu caracterelor, ci tastelor funcționale).

    Tabelul de coduri ASCII este împărțit în două părți.

    Doar prima jumătate a tabelului este standardul internațional, adică. caractere cu numere de la 0 (00000000), la 127 (01111111).

    Structura tabelului de codificare ASCII

    Număr de serie

    Simbol

    00000000 - 00011111

    Simbolurile cu numere de la 0 la 31 sunt de obicei numite simboluri de control.

    Funcția lor este de a controla procesul de afișare a textului pe ecran sau de imprimare, alimentare semnal sonor, marcarea textului etc.

    0100000 - 01111111

    Parte standard a tabelului (engleză). Aceasta include litere mici și mari ale alfabetului latin, cifre zecimale, semne de punctuație, tot felul de paranteze, simboluri comerciale și alte simboluri.

    Caracterul 32 este un spațiu, adică. poziție goală în text.

    Toate celelalte sunt reflectate de anumite semne.

    10000000 - 11111111

    Parte alternativă a tabelului (rusă).

    A doua jumătate a tabelului de coduri ASCII, numită pagina de coduri (128 de coduri, începând de la 10000000 și terminând cu 11111111), poate avea opțiuni diferite, fiecare opțiune având propriul număr.

    Pagina de coduri este folosită în primul rând pentru a găzdui alfabetele naționale, altele decât latină. În codificările naționale rusești, caracterele din alfabetul rus sunt plasate în această parte a tabelului.


    Prima jumătate a tabelului de coduri ASCII

    Vă rugăm să rețineți că în tabelul de codificare, literele (majuscule și mici) sunt aranjate în ordine alfabetică, iar numerele sunt ordonate crescător. Această respectare a ordinii lexicografice în aranjarea caracterelor se numește principiul codificării secvențiale a alfabetului.

    Pentru literele alfabetului rus, se respectă și principiul codificării secvențiale.

    A doua jumătate a tabelului de coduri ASCII

    Din păcate, în prezent există cinci codificări chirilice diferite (KOI8-R, Windows. MS-DOS, Macintosh și ISO). Din această cauză, apar adesea probleme cu transferul textului rusesc de la un computer la altul, de la un sistem software la altul.

    Cronologic, unul dintre primele standarde pentru codificarea literelor rusești pe computere a fost KOI8 („Cod de schimb de informații, 8 biți”). Această codificare a fost folosită încă din anii 70 pe computerele din seria de calculatoare ES, iar de la mijlocul anilor 80 a început să fie folosită în primele versiuni rusificate ale sistemului de operare UNIX.

    De la începutul anilor 90, vremea dominației sistemului de operare MS DOS, codificarea CP866 rămâne („CP” înseamnă „Pagină de coduri”, „pagină de coduri”).

    Calculatoare Măr, care rulează sistemul de operare Mac OS, utilizează propria lor codificare Mac.

    În plus, Organizația Internațională de Standardizare (ISO) a aprobat o altă codificare numită ISO 8859-5 ca standard pentru limba rusă.

    Cea mai comună codificare utilizată în prezent este Microsoft Windows, prescurtat CP1251. Introdus de Microsoft; Luând în considerare distribuția largă a sistemelor de operare (OS) și a altor produse software ale acestei companii în Federația Rusă, a găsit o distribuție largă.

    De la sfârșitul anilor 90, problema standardizării codificării caracterelor a fost rezolvată prin introducerea unui nou standard internațional numit Unicode.

    Aceasta este o codificare pe 16 biți, adică alocă 2 octeți de memorie pentru fiecare caracter. Desigur, acest lucru crește de 2 ori cantitatea de memorie ocupată. Dar un astfel de tabel de coduri permite includerea a până la 65536 de caractere. Specificația completă a standardului Unicode include toate alfabetele existente, dispărute și create artificial din lume, precum și multe simboluri matematice, muzicale, chimice și alte simboluri.

    Reprezentarea internă a cuvintelor în memoria computerului

    folosind un tabel ASCII

    Uneori se întâmplă ca un text format din litere ale alfabetului rus primit de la alt computer să nu poată fi citit - un fel de „abracadabra” este vizibil pe ecranul monitorului. Acest lucru se întâmplă deoarece computerele folosesc diferite codificări de caractere pentru limba rusă.


    Astfel, fiecare codificare este specificată de propria sa tabelă de coduri. După cum se poate vedea din tabel, caractere diferite sunt atribuite aceluiași cod binar în codificări diferite.

    N De exemplu, secvența de coduri numerice 221, 194, 204 din codificarea CP1251 formează cuvântul „calculator”, în timp ce în alte codificări va fi un set de caractere fără sens.

    Din fericire, în cele mai multe cazuri, utilizatorul nu trebuie să-și facă griji cu privire la transcodarea documentelor text, deoarece aceasta se face prin programe speciale de conversie încorporate în aplicații.

    V. Calculul cantității de informații text

    Sarcina 1: Codificați cuvântul „Roma” folosind tabelele de codificare KOI8-R și CP1251.

    Soluţie:

    Sarcina 2: Presupunând că fiecare caracter este codificat într-un octet, estimați volumul de informații al următoarei propoziții:

    „Unchiul meu are cele mai oneste reguli,

    Când m-am îmbolnăvit grav,

    S-a obligat să respecte

    Și nu m-am putut gândi la ceva mai bun.”

    Soluţie: Această expresie are 108 caractere, inclusiv semne de punctuație, ghilimele și spații. Înmulțim acest număr cu 8 biți. Obținem 108*8=864 biți.

    Sarcina 3: Cele două texte conțin același număr de caractere. Primul text este scris în rusă, iar al doilea în limba tribului Naguri, al cărui alfabet este format din 16 caractere. Al cărui text poartă cantitate mare informație?

    Soluţie:

    1) I = K * a (volumul de informații al textului este egal cu produsul dintre numărul de caractere și greutatea informațională a unui caracter).

    2) Pentru că Ambele texte au același număr de caractere (K), apoi diferența depinde de conținutul informațional al unui caracter al alfabetului (a).

    3) 2 a1 = 32, i.e. a 1 = 5 biți, 2 a2 = 16, adică și 2 = 4 biți.

    4) I 1 = K * 5 biți, I 2 = K * 4 biți.

    5) Aceasta înseamnă că textul scris în limba rusă conține de 5/4 ori mai multe informații.

    Sarcina 4: Dimensiunea mesajului, care conține 2048 de caractere, a fost de 1/512 dintr-un MB. Determinați puterea alfabetului.

    Soluţie:

    1) I = 1/512 * 1024 * 1024 * 8 = 16384 biți - a convertit volumul de informații al mesajului în biți.

    2) a = I / K = 16384 /1024 = 16 biți - reprezintă un caracter al alfabetului.

    3) 2*16*2048 = 65536 caractere – puterea alfabetului folosit.

    Sarcina 5: Imprimanta laser Canon LBP imprimă la o viteză medie de 6,3 Kbps. Cât timp va dura să tipăriți un document de 8 pagini, dacă știți că o pagină are în medie 45 de linii și 70 de caractere pe linie (1 caracter - 1 octet)?

    Soluţie:

    1) Găsiți cantitatea de informații conținute pe 1 pagină: 45 * 70 * 8 biți = 25200 biți

    2) Găsiți cantitatea de informații pe 8 pagini: 25200 * 8 = 201600 biți

    3) Reducem la unități de măsură comune. Pentru a face acest lucru, convertim Mbiți în biți: 6,3*1024=6451,2 biți/sec.

    4) Găsiți timpul de imprimare: 201600: 6451.2 =31 secunde.

    Bibliografie

      Ageev V.M. Teoria informației și codării: eșantionarea și codificarea informațiilor de măsurare. - M.: MAI, 1977.

      Kuzmin I.V., Kedrus V.A. Fundamentele teoriei și codificării informației. - Kiev, școala Vishcha, 1986.

      Cele mai simple metode de criptare a textului / D.M. Zlatopolsky. – M.: Chistye Prudy, 2007 – 32 p.

      Ugrinovich N.D. Informatica si tehnologia de informație. Manual pentru clasele 10-11 / N.D. Ugrinovich. – M.: BINOM. Laboratorul de cunoștințe, 2003. – 512 p.

      http://school497.spb.edu.ru/uchint002/les10/les.html#n

    Una dintre cele mai probleme comune cu care se confruntă un începător Webmaster(și nu doar începători), asta probleme cu codarea pe site. Chiar și pentru mine apare constant când creez site-uri web " abracadabra„Dar, din fericire, știu perfect cum să rezolv această problemă, așa că pun totul în ordine în câteva secunde. Și în acest articol voi încerca să te învăț la fel de repede rezolva probleme legate de codificare pe site.

    Primul lucru care merită remarcat este că toate problemele cu apariția „abracadabra” sunt asociate cu o nepotrivire între codificarea documentului și codificarea setată de browser. Să spunem un document în Windows-1251, dar din anumite motive browserul se afișează UTF-8. Și sursa unei astfel de discrepanțe pot fi următoarele motive.

    Primul motiv

    Metaeticheta este scrisă incorect tipul de conținut. Fii atent, ar trebui să conțină întotdeauna codificarea în care este scris documentul tău.

    Al doilea motiv

    Se pare că metaeticheta este scrisă așa cum doriți, iar browserul afișează exact ceea ce doriți, dar din anumite motive există încă probleme cu codificarea. Vinovatul aici este aproape sigur că documentul în sine are o codificare diferită. Dacă lucrezi în Notepad++, apoi în dreapta jos există numele codificării documentului curent (de exemplu, ANSI). Dacă puneți o metaetichetă UTF-8, iar documentul în sine este scris ANSI, apoi faceți conversia în UTF-8(prin meniu " Codificări"și punct" Convertiți în UTF-8 fără BOM").

    Al treilea motiv

    Al patrulea motiv

    Și, în sfârșit, ultimul motiv popular este problemă cu codificarea în baza de date. Mai întâi, asigurați-vă că toate tabelele și câmpurile sunt scrise în aceeași codificare, care se potrivește cu codificarea restului site-ului. Dacă acest lucru nu ajută, imediat după conectarea în script, executați următoarea solicitare:

    SETĂ NUMELE „utf8”

    În loc de " utf8" poate exista o codificare diferită. După aceea, toate datele din baza de date ar trebui să apară în codificarea corectă.

    În acest articol, sper că am explicat, cel puțin, 90% dintre problemele asociate cu apariția de „faracie” pe site. Acum trebuie să te confrunți cu o problemă atât de populară și simplă ca codificare incorectă, imediat.