Codurile Ascii pentru literele latine. Codificarea informațiilor text
Dec | Hex | Simbol | Dec | Hex | Simbol | |
000 | 00 | specialist. NOP | 128 | 80 | Ђ | |
001 | 01 | specialist. DECI H | 129 | 81 | Ѓ | |
002 | 02 | specialist. STX | 130 | 82 | ‚ | |
003 | 03 | specialist. ETX | 131 | 83 | ѓ | |
004 | 04 | specialist. EOT | 132 | 84 | „ | |
005 | 05 | specialist. ENQ | 133 | 85 | … | |
006 | 06 | specialist. ACK | 134 | 86 | † | |
007 | 07 | specialist. BEL | 135 | 87 | ‡ | |
008 | 08 | specialist. B.S. | 136 | 88 | € | |
009 | 09 | specialist. TAB | 137 | 89 | ‰ | |
010 | 0A | specialist. LF | 138 | 8A | Љ | |
011 | 0B | specialist. VT | 139 | 8B | ‹ ‹ | |
012 | 0C | specialist. FF | 140 | 8C | Њ | |
013 | 0D | specialist. CR | 141 | 8 D | Ќ | |
014 | 0E | specialist. ASA DE | 142 | 8E | Ћ | |
015 | 0F | specialist. SI. | 143 | 8F | Џ | |
016 | 10 | specialist. DLE | 144 | 90 | ђ | |
017 | 11 | specialist. DC1 | 145 | 91 | ‘ | |
018 | 12 | specialist. DC2 | 146 | 92 | ’ | |
019 | 13 | specialist. DC3 | 147 | 93 | “ | |
020 | 14 | specialist. DC4 | 148 | 94 | ” | |
021 | 15 | specialist. N.A.K. | 149 | 95 | ||
022 | 16 | specialist. SYN | 150 | 96 | – | |
023 | 17 | specialist. ETB | 151 | 97 | — | |
024 | 18 | specialist. POATE SA | 152 | 98 | ||
025 | 19 | specialist. E.M. | 153 | 99 | ™ | |
026 | 1A | specialist. SUB | 154 | 9A | љ | |
027 | 1B | specialist. ESC | 155 | 9B | › | |
028 | 1C | specialist. FS | 156 | 9C | њ | |
029 | 1D | specialist. G.S. | 157 | 9D | ќ | |
030 | 1E | specialist. R.S. | 158 | 9E | ћ | |
031 | 1F | specialist. NE | 159 | 9F | џ | |
032 | 20 | ambreiaj SP (Spațiu) | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | " | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | " | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Eu | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | A.A. | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | A.C. | ¬ | |
045 | 2D | - | 173 | ANUNȚ | | |
046 | 2E | . | 174 | A.E. | ® | |
047 | 2F | / | 175 | A.F. | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | e | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | : | 186 | B.A. | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | B.C. | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | FI | ѕ | |
063 | 3F | ? | 191 | B.F. | ї | |
064 | 40 | @ | 192 | C0 | A | |
065 | 41 | A | 193 | C1 | B | |
066 | 42 | B | 194 | C2 | ÎN | |
067 | 43 | C | 195 | C3 | G | |
068 | 44 | D | 196 | C4 | D | |
069 | 45 | E | 197 | C5 | E | |
070 | 46 | F | 198 | C6 | ȘI | |
071 | 47 | G | 199 | C7 | Z | |
072 | 48 | H | 200 | C8 | ȘI | |
073 | 49 | eu | 201 | C9 | Y | |
074 | 4A | J | 202 | C.A. | LA | |
075 | 4B | K | 203 | C.B. | L | |
076 | 4C | L | 204 | CC | M | |
077 | 4D | M | 205 | CD | N | |
078 | 4E | N | 206 | C.E. | DESPRE | |
079 | 4F | O | 207 | CF | P | |
080 | 50 | P | 208 | D0 | R | |
081 | 51 | Q | 209 | D1 | CU | |
082 | 52 | R | 210 | D2 | T | |
083 | 53 | S | 211 | D3 | U | |
084 | 54 | T | 212 | D4 | F | |
085 | 55 | U | 213 | D5 | X | |
086 | 56 | V | 214 | D6 | C | |
087 | 57 | W | 215 | D7 | H | |
088 | 58 | X | 216 | D8 | SH | |
089 | 59 | Y | 217 | D9 | SCH | |
090 | 5A | Z | 218 | D.A. | Kommersant | |
091 | 5B | [ | 219 | D.B. | Y | |
092 | 5C | \ | 220 | DC | b | |
093 | 5D | ] | 221 | DD | E | |
094 | 5E | ^ | 222 | DE | YU | |
095 | 5F | _ | 223 | DF | eu | |
096 | 60 | ` | 224 | E0 | A | |
097 | 61 | A | 225 | E1 | b | |
098 | 62 | b | 226 | E2 | V | |
099 | 63 | c | 227 | E3 | G | |
100 | 64 | d | 228 | E4 | d | |
101 | 65 | e | 229 | E5 | e | |
102 | 66 | f | 230 | E6 | și | |
103 | 67 | g | 231 | E7 | h | |
104 | 68 | h | 232 | E8 | Și | |
105 | 69 | i | 233 | E9 | th | |
106 | 6A | j | 234 | E.A. | La | |
107 | 6B | k | 235 | E.B. | l | |
108 | 6C | l | 236 | E.C. | m | |
109 | 6D | m | 237 | ED | n | |
110 | 6E | n | 238 | E.E. | O | |
111 | 6F | o | 239 | EF | P | |
112 | 70 | p | 240 | F0 | R | |
113 | 71 | q | 241 | F1 | Cu | |
114 | 72 | r | 242 | F2 | T | |
115 | 73 | s | 243 | F3 | la | |
116 | 74 | t | 244 | F4 | f | |
117 | 75 | u | 245 | F5 | X | |
118 | 76 | v | 246 | F6 | ts | |
119 | 77 | w | 247 | F7 | h | |
120 | 78 | X | 248 | F8 | w | |
121 | 79 | y | 249 | F9 | sch | |
122 | 7A | z | 250 | FA. | ъ | |
123 | 7B | { | 251 | FB | s | |
124 | 7C | | | 252 | F.C. | b | |
125 | 7D | } | 253 | FD | uh | |
126 | 7E | ~ | 254 | F.E. | Yu | |
127 | 7F | Specialist. DEL | 255 | FF | eu |
Tabel de coduri de caractere ASCII Windows.
Descrierea caracterelor speciale (de control).
Trebuie remarcat faptul că caracterele de control ale tabelului ASCII au fost utilizate inițial pentru a asigura schimbul de date prin telemașină, introducerea datelor de pe bandă perforată și pentru controlul simplu al dispozitivelor externe. În prezent, majoritatea caracterelor de control ale tabelelor ASCII nu mai poartă această încărcare și pot fi folosite în alte scopuri.
Cod | Descriere |
---|---|
NUL, 00 | Nul, gol |
SOH, 01 | Începutul titlului |
STX, 02 | Începutul textului, începutul textului. |
ETX, 03 | Sfârșitul textului, sfârșitul textului |
EOT, 04 | Sfârșitul transmisiei |
ENQ, 05 | Întreba. Vă rugăm să confirmați |
ACK, 06 | Confirmare. confirm |
BEL, 07 | Bell, sună |
BS, 08 | Backspace, întoarceți un caracter înapoi |
TAB, 09 | Filă, filă orizontală |
LF, 0A | Line Feed, line feed. În prezent, în majoritatea limbajelor de programare este notat ca \n |
VT, 0B | Filă verticală, tabulare verticală. |
FF, 0C | Feed de formulare, feed de pagini, pagină nouă |
CR, 0D | Întoarcere cu cărucior, întoarcere cu cărucior. În prezent, în majoritatea limbajelor de programare este notat cu \r |
deci,0E | Shift Out, schimbați culoarea benzii de cerneală din dispozitivul de imprimare |
SI,0F | Schimbați, întoarceți înapoi culoarea benzii de cerneală din dispozitivul de imprimare |
DLE, 10 | Data Link Escape, comutarea canalului la transmisia de date |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Controlul dispozitivului, simboluri de control al dispozitivului |
NAK, 15 | Confirmare negativă, nu confirm. |
SYN, 16 | Sincronizare. Simbol de sincronizare |
ETB, 17 | Sfârșitul blocului de text, sfârșitul blocului de text |
CAN, 18 | Anulare, anulare transferate anterior |
EM, 19 | Sfârșitul Mediului |
SUB, 1A | Înlocuitor, înlocuitor. Plasat în locul unui simbol al cărui sens a fost pierdut sau corupt în timpul transmiterii |
ESC, 1B | Secvență de control de evacuare |
FS, 1C | Separator de fișiere, separator de fișiere |
GS, 1D | Separator de grup |
RS, 1E | Separator de înregistrări, separator de înregistrări |
SUA, 1F | Separator de unități |
DEL, 7F | Ștergeți, ștergeți ultimul caracter. |
Un computer înțelege procesul de conversie a acestuia într-o formă care permite transmiterea, stocarea sau procesarea automată mai convenabilă a acestor date. În acest scop sunt folosite diverse tabele. ASCII a fost primul sistem dezvoltat în Statele Unite pentru a lucra cu text în limba engleză, care a devenit ulterior răspândit în întreaga lume. Articolul de mai jos este dedicat descrierii, caracteristicilor, proprietăților și utilizării ulterioare.
Afișarea și stocarea informațiilor într-un computer
Simbolurile de pe un monitor de computer sau de unul sau altul gadget digital mobil sunt formate pe baza unor seturi de forme vectoriale de diferite caractere și a unui cod care vă permite să găsiți printre ele simbolul care trebuie introdus la locul potrivit. Reprezintă o secvență de biți. Astfel, fiecare caracter trebuie să corespundă în mod unic unui set de zerouri și unu, care apar într-o anumită ordine unică.
Cum a început totul
Din punct de vedere istoric, primele computere erau de limba engleză. Pentru a codifica informațiile simbolice în ele, a fost suficient să folosiți doar 7 biți de memorie, în timp ce 1 octet format din 8 biți a fost alocat în acest scop. Numărul de caractere înțeles de computer în acest caz a fost de 128. Aceste caractere includ alfabetul englez cu semnele de punctuație, numerele și unele caractere speciale. Codificarea pe șapte biți în limba engleză cu tabelul corespunzătoare (pagina de cod), dezvoltată în 1963, a fost numită Codul standard american pentru schimbul de informații. De obicei, abrevierea „codificare ASCII” a fost și este încă folosită pentru a o desemna.
Trecerea la multilingvism
De-a lungul timpului, computerele au devenit utilizate pe scară largă în țările care nu vorbesc engleza. În acest sens, a fost nevoie de codificări care să permită utilizarea limbilor naționale. S-a decis să nu se reinventeze roata și să se ia ca bază ASCII. Tabelul de codificare din noua ediție s-a extins semnificativ. Utilizarea celui de-al 8-lea bit a făcut posibilă traducerea a 256 de caractere într-un limbaj de calculator.
Descriere
Codificarea ASCII are un tabel care este împărțit în 2 părți. Doar prima jumătate a acestuia este considerată a fi un standard internațional general acceptat. Include:
- Caractere cu numere de serie de la 0 la 31, codificate în secvențe de la 00000000 la 00011111. Sunt rezervate caracterelor de control care controlează procesul de afișare a textului pe ecran sau imprimantă, emiterea unui semnal sonor etc.
- Caracterele cu NN în tabel de la 32 la 127, codificate prin secvențe de la 00100000 la 01111111 formează partea standard a tabelului. Acestea includ un spațiu (N 32), litere ale alfabetului latin (minuscule și majuscule), numere din zece cifre de la 0 la 9, semne de punctuație, paranteze de diferite stiluri și alte simboluri.
- Caractere cu numere de serie de la 128 la 255, codificate prin secvențe de la 10000000 la 11111111. Acestea includ litere ale alfabetului național, altele decât cele latine. Această parte alternativă a tabelului ASCII este folosită pentru a converti caracterele rusești în formă de computer.
Unele proprietăți
Caracteristicile codificării ASCII includ diferența dintre literele „A” - „Z” ale literelor mici și mari de doar un bit. Această circumstanță simplifică foarte mult conversia registrului, precum și verificarea dacă aceasta aparține unui anumit interval de valori. În plus, toate literele din sistemul de codificare ASCII sunt reprezentate de propriile numere de succesiune în alfabet, care sunt scrise cu 5 cifre în sistemul de numere binar, precedate de 011 2 pentru literele mici și 010 2 pentru literele mari.
Una dintre caracteristicile codificării ASCII este reprezentarea a 10 cifre - „0” - „9”. În al doilea sistem numeric ele încep cu 00112 și se termină cu 2 valori numerice. Astfel, 0101 2 este echivalent cu numărul zecimal cinci, astfel încât caracterul „5” este scris ca 0011 01012. Pe baza celor de mai sus, puteți converti cu ușurință numerele BCD într-un șir ASCII adăugând secvența de biți 00112 la fiecare ciugulit de pe stânga.
„Unicode”
După cum știți, sunt necesare mii de caractere pentru a afișa texte în limbile grupului din Asia de Sud-Est. Un astfel de număr dintre ele nu poate fi descris în niciun fel într-un octet de informații, astfel încât nici măcar versiunile extinse de ASCII nu ar mai putea satisface nevoile crescute ale utilizatorilor din diferite țări.
Astfel, a apărut necesitatea creării unei codări universale a textului, a cărei dezvoltare, în colaborare cu mulți lideri ai industriei IT globale, a fost întreprinsă de consorțiul Unicode. Specialiștii săi au creat sistemul UTF 32 în acesta, 32 de biți au fost alocați pentru a codifica 1 caracter, constituind 4 octeți de informații. Principalul dezavantaj a fost o creștere bruscă a cantității de memorie necesară de până la 4 ori, ceea ce a implicat multe probleme.
În același timp, pentru majoritatea țărilor cu limbi oficiale aparținând grupului indo-european, numărul de caractere egal cu 232 este mai mult decât excesiv.
Ca urmare a lucrărilor ulterioare ale specialiștilor din consorțiul Unicode, a apărut codificarea UTF-16. A devenit opțiunea de conversie a informațiilor simbolice care se potrivea tuturor atât în ceea ce privește cantitatea de memorie necesară, cât și numărul de caractere codificate. De aceea, UTF-16 a fost adoptat implicit și necesită rezervarea a 2 octeți pentru un caracter.
Chiar și această versiune de Unicode destul de avansată și de succes a avut unele dezavantaje, iar după trecerea de la versiunea extinsă a ASCII la UTF-16, greutatea documentului s-a dublat.
În acest sens, s-a decis să se utilizeze codificarea cu lungime variabilă UTF-8. În acest caz, fiecare caracter al textului sursă este codificat ca o secvență de lungime de la 1 la 6 octeți.
Contactați codul standard american pentru schimbul de informații
Toate caracterele latine cu lungime variabilă UTF-8 sunt codificate în 1 octet, ca în sistemul de codificare ASCII.
O caracteristică specială a YTF-8 este că, în cazul textului în latină fără a utiliza alte caractere, chiar și programele care nu înțeleg Unicode vor putea să-l citească. Cu alte cuvinte, codarea de bază a textului ASCII devine pur și simplu parte a noului UTF cu lungime variabilă. Caracterele chirilice din YTF-8 ocupă 2 octeți și, de exemplu, caracterele georgiane - 3 octeți. Prin crearea UTF-16 și 8, principala problemă a creării unui singur spațiu de cod în fonturi a fost rezolvată. De atunci, producătorii de fonturi pot completa tabelul doar cu forme vectoriale de caractere text în funcție de nevoile lor.
Sistemele de operare diferite preferă codificări diferite. Pentru a putea citi și edita textele tastate într-o codificare diferită, se folosesc programe de conversie a textului rusesc. Unele editoare de text conțin transcoduri încorporate și vă permit să citiți text indiferent de codificare.
Acum știți câte caractere sunt în codificarea ASCII și cum și de ce a fost dezvoltată. Desigur, astăzi standardul Unicode este cel mai răspândit în lume. Totuși, nu trebuie să uităm că se bazează pe ASCII, așa că trebuie apreciată contribuția dezvoltatorilor săi în domeniul IT.
Pentru a utiliza corect ASCII, este necesar să vă extindeți cunoștințele în acest domeniu și despre capabilitățile de codare.
Ce este?
ASCII este un tabel de codificare de caractere tipărite (vezi captura de ecran nr. 1) tastate pe tastatura unui computer pentru a transmite informații și unele coduri. Cu alte cuvinte, alfabetul și cifrele zecimale sunt codificate în simboluri corespunzătoare care reprezintă și poartă informațiile necesare.
ASCII a fost dezvoltat în America, astfel încât setul de caractere standard include de obicei alfabetul englezesc cu numere, pentru un total de aproximativ 128 de caractere. Dar atunci apare o întrebare corectă: ce să faceți dacă este necesară codificarea alfabetului național?
Alte versiuni ale tabelului ASCII au fost dezvoltate pentru a aborda probleme similare. De exemplu, pentru limbile cu o structură de limbă străină, literele alfabetului englez au fost fie eliminate, fie li s-au adăugat caractere suplimentare sub forma unui alfabet național. Astfel, codificarea ASCII poate conține litere rusești pentru uz național (vezi captura de ecran nr. 2).
Unde este folosit sistemul de codare ASCII?
Acest sistem de codare este necesar nu numai pentru tastarea informațiilor text pe tastatură. Este folosit și în grafică. De exemplu, în programul ASCII Art Maker, imaginile grafice ale diferitelor extensii constau dintr-o serie de caractere ASCII (vezi captura de ecran nr. 3).
De regulă, astfel de programe pot fi împărțite în cele care îndeplinesc funcția de editor grafic, inversând o imagine în text și cele care convertesc o imagine în grafică ASCII. Cunoscuta emoticon (sau cum se mai numește și „ chip uman zâmbitor") este, de asemenea, un exemplu de caracter de codificare.
Această metodă de codificare poate fi folosită și la scrierea sau crearea unui document HTML. De exemplu, introduceți un set specific și necesar de caractere, iar la vizualizarea paginii în sine, simbolul corespunzător acestui cod va fi afișat pe ecran.
Printre altele, acest tip de codificare este necesar la crearea unui site web multilingv, deoarece caracterele care nu sunt incluse într-unul sau altul tabel național vor trebui înlocuite cu coduri ASCII. Dacă cititorul este conectat direct cu tehnologiile informației și comunicațiilor (TIC), atunci îi va fi util să se familiarizeze cu sisteme precum:
- set de caractere portabil;
- Personaje de control;
- EBCDIC;
- VISCII;
- YUSCII;
- Unicode;
- arta ASCII;
- KOI-8.
Proprietățile tabelului ASCII
Ca orice program sistematic, ASCII are propriile sale proprietăți caracteristice. Deci, de exemplu, sistemul numeric zecimal (cifre de la 0 la 9) este convertit în sistemul numeric binar (adică, fiecare cifră zecimală este convertită în binar 288 = 1001000, respectiv).
Literele situate în coloanele superioare și inferioare diferă unele de altele doar printr-un pic, ceea ce reduce semnificativ nivelul de complexitate al verificării și editării cazului.
Cu toate aceste proprietăți, codificarea ASCII funcționează ca pe opt biți, deși inițial a fost intenționat să fie pe șapte biți.
Utilizarea ASCII în programele Microsoft Office:
Dacă este necesar, această opțiune de codificare a informațiilor poate fi utilizată în Microsoft Notepad și Microsoft Office Word. În cadrul acestor aplicații, documentul poate fi salvat în format ASCII, dar în acest caz, nu veți putea folosi unele funcții la introducerea textului.
În special, fonturile aldine și aldine nu vor fi disponibile deoarece codificarea păstrează doar sensul informațiilor tastate, și nu aspectul și forma generală. Puteți adăuga astfel de coduri la un document utilizând următoarele aplicații software:
- Microsoft Excel;
- Microsoft FrontPage;
- Microsoft InfoPath;
- Microsoft OneNote;
- Microsoft Outlook;
- Microsoft powerpoint;
- Microsoft Project.
Merită să luați în considerare faptul că atunci când introduceți cod ASCII în aceste aplicații, trebuie să țineți apăsată tasta ALT.
Desigur, toate codurile necesare necesită un studiu mai lung și mai detaliat, dar acest lucru depășește scopul articolului nostru de astăzi. Sper că l-ai găsit cu adevărat util.
Ne mai vedem!
Rău Bun
Apropo, pe site-ul nostru puteți converti orice text în cod zecimal, hexazecimal, binar folosind Calculatorul de cod online.
Tabelul ASCII
ASCII (Codul standard american pentru schimbul de informații)
Tabel rezumat al codurilor ASCII
Tabel de coduri de caractere ASCII Windows (Win-1251)
|
|
Tabel de coduri ASCII extins
Formatarea simbolurilor.
Backspace (Returnează un caracter). Indică faptul că mecanismul de imprimare sau cursorul de afișare se deplasează înapoi cu o poziție. |
|
Tabularea orizontală. Indică mișcarea motorului de imprimare sau a cursorului de afișare la următorul „tab stop” prescris. |
|
Linie de alimentare. Indică mișcarea mecanismului de imprimare sau a cursorului de afișare la începutul liniei următoare (în jos pe o linie). |
|
Tabularea verticală. Indică mișcarea motorului de imprimare sau a cursorului de afișare către următorul grup de linii. |
|
Feed de formulare. Indică mișcarea motorului de imprimare sau a cursorului de afișare la poziția de pornire a paginii, formularului sau ecranului următor. |
|
Retur transport. Indică mișcarea mecanismului de imprimare sau a cursorului de afișare către poziția inițială (cel mai din stânga) a liniei curente. |
Transfer de date.
Începutul titlului. Folosit pentru a defini începutul unui antet, care poate conține informații de rutare sau o adresă. |
|
Începutul textului. Afișează începutul textului și, în același timp, sfârșitul titlului. |
|
Sfârșitul textului. Se aplică la încheierea textului care a început cu caracterul STX. |
|
Anchetă. Solicitarea datelor de identificare (cum ar fi „Cine ești?”) de la o stație la distanță. |
|
Recunoașteți. Dispozitivul receptor transmite acest caracter expeditorului ca confirmare a recepției cu succes a datelor. |
|
Recunoaștere negativă. Dispozitivul receptor transmite acest caracter expeditorului în cazul refuzului (eșecului) recepției datelor. |
|
Sincron/Inactiv. Folosit în sistemele de transmisie sincronizată. Când nu există transmisie de date, sistemul trimite continuu simboluri SYN pentru a asigura sincronizarea. |
|
Sfârșitul blocului de transmisie. Indică sfârșitul unui bloc de date în scopuri de comunicare. Folosit pentru a împărți cantități mari de date în blocuri separate. |
Semnele de împărțire la transmiterea informațiilor.
Alte simboluri.
Nul. (Fără caracter - fără date). Folosit pentru transmisie atunci când nu există date. |
|
Clopot (Apel). Folosit pentru controlul dispozitivelor de alarmă. |
|
Schimbă afară. Indică faptul că toate cuvintele de cod ulterioare trebuie interpretate conform setului de caractere extern înainte de sosirea caracterului SI. |
|
Schimbă în. Indică faptul că cuvintele de cod ulterioare trebuie interpretate conform setului de caractere standard. |
|
Data Link Escape. Schimbarea semnificației următoarelor caractere. Folosit pentru control suplimentar sau pentru transmiterea unei combinații arbitrare de biți. |
|
DC1, DC2, DC3, DC4 |
Comenzile dispozitivului. Simboluri pentru operarea dispozitivelor auxiliare (funcții speciale). |
Anulare. Indică faptul că datele care preced acest caracter într-un mesaj sau bloc ar trebui ignorate (de obicei, dacă este detectată o eroare). |
|
Sfârșitul Mediului. Indică capătul fizic al unei benzi sau al altui mediu de stocare |
|
Substitui. Folosit pentru a înlocui un caracter eronat sau invalid. |
|
Evadare (Extindere). Folosit pentru a extinde codul indicând faptul că un caracter ulterior are un sens alternativ. |
|
Spaţiu. Un caracter care nu se imprimă folosit pentru a separa cuvintele sau pentru a muta motorul de imprimare sau pentru a afișa cursorul înainte cu o poziție. |
|
Șterge. Folosit pentru a șterge (șterge) caracterul anterior dintr-un mesaj |
Se numește setul de caractere cu care este scris textul alfabet.
Numărul de caractere din alfabet este acesta putere.
Formula pentru determinarea cantității de informații: N=2b,
unde N este puterea alfabetului (numărul de caractere),
b – numărul de biți (greutatea informației simbolului).
Alfabetul cu o capacitate de 256 de caractere poate găzdui aproape toate caracterele necesare. Acest alfabet se numește suficient.
Deoarece 256 = 2 8, atunci greutatea unui caracter este de 8 biți.
Unitatea de măsură 8 biți a primit numele 1 octet:
1 octet = 8 biți.
Codul binar al fiecărui caracter din textul computerului ocupă 1 octet de memorie.
Cum sunt reprezentate informațiile text în memoria computerului?
Comoditatea codificării caracterelor octet cu octet este evidentă deoarece un octet este cea mai mică parte adresabilă a memoriei și, prin urmare, procesorul poate accesa fiecare caracter separat atunci când procesează text. Pe de altă parte, 256 de caractere reprezintă un număr destul de suficient pentru a reprezenta o mare varietate de informații simbolice.
Acum se pune întrebarea, ce cod binar de opt biți să aloce fiecărui caracter.
Este clar că aceasta este o chestiune condiționată, puteți găsi multe metode de codare.
Toate caracterele alfabetului computerului sunt numerotate de la 0 la 255. Fiecare număr corespunde unui cod binar de opt biți de la 00000000 la 11111111. Acest cod este pur și simplu numărul de serie al caracterului din sistemul de numere binar.
Un tabel în care tuturor caracterelor alfabetului computerului li se atribuie numere de serie se numește tabel de codificare.
Diferite tipuri de computere folosesc tabele de codificare diferite.
Masa a devenit standardul internațional pentru computere ASCII(citiți aski) (Codul standard american pentru schimbul de informații).
Tabelul de coduri ASCII este împărțit în două părți.
Doar prima jumătate a tabelului este standardul internațional, adică. simboluri cu numere din 0 (00000000), până la 127 (01111111).
Structura tabelului de codificare ASCII
Număr de serie |
Cod |
Simbol |
0 - 31 |
00000000 - 00011111 |
Simbolurile cu numere de la 0 la 31 sunt de obicei numite simboluri de control. |
32 - 127 |
00100000 - 01111111 |
Parte standard a tabelului (engleză). Aceasta include litere mici și mari ale alfabetului latin, numere zecimale, semne de punctuație, tot felul de paranteze, simboluri comerciale și alte simboluri. |
128 - 255 |
10000000 - 11111111 |
Parte alternativă a tabelului (rusă). |
Prima jumătate a tabelului de coduri ASCII
Vă rugăm să rețineți că în tabelul de codificare, literele (majuscule și mici) sunt aranjate în ordine alfabetică, iar numerele sunt ordonate crescător. Această respectare a ordinii lexicografice în aranjarea simbolurilor se numește principiul codificării secvențiale a alfabetului.
Pentru literele alfabetului rus, se respectă și principiul codificării secvențiale.
A doua jumătate a tabelului de coduri ASCII
Din păcate, în prezent există cinci codificări chirilice diferite (KOI8-R, Windows. MS-DOS, Macintosh și ISO). Din această cauză, apar adesea probleme cu transferul textului rusesc de la un computer la altul, de la un sistem software la altul.
Cronologic, unul dintre primele standarde pentru codificarea literelor rusești pe computere a fost KOI8 („Cod de schimb de informații, 8 biți”). Această codificare a fost folosită încă din anii 70 pe computerele din seria de calculatoare ES, iar de la mijlocul anilor 80 a început să fie folosită în primele versiuni rusificate ale sistemului de operare UNIX.
De la începutul anilor 90, vremea dominației sistemului de operare MS DOS, codificarea CP866 rămâne („CP” înseamnă „Pagină de coduri”, „pagină de coduri”).
Computerele Apple care rulează sistemul de operare Mac OS folosesc propria lor codificare Mac.
În plus, Organizația Internațională de Standardizare (ISO) a aprobat o altă codificare numită ISO 8859-5 ca standard pentru limba rusă.
Cea mai comună codificare utilizată în prezent este Microsoft Windows, prescurtat CP1251.
De la sfârșitul anilor 90, problema standardizării codificării caracterelor a fost rezolvată prin introducerea unui nou standard internațional numit Unicode. Aceasta este o codificare pe 16 biți, adică alocă 2 octeți de memorie pentru fiecare caracter. Desigur, acest lucru crește de 2 ori cantitatea de memorie ocupată. Dar un astfel de tabel de coduri permite includerea a până la 65536 de caractere. Specificația completă a standardului Unicode include toate alfabetele existente, dispărute și create artificial din lume, precum și multe simboluri matematice, muzicale, chimice și alte simboluri.
Să încercăm să folosim un tabel ASCII pentru a ne imagina cum vor arăta cuvintele în memoria computerului.
Reprezentarea internă a cuvintelor în memoria computerului
Uneori se întâmplă ca un text format din litere ale alfabetului rus primit de la alt computer să nu poată fi citit - un fel de „abracadabra” este vizibil pe ecranul monitorului. Acest lucru se întâmplă deoarece computerele folosesc diferite codificări de caractere pentru limba rusă.