Mod semantic de măsurare a informațiilor: esență, concepte de bază și proprietăți. Măsuri semantice și pragmatice ale informațiilor

NIVELURI DE PROBLEME DE TRANSMISIE A INFORMAȚIILOR

La implementarea proceselor informaționale, informația este întotdeauna transferată în spațiu și timp de la sursa informației către receptor (destinatar). În acest caz, diferite semne sau simboluri sunt folosite pentru a transmite informații, de exemplu, limbajul natural sau artificial (formal), permițându-i să fie exprimat într-o formă numită mesaj.

Mesaj- o formă de reprezentare a informațiilor sub forma unui set de semne (simboluri) utilizate pentru transmitere.

Un mesaj ca set de semne din punctul de vedere al semioticii (din greacă. semeion - semn, atribut) - o știință care studiază proprietățile semnelor și sistemelor de semne - poate fi studiată la trei niveluri:

1) sintactic, unde sunt luate în considerare proprietățile interne ale mesajelor, adică relațiile dintre semne, reflectând structura unui sistem de semne dat. Proprietățile externe sunt studiate la nivel semantic și pragmatic;

2) semantic, unde se analizează relațiile dintre semne și obiectele, acțiunile, calitățile pe care le denotă, adică conținutul semantic al mesajului, relația acestuia cu sursa informației;

3) pragmatic, unde se ia în considerare relația dintre mesaj și destinatar, adică conținutul de consum al mesajului, relația acestuia cu destinatarul.

Astfel, ținând cont de o anumită relație între problemele transmiterii informațiilor și nivelurile studierii sistemelor de semne, acestea sunt împărțite în trei niveluri: sintactic, semantic și pragmatic.

Probleme nivel sintactic privesc crearea unor fundamente teoretice pentru construcția sistemelor informaționale ai căror principali indicatori de performanță ar fi aproape de maxim posibil, precum și îmbunătățirea sistemelor existente în vederea creșterii eficienței utilizării acestora. Acestea sunt probleme pur tehnice de îmbunătățire a metodelor de transmitere a mesajelor și purtătorii lor materiale - semnale. La acest nivel, ei consideră problemele livrării mesajelor către destinatar ca un set de caractere, ținând cont de tipul de suport și metoda de prezentare a informațiilor, viteza de transmitere și procesare, dimensiunea codurilor de prezentare a informațiilor, fiabilitatea și acuratețea conversiei acestor coduri etc., făcând abstracție completă de conținutul semantic al mesajelor și scopul lor vizat. La acest nivel, informația considerată doar din perspectivă sintactică se numește de obicei date, deoarece latura semantică nu contează.

Teoria modernă a informației studiază în principal problemele de la acest nivel. Se bazează pe conceptul de „cantitate de informații”, care este o măsură a frecvenței de utilizare a semnelor, care nu reflectă în niciun caz nici semnificația, nici importanța mesajelor transmise. În acest sens, se spune uneori că teoria informației modernă este la nivel sintactic.

Probleme nivel semantic sunt asociate cu formalizarea și luarea în considerare a sensului informațiilor transmise, determinarea gradului de corespondență dintre imaginea obiectului și obiectul însuși. La acest nivel se analizează informația pe care o reflectă informația, se iau în considerare conexiunile semantice, se formează concepte și idei, se dezvăluie sensul și conținutul informației și se realizează generalizarea acesteia.

Problemele la acest nivel sunt extrem de complexe, întrucât conținutul semantic al informației depinde mai mult de destinatar decât de semantica mesajului prezentat în orice limbă.

La nivel pragmatic, ne interesează consecințele primirii și utilizării acestor informații de către consumator. Problemele de la acest nivel sunt asociate cu determinarea valorii și utilității utilizării informațiilor atunci când consumatorul dezvoltă o soluție pentru a-și atinge scopul. Principala dificultate aici este că valoarea și utilitatea informațiilor pot fi complet diferite pentru diferiți destinatari și, în plus, depinde de o serie de factori, cum ar fi, de exemplu, oportunitatea livrării și utilizării acesteia. Cerințele ridicate pentru viteza de livrare a informațiilor sunt adesea dictate de faptul că acțiunile de control trebuie efectuate în timp real, adică în ritmul schimbării stării obiectelor sau proceselor controlate. Întârzierile în livrarea sau utilizarea informațiilor pot avea consecințe catastrofale.

Unitățile de cantitate de informație, definite în cadrul abordărilor probabilistice și volumetrice, sunt tipuri de măsuri sintactice ale informațiilor utilizate în abordarea cea mai generală, atunci când subiectul luat în considerare nu este doar informația în sens restrâns (de exemplu, prelucrată de un computer), dar toate tipurile sale, inclusiv informațiile sociale.

Măsura sintactică operează cu informații impersonale care nu exprimă o relație semantică cu obiectul. Volumul de date dintr-un mesaj informativ este măsurat prin numărul de caractere (biți). În diferite sisteme de numere, cifrele au greutăți diferite, iar unitățile de date se modifică în consecință. Exemplele sunt bit, nat, trit, dit. În cadrul abordării probabilistice, măsura sintactică a cantității de informații este determinată de gradul de modificare a incertitudinii stării sistemului în cadrul abordării volumetrice, caracterizează volumul de informații;

Măsură semantică folosit pentru a caracteriza informația în ceea ce privește semnificația acesteia. Analiza semantică face posibilă dezvăluirea conținutului informației și arătarea relațiilor dintre semnificațiile semantice ale elementelor sale constitutive. În combinație cu conceptul de „tezaur”, se numește măsura semantică măsura tezaurului informație. Măsura tezaurului a fost propusă de Yu.I Schneider și s-a răspândit. Tezaur este o colecție de informații disponibile unui utilizator sau unui sistem. O altă definiție care nu o contrazice pe prima: tezaurul este completitudinea unui set sistematic de date despre subiectul informației. În timpul procesului de informare, în funcție de relația dintre conținutul semantic al informațiilor și tezaurul utilizatorului, cantitatea de informații semantice percepută de utilizator și inclusă ulterior de acesta în tezaurul său se modifică. Utilizatorul primește cantitatea maximă de informații semantice atunci când informațiile sunt clare pentru el și poartă informații necunoscute anterior pentru el (nu în tezaur). Cantitatea de informație semantică dobândită în timpul procesului de informare este o valoare relativă, întrucât același mesaj poate avea conținut semantic pentru un utilizator competent și poate fi lipsit de sens (zgomot semantic) pentru unul incompetent. O măsură a informației semantice poate fi coeficientul de conținut, definit ca raportul dintre cantitatea de informații semantice și volumul total al acesteia.

Măsură pragmatică caracterizează utilitatea (valoarea) informaţiei pentru ca utilizatorul să-şi atingă scopul. Această măsură este și o valoare relativă, în funcție de nevoile specifice ale utilizatorului și de condițiile procesului de informare. Într-un sistem tehnic, proprietățile pragmatice ale informațiilor determină posibilitatea îmbunătățirii calității funcționării sistemului.

Formulare pentru prezentarea informațiilor într-un computer. Sisteme numerice

Baza fizică a tehnologiei informatice este generarea, procesarea și transmiterea semnalelor electrice. Semnalele electrice sunt împărțite în analogic(continuu) și digital(discret). În tehnologia computerelor se folosesc semnale digitale. Fiecărui nivel de tensiune (curent) i se atribuie un anumit număr. Corelarea parametrilor semnalului electric cu numerele reflectă legătura dintre tehnologie și matematică. Calculatoarele moderne se bazează pe un sistem de numere binar, în care există doar două cifre - 0 și 1. Alegerea în favoarea acestui sistem se datorează faptului că este mai ușor de implementat din punct de vedere tehnic decât sistemul de numere zecimal cunoscut oamenilor.

Elementul principal al electronicii computerului este un tranzistor care funcționează în modul cheie. În acest mod, tranzistorul, în funcție de tensiunea aplicată acestuia, implementează două stări logice conform principiului comutatorului: deschis - închis sau pornit - oprit. Aceste două stări compară 0 și 1 din sistemul de numere binar - acele obiecte matematice cu ajutorul cărora este codificată orice informație procesată de un computer. La nivelul caracteristicilor unui semnal electric, „zero” poate corespunde, de exemplu, unei tensiuni de minus 5 volți, iar „unu” la plus 5 volți. Sau – 15 V și + 15 V. Valorile absolute ale tensiunilor, care sunt asociate stărilor logice 0 și 1, nu sunt semnificative pentru procesarea software-ului a informațiilor și sunt determinate de condițiile optime de funcționare ale plăcilor electronice. În dispozitivele de stocare a datelor, informațiile „zerourile” și „unurile” pot fi implementate diferit: de exemplu, pe un disc magnetic, stările 0 și 1 corespund diferitelor direcții ale vectorului de magnetizare; în unități flash – absența sau prezența unei sarcini electrice într-o anumită regiune microscopică a unei substanțe; în cipuri RAM - un condensator neîncărcat sau încărcat.

Deci, reprezentarea internă a oricărei informații dintr-un computer este binară. Sistemele de numere octale și hexazecimale sunt de asemenea folosite în programare. În plus, întrucât utilizatorul computerului este o persoană, conexiunea sistemelor numerice menționate cu zecimală este importantă.

Notaţie– un mod acceptat de scriere a numerelor – caracterizat prin numărul de cifre cu care poate fi exprimat orice număr. Toate sistemele de numere pot fi împărțite în două clase: poziționalȘi nepozițională. Sistemele numerice poziționale sunt acelea în care greutatea cifrelor depinde de locația lor în înregistrarea numerelor. Se numește numărul de cifre dintr-un sistem pozițional baza sistemului de numere. Mai jos într-un singur bloc sunt adunate definiții importante legate de sistemele numerice.

Numerele– simboluri folosite la scrierea numerelor și la alcătuirea unui alfabet.

Număr– o anumită cantitate care este alcătuită din numere după anumite reguli.

Notaţie- o modalitate de a scrie numere folosind cifre.

Sistemul numeric pozițional– un sistem numeric în care greutatea unei cifre depinde de locația acesteia în înregistrare.

Descarcare– poziția unei cifre într-un număr.

Baza– numărul de cifre folosit pentru a scrie numere.

Calculatoarele folosesc sisteme numerice poziționale.

Sisteme numerice

cel mai utilizat în calcul

Baza	Notaţie
	binar
	octal	0, 1, 2, 3, 4, 5, 6, 7
	zecimal	0, 1, 2, 3, 4, 5, 6, 7, 8, 9
	hexazecimal	0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

Un exemplu de sistem de numere non-pozițional este cel roman. Acest sistem folosește 7 caractere (I, V, X, L, C, D, M), care corespund următoarelor valori: I – 1, V – 5, X – 10, L – 50, C – 100, D – 500 , M – 1000. De obicei, cifrele romane sunt folosite la numerotarea capitolelor din cărți sau a secolelor din istorie. Dezavantajul sistemelor de numere nepoziționale, care exclude posibilitatea utilizării lor în calcul, este lipsa regulilor formale de scriere a numerelor și, în consecință, imposibilitatea efectuării operațiilor aritmetice asupra acestora.

Să luăm în considerare reprezentarea unui număr în sistemul numeric pozițional. Să începem cu un exemplu simplu. Fie N – întreg număr. Poate fi prezentat ca o intrare scurtă sau extinsă. Scurtă înregistrare a numărului:

N = (a n a n -1 …a 1 a 0) p

Aici a 0 , a 1 , … , a n -1 , a n sunt cifrele situate, respectiv, la pozițiile zero, prima, … , (n-1)-a, n-a din înregistrarea numerelor. Numerotarea pozițiilor, sau a cifrelor, începe de la zero și merge de la dreapta la stânga. 0 este cifra cea mai puțin semnificativă a numărului, care are cea mai mică pondere; n – cea mai semnificativă cifră cu cea mai mare pondere. Numărul p este baza sistemului numeric.

De exemplu, în numărul N = (6874) 10, cifra 4 reprezintă cifra zero, 7 prima cifră, 8 a doua cifră, 6 a treia cifră. Greutatea cifrelor crește de la dreapta la stânga, de la unități la mii: 4 unitati – 7 zeci – 8 sute – 6 mie. 10 – baza sistemului numeric – indică faptul că acest număr este scris în sistemul numeric zecimal familiar oamenilor și este citit ca şase mii opt sute şaptezeci şi patru.

Numărul N poate fi reprezentat prin notație extinsă:

N = a n p n + a n-1 p n-1 + … + a 1 p 1 + a 0 p 0

Aici numărul N este exprimat ca o sumă, fiecare termen al căruia reprezintă produsul cifrei de baza sistemului numeric, ridicat la o putere egală cu numărul de poziție (cifra) acestei cifre în număr:

număr  (baza) număr digital

Revenind la exemplul discutat mai sus, dăm o notație extinsă a numărului N = (6874) 10:

(6874) 10 = 610 3 + 810 2 + 710 1 + 410 0 .

Asociată cu forma extinsă de scriere a unui număr este o metodă universală de conversie a numerelor din orice sistem numeric în zecimal.

De exemplu, doriți să convertiți numărul hexazecimal (E7B) 16 în sistemul numeric zecimal.

În primul rând, numerotăm cifrele numărului - de la dreapta la stânga, de la cea mai puțin semnificativă la cea mai semnificativă. Luăm în considerare că numerotarea cifrelor începe de la zero.

Să luăm în considerare corespondența dintre cifrele sistemelor numerice hexazecimal și zecimal: E – 14, B – 11. Apoi

Deci, problema este rezolvată: (E7B) 16 = (3707) 10.

O metodă similară este utilizată pentru a converti numerele fracționale. Numerele din dreapta punctului zecimal corespund cifrelor cu numere negative.

N = (a n a n-1 …a 1 a 0 ,a -1 a -2 …a -k) p

Să luăm în considerare conversia numărului octal fracționar (725,46) 8 în sistemul numeric zecimal.

Numerotăm categoriile.

Să efectuăm calculele și să obținem rezultatul în sistemul numeric zecimal.

(725,46) 8 = 78 2 + 28 1 + 58 0 + 48 -1 + 68 -2 = 448 + 16 + 5 + 4/8 + 6/64 =

448 + 16 + 5 + 0,5 + 0,09375 = 469,59375

Deci, (725,46) 8 = (469,59375) 10.

Este ceva mai dificil să convertiți numerele din zecimal în alte sisteme numerice.

Tehnica se bazează pe secvențial întregîmpărțirea cu selecția resturilor ca cifre ale numărului dorit. Numărul inițial este împărțit la baza sistemului numeric în care se efectuează conversia. Rezultatul împărțirii întregilor este câtul, reprezentat printr-un număr întreg și un rest. Acest rest va fi cifra cea mai puțin semnificativă a numărului dorit. Coeficientul obținut în prima etapă este din nou împărțit la baza sistemului numeric necesar, iar câtul și restul sunt obținute din nou. Restul este stocat ca următoarea cifră a numărului dorit. Împărțirea continuă până când următorul cât este mai mic decât baza sistemului numeric necesar. Acest coeficient va fi cea mai semnificativă cifră a numărului dorit. Din ea și resturile obținute în ultimii pași și anteriori, se formează numărul necesar.

Să ne uităm la această tehnică cu un exemplu. Vă permite să convertiți numărul (894) 10 în sistemul de numere septale.

894: 7 = 127, rest 5

127: 7 = 18, rest 1

18: 7 = 2 , rest 4

Ultimul cât - 2 - este mai mic decât baza sistemului numeric în care se efectuează conversia - 7. Acum puteți scrie numărul necesar: (2415) 7.

Deci, (894) 10 = (2415) 7.

Bazele logice ale calculatoarelor

Algebra logicii. Declarații logice

Predecesorul și componenta algebrei, conform regulilor cărora funcționează dispozitivele digitale, este algebra logicii. Această algebră operează cu afirmații logice, al căror conținut poate fi apreciat ca fiind corespunzător realității (adevărat) sau inconsecvent cu realitatea (fals).

O afirmație logică este o propoziție declarativă a cărei adevăr sau falsitate poate fi evaluată.

Exemple de afirmații adevărate: „apa este un lichid”, „primăvara va veni după iarnă”, „cifra 48 este de 8 ori mai mare decât numărul 6”. Exemple de afirmații false: „râul Kama se varsă în Lacul Baikal”, „o vrabie este un șoim”, „numărul 2 este mai mare decât numărul 3”.

În prima propoziție verbul este folosit la modul imperativ. O propoziție stimulativă nu poate fi o declarație logică.

A doua propoziție nu este o afirmație logică din cauza absurdității conceptelor „aria unui segment” și „lungimea unui cub”.

A treia propoziție este interogativă, deci nu poate fi nici o afirmație logică.

A patra propoziție este o afirmație logică și una falsă.

Prima propoziție este o afirmație logică. Este fals, deoarece în realitate planeta cea mai apropiată de Soare este Mercur.

A doua propoziție nu este declarativă, ci exclamativă, deci nu este o afirmație logică.

A treia propoziție ar putea fi o afirmație logică dacă informațiile pe care le conținea erau suficiente pentru a-și judeca adevărul sau falsitatea. Cu toate acestea, este imposibil să se judece dacă numărul X aparține intervalului specificat, deoarece acest număr în sine este necunoscut. Prin urmare, a treia propoziție nu este, de asemenea, o afirmație logică.

algebră booleană. Operații logice de bază

Dispozitivele logice computerizate sunt proiectate pe baza aparatului matematic al algebrei booleene, numit după matematicianul englez George Boole, care a formulat conceptele și regulile sale de bază. Aceasta este o algebră de variabile binare, constante și funcții care iau doar două valori - unitate(în algebra logicii corespunde valorii TRUE) și zero(în algebra logicii - FALS).

Operațiile de bază ale algebrei booleene sunt inversiune, conjuncţie, disjuncție. Numele lor rusești sunt, respectiv negare, înmulțire logică, adaos logic. În caz contrar - operațiuni NU, ȘI, SAU.

Notarea operațiilor logice ale algebrei booleene

A și B sunt afirmații logice.

Tabelele de adevăr sunt folosite pentru a reprezenta vizual și a efectua calcule logice.

Mai jos sunt tabelele de adevăr ale operațiilor logice de bază.

Inversiunea

Inversarea este o funcție a unui argument, care este afirmația logică A. Dacă A este fals, atunci Â este adevărat și invers.

Conjuncție și disjuncție

Conjuncția și disjuncția sunt funcții a două sau mai multe argumente. Rezultatul lor este o declarație logică complexă (compozită), care, în funcție de valorile argumentelor funcției, ia valoarea 1 sau 0. Tabelul de adevăr trebuie să includă toate combinațiile posibile de valori ale argumentului - logice simple sau complexe. declarații. Există 2 n astfel de combinații, unde n este numărul de argumente. În cel mai simplu caz, când operăm cu două afirmații logice A și B, tabelele de adevăr arată așa.

Conjuncție Disjuncție

Argumente	Rezultat	Argumente	Rezultat

Pentru un număr arbitrar de argumente, două reguli sunt adevărate.

1. Dacă printre argumente conjuncţii Dacă există cel puțin unul care ia întotdeauna valoarea 0 (FALSE), atunci rezultatul conjuncției, indiferent de valorile celorlalte argumente, este tot 0 (FALSE).

2. Dacă printre argumente disjuncţii Dacă există cel puțin unul care ia întotdeauna valoarea 1 (TRUE), atunci rezultatul disjuncției, indiferent de valorile celorlalte argumente, este tot 1 (TRUE).

Următoarele tabele de adevăr confirmă aceste reguli.

Unele afirmații ale limbajului uman obișnuit pot fi comparate cu funcții logice. De exemplu, afirmația „Pentru a obține o notă excelentă la un examen necesită Cum disponibilitatea creditului de practică, deci si bună cunoaștere a materialului teoretic” corespunde conjuncției. Citat: „Pentru ca pielea ta să se bronzeze, trebuie să petreci câteva zile pe plajă, sub soarele fierbinte.” sau vizitați solarul de mai multe ori” reprezintă o disjuncție. Un alt exemplu de disjuncție: „Pentru a pierde în greutate, trebuie să muncești mai mult fizic și să mănânci mai puțin.” Să ilustrăm ultima afirmație cu un tabel de adevăr.

Enunțurile care reprezintă o conjuncție corespund de obicei construcției „ AȘiB», « CumA,deci siB», « Aimpreuna cuB"; reprezentând disjuncția – „ AsauB" Pot exista și excepții: un exemplu este propoziția analizată la sfârșitul paginii precedente.

Constructii ca " sauA,sauB», « AsauB», « sauA,sauB» corespunde unei funcţii numite disjuncție strictă. Diferența sa față de o disjuncție obișnuită este că este egală cu 1 numai dacă valorile argumentelor sale sunt diferite. Denumirea disjuncției stricte este –A  B, celelalte denumiri ale acesteia sunt disparitate,exclusiv SAU (XOR în limbaje de programare), adiție modulo 2. Mai jos este tabelul de adevăr pentru disjuncția strictă.

Disjuncție strictă (neechivalență)

În algebra modernă a logicii, sunt definite încă două operații de bază - echivalenţăȘi implicare.

Echivalența (echivalența, echivalența) este o funcție opusă disjuncției stricte. Se evaluează la TRUE atunci când toate argumentele sale sunt fie adevărate, fie false. Denumirea sa: A  B.

Echivalență (echivalență)

Implicația este o funcție a două argumente logice. Denumirea sa este: A  B. Tabelul de adevăr al funcției „implicație” este următorul.

Implicare

Implicația poate fi exprimată prin operațiile de bază ale algebrei booleene: A  B = A  B.

În limbajele de programare, echivalentul corespunde funcției EQV, iar implicația - IMP.

Funcțiile „echivalență” și „implicație” pot fi, de asemenea, corelate cu declarații individuale ale limbii ruse. Echivalențe corespund afirmațiilor ca: „ A echivalent B» ; « A atunci și numai când B» ; « A necesar si suficient pentru B" Implicațiile corespund construcției: „ Dacă A, Acea B» ; « B, Dacă A» ; « B necesar pentru A» ; « A destul pentru B» ; « A Doar cand B» ; « B apoi când A". Un exemplu clasic de implicare este expresia „Dacă plouă, atunci sunt nori pe cer”. Să notăm A= „Plouă” B= „Sunt nori pe cer” și creați un tabel de adevăr.


			„Nu plouă, nu sunt nori pe cer” - o zi senină și însorită, enunț compus Adevărat
			„Nu plouă, sunt nori pe cer” - o zi uscată și înnorată, enunț compus Adevărat
			„Plouă, nu sunt nori pe cer” - acest lucru nu se întâmplă, enunț compus fals
			„Plouă, sunt nori pe cer” - o zi ploioasă înnorată, enunț compus Adevărat

Trebuie subliniat faptul că formalizarea enunţurilor în limbajul uman este foarte limitată. Cele mai multe fraze și propoziții ale limbii ruse, atât colocviale, cât și literare, nu sunt deloc afirmații din punctul de vedere al algebrei logicii. Acest lucru se datorează prezenței multor nuanțe de scris și vorbire care nu pot fi surprinse în cadrul logicii formale, cu colorarea emoțională și subiectivitatea judecăților, precum și faptului imuabil că există mult mai multe adevăruri relative în lume decât cele absolute. Prin urmare, experimentele de corelare a operațiunilor logicii formale cu enunțuri ale limbajului uman sunt aplicabile numai propozițiilor percepute fără ambiguitate care afirmă faptele cele mai generale și simple.

Deci, baza algebrei moderne a logicii sunt cinci operații logice de bază: inversare, conjuncție, disjuncție, implicație, echivalență. Toate celelalte operații pot fi exprimate prin combinații ale celor trei operații ale algebrei booleene: inversare, conjuncție și disjuncție.

Când se analizează enunțuri logice complexe, este necesar să ne amintim prioritatea operațiilor logice: în absența parantezelor, se efectuează mai întâi negația, apoi în ordinea descrescătoare a priorității sunt conjuncția, disjuncția strictă, disjuncția, implicația și, nu în ultimul rând, echivalenţă. Parantezele pot schimba această ordine.

În tehnologia digitală, microcircuitele construite pe elemente logice AND-NOT și NOR-NOT au devenit larg răspândite. Din punct de vedere tehnologic, acestea sunt implementate cel mai simplu. Au existat chiar și încercări de a construi computere care constau numai din aceste elemente. Cu ele sunt asociate încă două algebre binare - algebra Schaeffer și algebra Peirce. Operația ȘI-NU se numește „trăvire Schaeffer”, operația SAU-NU se numește „Săgeată Pierce”. Denumiri: A  B și, respectiv, A  B Din punctul de vedere al algebrei booleene, ambele operații sunt compuse.


A  B = A  B	A  B = A  B

Tabele de adevăr pentru aceste funcții:

Lovitura lui Schaeffer Arrow Peirce

Argumente	Rezultat	Argumente	Rezultat

Notații în tehnologia digitală.

După cum sa menționat deja, conceptul de informație poate fi luat în considerare în cadrul diferitelor restricții impuse proprietăților sale, de exemplu. la diferite niveluri de considerare. Există în principal trei niveluri – sintactic, semantic și pragmatic. În consecință, la fiecare dintre ele, sunt utilizate estimări diferite pentru a determina cantitatea de informații.

La nivel sintactic, pentru estimarea cantității de informații se folosesc metode probabilistice, care țin cont doar de proprietățile probabilistice ale informațiilor și nu țin cont de altele (conținut semantic, utilitate, relevanță etc.). Dezvoltat la mijlocul secolului al XX-lea. metodele matematice și, în special, probabilistice au făcut posibilă formularea unei abordări de evaluare a cantității de informații ca măsură de reducere a incertitudinii cunoașterii.

Această abordare, numită și probabilistică, postulează principiul: dacă un mesaj duce la o scădere a incertitudinii cunoștințelor noastre, atunci putem spune că un astfel de mesaj conține informații. În acest caz, mesajele conțin informații despre orice evenimente care pot avea loc cu probabilități diferite.

O formulă pentru determinarea cantității de informații pentru evenimente cu probabilități diferite și primite dintr-o sursă discretă de informații a fost propusă de omul de știință american K. Shannon în 1948. Conform acestei formule, cantitatea de informații poate fi determinată după cum urmează:

Unde eu– cantitatea de informații; N– numărul de evenimente posibile (mesaje); p i– probabilitatea unor evenimente individuale (mesaje).

Cantitatea de informații determinată folosind formula (2.1) ia doar o valoare pozitivă. Deoarece probabilitatea evenimentelor individuale este mai mică de unu, atunci, în consecință, expresia log 2, - este o valoare negativă și pentru a obține o valoare pozitivă pentru cantitatea de informații din formula (2.1) există un semn „minus” înainte de semnul sumei.

Dacă probabilitatea de apariție a evenimentelor individuale este aceeași și ele formează un grup complet de evenimente, adică:

atunci formula (2.1) se transformă în formula lui R. Hartley:

În formulele (2.1) și (2.2), relația dintre cantitatea de informații euși, în consecință, probabilitatea (sau numărul) evenimentelor individuale este exprimată folosind un logaritm.

Utilizarea logaritmilor în formulele (2.1) și (2.2) poate fi explicată după cum urmează. Pentru simplitatea raționamentului, folosim relația (2.2). Vom atribui secvenţial argumentului N valorile selectate, de exemplu, dintr-o serie de numere: 1, 2, 4, 8, 16, 32, 64 etc. Pentru a determina ce eveniment N au avut loc evenimente la fel de probabile, pentru fiecare număr din serie este necesară efectuarea secvenţială a operaţiilor de selecţie din două evenimente posibile.

Da cand N= 1 numarul de operatii va fi egal cu 0 (probabilitatea evenimentului este egala cu 1), cu N= 2, numărul de operații va fi egal cu 1, când N= 4 numarul de operatii va fi egal cu 2, cand N= 8, numărul de operații va fi 3 etc. Astfel, obținem următoarea serie de numere: 0, 1, 2, 3, 4, 5, 6 etc., care pot fi considerate corespunzătoare valorilor funcției euîn relaţie (2.2).

Secvența de valori numerice pe care o ia argumentul N, este o serie cunoscută în matematică ca o serie de numere care formează o progresie geometrică și succesiunea de valori numerice pe care o ia funcția eu, va fi o serie care formează o progresie aritmetică. Astfel, logaritmul din formulele (2.1) și (2.2) stabilește o relație între seria reprezentând progresii geometrice și aritmetice, lucru destul de cunoscut în matematică.

Pentru a cuantifica (evalua) orice mărime fizică, este necesar să se definească o unitate de măsură, care în teoria măsurării se numește măsuri .

După cum sa menționat deja, informațiile trebuie să fie codificate înainte de procesare, transmitere și stocare.

Codarea se face folosind alfabete speciale (sisteme de semne). În informatică, care studiază procesele de primire, procesare, transmitere și stocare a informațiilor cu ajutorul sistemelor de calcul (calculatoare), se utilizează în principal codificarea binară, care folosește un sistem de semne format din două simboluri 0 și 1. Din acest motiv, în formulele ( 2.1) și (2.2) numărul 2 este folosit ca bază a logaritmului.

Pe baza abordării probabilistice pentru determinarea cantității de informații, aceste două simboluri ale sistemului de semne binar pot fi considerate ca două evenimente posibile diferite, prin urmare, o unitate de cantitate de informație este considerată a fi cantitatea de informație care conține un mesaj care reduce incertitudinea cunoașterii la jumătate (înainte de a primi evenimente, probabilitatea acestora este 0 ,5, după primirea – 1, incertitudinea scade în mod corespunzător: 1/0,5 = 2, adică de 2 ori). Această unitate de măsură a informațiilor se numește bit (din cuvântul englezesc Cifră binară- Cifră binară). Astfel, un bit este luat ca măsură pentru estimarea cantității de informații la nivel sintactic, presupunând codificare binară.

Următoarea unitate de măsură cea mai mare a cantității de informații este un octet, care este o secvență formată din opt biți, adică:

1 octet = 2 3 biți = 8 biți.

În informatică, unitățile de măsură ale cantității de informații care sunt multipli ai octetului sunt, de asemenea, utilizate pe scară largă, dar spre deosebire de sistemul metric de măsuri, unde coeficientul 10n este utilizat ca multiplicatori de unități multiple, unde n = 3, 6, 9 etc., în mai multe unități de măsură ale cantității de informații se folosește coeficientul 2n. Această alegere se explică prin faptul că computerul funcționează în principal cu numere nu în sistemul numeric zecimal, ci în sistemul numeric binar.

Unitățile de măsurare a cantității de informații care sunt multipli ai unui octet sunt introduse după cum urmează:

1 kilobyte (KB) = 210 bytes = 1024 bytes;

1 megaoctet (MB) = 210 KB = 1024 KB;

1 gigaoctet (GB) = 210 MB = 1024 MB;

1 terabyte (TB) = 210 GB = 1024 GB;

1 petabyte (PB) = 210 TB = 1024 TB;

1 exabyte (Ebyte) = 210 PB = 1024 PB.

Unitățile de măsură ale cantității de informații, ale căror nume conțin prefixele „kilo”, „mega”, etc., nu sunt corecte din punctul de vedere al teoriei măsurării, deoarece aceste prefixe sunt utilizate în sistemul metric de măsuri. , în care un coeficient este utilizat ca multiplicatori ai mai multor unități 10 n, unde n = 3, 6, 9 etc. Pentru a elimina această incorectitudine, organizația internațională Comisia Electrotehnică Internațională, care creează standarde pentru industria tehnologiei electronice, a aprobat o serie de noi prefixe pentru unitățile de măsură ale cantității de informații: kibi, mebi, gibi, tebi, peti, exbi. Cu toate acestea, vechile denumiri pentru unitățile de măsurare a cantității de informații sunt încă folosite și va dura timp până când noile denumiri să fie utilizate pe scară largă.

Abordarea probabilistică este utilizată și în determinarea cantității de informații prezentate folosind sisteme de semne. Dacă considerăm caracterele alfabetului ca un set de mesaje posibile N, atunci cantitatea de informații transportată de un caracter al alfabetului poate fi determinată prin formula (2.1). Dacă fiecare caracter al alfabetului apare la fel de probabil în textul mesajului, formula (2.2) poate fi folosită pentru a determina cantitatea de informații.

Cantitatea de informații pe care o poartă un caracter al alfabetului, cu atât este mai mare numărul de caractere incluse în acest alfabet. Numărul de caractere incluse în alfabet se numește puterea alfabetului. Cantitatea de informații (volumul de informații) conținută într-un mesaj codificat folosind un sistem de semne și care conține un anumit număr de caractere (simboluri) se determină cu ajutorul formulei:

Unde V– volumul informativ al mesajului; eu= log2N, volumul de informații al unui simbol (semn); LA– numărul de simboluri (semne) din mesaj; N– puterea alfabetului (numărul de caractere din alfabet).

Măsura sintactică a informațiilor.

Această măsură a cantității de informații operează cu informații impersonale care nu exprimă o relație semantică cu obiectul. Volumul de date Vdîn acest caz, mesajul este măsurat prin numărul de caractere (biți) din mesaj. În diferite sisteme de numere, o cifră are o greutate diferită și unitatea de măsură a datelor se modifică în consecință.

De exemplu, în sistemul numeric binar unitatea de măsură este bitul (cifră binară de biți - Cifră binară). Un bit este răspunsul la o singură întrebare binară („da” sau „nu”; „0” sau „1”), transmisă prin canale de comunicație folosind un semnal. Astfel, cantitatea de informație conținută într-un mesaj în biți este determinată de numărul de cuvinte binare ale limbajului natural, de numărul de caractere din fiecare cuvânt și de numărul de semnale binare necesare pentru a exprima fiecare caracter.

În calculatoarele moderne, împreună cu unitatea minimă de măsură a datelor „bit”, unitatea de măsură mărită „octet”, egală cu 8 biți, este utilizată pe scară largă. În sistemul numeric zecimal, unitatea de măsură este „bit” (locul zecimal).

Cantitatea de informații I la nivel sintactic este imposibil de determinat fără a lua în considerare conceptul de incertitudine a stării sistemului (entropia sistemului). Într-adevăr, obținerea de informații despre un sistem este întotdeauna asociată cu o modificare a gradului de ignoranță a destinatarului cu privire la starea acestui sistem, i.e. cantitatea de informaţie este măsurată printr-o modificare (reducere) a incertitudinii stării sistemului.

Coeficientul (gradul) conținutului informațional(concizia) unui mesaj este determinată de raportul dintre cantitatea de informații și cantitatea de date, adică

Y= I / Vd, cu 0

Cu crestere Y cantitatea de muncă pentru transformarea informațiilor (datelor) din sistem este redusă. Prin urmare, se străduiesc să crească conținutul informațional, pentru care se dezvoltă metode speciale de codificare optimă a informațiilor.

Măsura semantică a informațiilor

Pentru a măsura conținutul semantic al informațiilor, i.e. cantitatea sa la nivel semantic, cea mai recunoscută este măsura tezaurului, care leagă proprietățile semantice ale informațiilor cu capacitatea utilizatorului de a accepta mesajul primit. În acest scop este folosit conceptul tezaurul utilizatorului.

Tezaur este o colecție de informații disponibile unui utilizator sau unui sistem.

În funcţie de relaţia dintre conţinutul semantic al informaţiei Sși tezaurul utilizatorului Sp cantitatea de informații semantice se modifică eu, perceput de utilizator și inclus ulterior de acesta în tezaurul său.

Natura acestei dependențe este prezentată în Fig. 1. Luați în considerare două cazuri limitative când cantitatea de informații semantice Iс este egal cu 0:

la Sp= 0 utilizatorul nu percepe sau înțelege informațiile primite;

La Sp utilizatorul știe totul și nu are nevoie de informațiile primite.

Măsura sintactică a informațiilor

Ca măsură sintactică, cantitatea de informații reprezintă volumul de date.

DESPRE volumul de date V d într-un mesaj „în” este măsurat prin numărul de caractere (cifre) din acest mesaj. După cum am menționat, în sistemul numeric binar unitatea de măsură este bitul. În practică, împreună cu această „cea mai mică” unitate de măsură a datelor, este adesea folosită o unitate mai mare - octet egal cu 8 biți. Pentru comoditate, sunt folosiți ca contoare kilo (10 3), mega (10 6), giga (10 9) și tera (10 12) octeți etc. Volumul mesajelor scurte scrise, cărților groase, muzicii, imaginilor și produselor software este măsurat în octeți familiari. Este clar că această măsură nu poate caracteriza în niciun fel ce și de ce poartă aceste unități de informație. Măsurați romanul lui L.N. Războiul și pacea lui Tolstoi este util, de exemplu, pentru a înțelege dacă poate încăpea în spațiul liber al unui hard disk. Acest lucru este la fel de util ca măsurarea dimensiunii unei cărți - înălțimea, grosimea și lățimea acesteia - pentru a decide dacă se va potrivi pe un raft sau cântărirea ei pentru a vedea dacă o servietă poate suporta greutatea combinată.

Asa de. o măsură sintactică a informațiilor nu este în mod clar suficientă pentru a caracteriza un mesaj: în exemplul nostru meteorologic, în ultimul caz, mesajul prietenului conținea o cantitate diferită de zero, dar nu conținea informațiile de care aveam nevoie. Concluzia despre utilitatea informațiilor rezultă din luarea în considerare a conținutului mesajului. Pentru a măsura conținutul semantic al informațiilor, i.e. cantitatea sa la nivel semantic, introducem conceptul de „tezaur al destinatarului informației”.

Un tezaur este o colecție de informații și conexiuni între ele pe care le are destinatarul informațiilor. Putem spune că un tezaur este cunoștințele acumulate ale destinatarului.

Într-un caz foarte simplu, când destinatarul este un dispozitiv tehnic - un computer personal, tezaurul este format din „armamentul” calculatorului - programe și dispozitive încorporate în acesta care îi permit să primească, să proceseze și să prezinte mesaje text în diferite limbi, folosind diferite alfabete, fonturi, precum și informații audio și video din rețeaua locală sau mondială. Dacă computerul dvs. nu are o placă de rețea, nu vă puteți aștepta să primească mesaje de la alți utilizatori ai rețelei sub nicio formă. Lipsa driverelor cu fonturi rusești nu vă va permite să lucrați cu mesaje în rusă etc.

Dacă destinatarul este o persoană, tezaurul său este și un fel de armament intelectual al unei persoane, un arsenal al cunoștințelor sale. De asemenea, formează un fel de filtru pentru mesajele primite. Mesajul primit este procesat folosind cunoștințele existente pentru a obține informații. Dacă tezaurul este foarte bogat, atunci arsenalul de cunoștințe este profund și divers, vă va permite să extrageți informații din aproape orice mesaj. Un mic tezaur care conține puține cunoștințe poate fi o barieră în înțelegerea mesajelor care necesită o pregătire mai bună.

Să remarcăm, însă, că înțelegerea mesajului în sine nu este suficientă pentru a influența luarea deciziilor - trebuie să conțină informațiile necesare pentru aceasta, care nu se află în tezaurul nostru și pe care dorim să le includem în acesta. În cazul vremii, tezaurul nostru nu avea cele mai recente, „actuale” informații despre vreme pentru zona universitară. Dacă un mesaj pe care îl primim ne modifică tezaurul, alegerea noastră de soluție se poate schimba și ea. Această modificare a tezaurului servește ca măsură semantică a cantității de informații și o măsură unică a utilității mesajului primit.

Formal, cantitatea de informații semantice Este, inclus ulterior în tezaur este determinat de relația dintre tezaurul destinatarului S i, și conținutul informațiilor transmise în mesajul „către” S. O vedere grafică a acestei dependențe este prezentată în Fig. 1.

Să luăm în considerare cazurile în care cantitatea de informații semantice Este egal sau aproape de zero:

La S i= 0 destinatarul nu percepe informațiile primite;

La 0< Si< S 0 получатель воспринимает, но не понимает поступившую в сообщении информацию;

La S i-» ∞destinatarul are cunoștințe exhaustive și informațiile primite nu își pot completa tezaurul.

Orez. Dependența cantității de informații semantice de tezaurul destinatarului

Cu tezaur S i> S 0 cantitatea de informații semantice Este, primit dintr-un mesaj atașat β informație Screște rapid la început odată cu creșterea propriului tezaur al destinatarului și apoi - pornind de la o anumită valoare S i - scade . Scăderea cantității de informații utile destinatarului are loc deoarece baza de cunoștințe a destinatarului a devenit destul de solidă și devine din ce în ce mai dificil să-l surprinzi cu ceva nou.

Acest lucru poate fi ilustrat prin exemplul studenților care studiază informatica economică și materiale de citire de pe site-uri web despre IP corporativă . La început, la formarea primelor cunoștințe despre sistemele informaționale, lectura dă puțin - există mulți termeni de neînțeles, abrevieri, chiar și titlurile nu sunt toate clare. Persistența în citirea cărților, participarea la prelegeri și seminarii și comunicarea cu profesioniști ajută la completarea tezaurului. În timp, citirea materialelor site-ului devine plăcută și utilă, iar până la sfârșitul carierei tale profesionale - după ce ai scris multe articole și cărți - obținerea de noi informații utile de pe un site popular se va întâmpla mult mai rar.

Putem vorbi despre ceea ce este optim pentru aceste informații S tezaurul destinatarului, în care acesta va primi maximum de informații Is, precum și informațiile optime din mesajul „în” pentru acest tezaur Sj.În exemplul nostru, când destinatarul este un computer, un tezaur optim înseamnă că hardware-ul și software-ul instalat percep și interpretează corect pentru utilizator toate simbolurile conținute în mesajul „către” care transmit semnificația informației. S. Dacă mesajul conține caractere care nu corespund conținutului tezaurului, o parte din informații se vor pierde și valoarea Este va scadea.

Pe de altă parte, dacă știm că destinatarul nu are capacitatea de a primi texte în rusă (calculatorul său nu are driverele necesare), și nici el, nici noi nu am studiat limbi străine în care mesajul nostru poate fi trimis pentru a transmite informațiile necesare putem recurge la transliterare – scrierea textelor rusești folosind litere ale unui alfabet străin care este bine înțeles de computerul destinatarului. În acest fel vom potrivi informațiile noastre cu tezaurul computerizat disponibil destinatarului. Mesajul va arăta urât, dar destinatarul va putea citi toate informațiile necesare.

Astfel, cantitatea maximă de informații semantice este dintr-un mesaj β destinatarul dobândește prin acordul asupra conținutului său semantic S c tezaur Si,(la Si = Sj opt). Informațiile din același mesaj pot avea conținut semnificativ pentru un utilizator competent, dar pot fi lipsite de sens pentru un utilizator incompetent. Cantitatea de informații semantice dintr-un mesaj primit de utilizator este o cantitate individuală, personalizată - în contrast cu informațiile sintactice. Cu toate acestea, informația semantică este măsurată în același mod ca și informația sintactică - în biți și octeți.

O măsură relativă a cantității de informații semantice este coeficientul de conținut C, care este definit ca raportul dintre cantitatea de informații semantice și volumul de date. Vd, cuprinse în mesaj β:

C = Is / Vd

Cursul 2 la disciplina „Informatică și TIC”