Cunoașterea ca formă specială de informație. Diferența dintre cunoștințe și date. Concept de date, informații și cunoștințe. Proprietățile cunoașterii și diferența lor față de date

Prezentare fara titlu

Definirea bazei de date

Un set de materiale independente prezentate într-o formă obiectivă (articole, calcule, reglementări, hotărâri judecătorești și alte materiale similare), sistematizate în așa fel încât aceste materiale să poată fi găsite și prelucrate cu ajutorul unui calculator electronic (calculator).

Baza de date este o colecție de date stocate în conformitate cu o schemă de date, care este manipulată în conformitate cu regulile instrumentelor de modelare a datelor.

O bază de date este o colecție de date organizată conform unei structuri conceptuale care descrie caracteristicile acelor date și relațiile dintre acestea, o colecție de date care susține unul sau mai multe domenii de aplicare.

O bază de date este o colecție de date organizate în conformitate cu anumite reguli și menținute în memoria computerului, care caracterizează starea actuală a unui anumit domeniu și utilizate pentru a satisface nevoile de informare ale utilizatorilor.

O bază de date este un anumit set de date permanente (stocate permanent) utilizate de sistemele software de aplicație ale oricărei întreprinderi.

O bază de date este un set partajat de date legate logic (și o descriere a acestor date) concepute pentru a satisface nevoile de informații ale unei organizații.

Bază de cunoștințe

O bază de cunoștințe (KB) în cercetarea în domeniul informaticii și al inteligenței artificiale este un tip special de bază de date concepută pentru a funcționa cu cunoștințe (metadate). O bază de cunoștințe conține informații structurate care acoperă o anumită zonă de cunoștințe pentru a fi utilizate de un dispozitiv (sau persoană) cibernetic într-un anumit scop. Bazele moderne de cunoștințe funcționează împreună cu sistemele de regăsire a informațiilor și au o structură de clasificare și un format de prezentare a cunoștințelor.

Bazele complete de cunoștințe conțin nu numai informații faptice, ci și reguli de inferență care permit inferențe automate despre fapte nou introduse și, ca urmare, procesarea semnificativă a informațiilor. Ramura științei inteligenței artificiale care studiază bazele de cunoștințe și metodele de lucru cu cunoștințe se numește ingineria cunoașterii.

Un mod ierarhic de a reprezenta un set de concepte și relațiile lor într-o bază de cunoștințe se numește ontologie. Ontologia unei anumite zone de cunoaștere, împreună cu informații despre proprietățile unor obiecte specifice, poate fi numită și o bază de cunoștințe.

Diferențele

O bază de cunoștințe este un model semantic care descrie un domeniu și permite răspunsul la întrebări din acest domeniu, ale căror răspunsuri nu sunt prezente în mod explicit în baza de date. Baza de cunoștințe este componenta principală a sistemelor inteligente și experte.

O bază de date este o colecție de date conexe organizate după anumite reguli care oferă principii generale de descriere, stocare și manipulare, independent de programele de aplicație. O bază de date este un model de informații al unui domeniu. Bazele de date sunt accesate folosind un sistem de management al bazelor de date (DBMS)

Proprietăți de bază

Definiții de bază. Informațiile cu care se ocupă computerele sunt împărțite în procedurale și declarative. Informațiile procedurale sunt încorporate în programele care sunt executate în procesul de rezolvare a problemelor, informațiile declarative sunt încorporate în datele cu care funcționează aceste programe. Forma standard de reprezentare a informațiilor într-un computer este un cuvânt mașină, format dintr-un număr de cifre binare - biți - determinate pentru un anumit tip de computer. Cuvântul mașină pentru reprezentarea datelor și cuvântul mașină pentru reprezentarea instrucțiunilor care formează programul pot avea același sau un număr diferit de biți. Același număr de biți în cuvintele computerului pentru comenzi și date le permite să fie considerate în computer ca unități informaționale identice și să efectueze operații asupra comenzilor ca și asupra datelor. Conținutul memoriei formează o bază de informații. Cuvântul mașină este principala caracteristică a bazei de informații, deoarece lungimea sa este astfel încât fiecare cuvânt al mașinii este stocat într-o celulă de memorie standard, echipată cu un nume individual - adresa celulei. Folosind acest nume, unitățile de informații sunt extrase din memoria computerului și scrise în aceasta. Limbajele de programare de nivel înalt folosesc tipuri de date abstracte, a căror structură este specificată de programator. Apariția bazelor de date (DB) a marcat un alt pas spre organizarea muncii cu informații declarative. Bazele de date pot stoca simultan volume mari de informații, iar instrumentele speciale care formează un sistem de gestionare a bazelor de date (DBMS) vă permit să manipulați în mod eficient datele, dacă este necesar, să le preluați din baza de date și să le scrieți în ordinea necesară în baza de date. Pe măsură ce cercetarea în domeniul SI s-a dezvoltat, a apărut conceptul de cunoaștere, care a combinat multe dintre caracteristicile informațiilor procedurale și declarative. Într-un computer, cunoștințele, ca și datele, sunt afișate sub formă simbolică - sub formă de formule, text, fișiere, matrice de informații etc. Prin urmare, putem spune că cunoștințele sunt date organizate într-un mod special. În sistemele AI, cunoașterea este obiectul principal de formare, prelucrare și cercetare. O bază de cunoștințe, împreună cu o bază de date, este o componentă necesară a unui pachet software AI. Mașinile care implementează algoritmi AI se numesc mașini bazate pe cunoaștere, iar subsecțiunea teoriei AI asociată cu construcția sistemelor expert se numește ingineria cunoașterii. diferențe între date și cunoștințe: 1. interpretabilitatea internă a cunoștințelor (de exemplu: date - 243849..., cunoștințe - propoziții în limbaj natural) 2. activitate de cunoaștere. Dacă există cunoștințe, atunci apariția unor noi cunoștințe poate duce la modificări ale cunoștințelor vechi și la apariția altora noi. 3. coerența cunoștințelor. Cunoașterea nu este interesantă în sine, este interesantă în întregime (un sistem de cunoștințe). 4. cunoașterea este dinamică, iar datele sunt de obicei statice

Datele și informațiile sunt adesea echivalate, dar există o diferență semnificativă între cei doi termeni:

informație- cunoștințe referitoare la concepte și obiecte (fapte, evenimente, lucruri, procese, idei) din creierul uman;

Date- prezentarea informațiilor prelucrate adecvate pentru transmitere, interpretare sau prelucrare (fișiere informatice, documente pe hârtie, înregistrări într-un sistem informațional).

Diferența dintre informații și date este aceea că:

1) datele sunt informații fixe despre evenimente și fenomene care sunt stocate pe anumite medii, iar informațiile apar ca urmare a prelucrării datelor la rezolvarea unor probleme specifice.

De exemplu, diferite date sunt stocate în baze de date, iar la o anumită cerere, sistemul de management al bazei de date oferă informațiile necesare.

2) datele sunt purtători de informații, nu informațiile în sine.

3) Datele se transformă în informații doar atunci când o persoană devine interesată de acestea. O persoană extrage informații din date, le evaluează, le analizează și, pe baza rezultatelor analizei, ia o decizie sau alta.

Datele se transformă în informații în mai multe moduri:

Contextualizare: știm pentru ce sunt datele;

Numărarea: Prelucrăm datele matematic;

Corectare: corectăm erorile și eliminăm omisiunile;

Comprimare: Comprimăm, concentrăm, agregăm datele.

Astfel, dacă este posibilă utilizarea datelor pentru a reduce incertitudinea cunoștințelor despre un subiect, atunci datele se transformă în informații. Prin urmare, se poate susține că informațiile sunt datele utilizate.

4) Informațiile pot fi măsurate. Măsura de măsurare a conținutului informației este asociată cu o modificare a gradului de ignoranță a destinatarului și se bazează pe metodele teoriei informației.

2. Domeniul de subiect- aceasta este o parte a lumii reale, datele despre care vrem să le reflectăm în baza de date. Tematica este infinită și conține atât concepte și date esențial importante, cât și date nesemnificative sau nesemnificative. Astfel, importanța datelor depinde de alegerea domeniului.

Model de domeniu. Un model de domeniu este cunoștințele noastre despre un domeniu. Cunoașterea poate fi fie sub formă de cunoștințe informale în creierul expertului, fie exprimată formal folosind anumite mijloace. Experiența arată că modul textual de reprezentare a unui model de domeniu este extrem de ineficient. Mult mai informative și mai utile la dezvoltarea bazelor de date sunt descrierile domeniului subiectului realizate folosind notații grafice specializate. Există un număr mare de metode de descriere a unui domeniu. Cele mai cunoscute includ tehnica de analiză structurală SADT și IDEF0 bazată pe aceasta, diagramele de flux de date Gein-Sarson, tehnica de analiză orientată pe obiecte UML, etc. Modelul de domeniu descrie mai degrabă procesele care au loc în domeniul subiectului și datele utilizate. prin aceste procese. Succesul dezvoltării ulterioare a aplicațiilor depinde de cât de corect este modelată domeniul subiectului.

3. Baza de date- un set de materiale independente prezentate într-o formă obiectivă (articole, calcule, regulamente, hotărâri judecătorești și alte materiale similare), sistematizate în așa fel încât aceste materiale să poată fi găsite și prelucrate cu ajutorul unui calculator electronic (calculator).

Mulți experți subliniază greșeala comună de a folosi incorect termenul „bază de date” în loc de termenul „sistem de gestionare a bazelor de date” și subliniază necesitatea de a face distincția între aceste concepte.

Clasificarea cunoștințelor

Interpretări ale cunoștințelor

Reprezentarea cunoștințelor

Tema 1. Conceptul de cunoaștere

Cunoştinţe– acesta este un rezultat testat în practică al cunoașterii realității, o reflectare în mintea umană.

Cunoştinţe– legi ale domeniului de studiu (principii, legături, legi), obținute în urma activităților practice și a experienței profesionale, permițând specialiștilor să rezolve problemele din acest domeniu.

Cunoştinţe este rezultatul obţinut prin cunoaştere.

Cunoştinţe– aceasta este o informație oficializată la care se face referire atunci când se face diverse concluzii pe baza datelor disponibile folosind inferențe logice.

Cunoştinţe se referă la informațiile stocate într-un computer, formalizate în conformitate cu regulile structurale, care pot fi utilizate în rezolvarea problemelor.

· Psihologic: Cunoștințe – imagini psihologice sau modele mentale.

· Inteligent: Cunoașterea este o colecție de informații despre un anumit domeniu, inclusiv fapte despre obiectele domeniului, despre proprietățile obiectului și relațiile care le leagă, descrieri ale proceselor care au loc într-un anumit domeniu și care conține informații despre rezolvarea tipică. Probleme.

· Oficiallogic: Cunoștințele sunt informații oficializate utilizate pentru a obține sau a obține noi cunoștințe folosind proceduri specializate.

· Informațional-tehnologic: Cunoașterea este o informație structurată stocată în memoria computerului și utilizată în funcționarea sistemelor inteligente.

1. În funcție de sursă:

A. a priori

b. acumulate

i. expert

ii. observat

iii. ieșire

2. În funcție de natura utilizării la rezolvarea problemelor:

A. declarativ

b. procedural

c. metacunoaștere

3. În funcție de gradul de fiabilitate:

A. cunoștințe clare

b. cunoștințe neclare

4. În funcție de adâncime:

i. superficial:

b. copie de cunoștințe

c. cunoștințe-cunoscute

i. adânc:

1.1. A priori - sunt introduse în baza de cunoștințe înainte de începerea funcționării sistemului informațional informațional care include această bază de cunoștințe. În plus, atunci când se lucrează cu o bază de cunoștințe, fiabilitatea cunoștințelor a priori conținute în aceasta nu este supraestimată.

1.2. Cunoștințele acumulate se formează în timpul funcționării bazei de cunoștințe. Sursele acestor cunoștințe pot fi experți (expert), dispozitive externe de observare artificială (observabile), reguli și proceduri de inferență și verificare a cunoștințelor care funcționează în cadrul unui sistem inteligent (dedus).

2.2. Cunoștințele procedurale sunt informații despre modalități de rezolvare a problemelor tipice într-o anumită materie.

2.3. Metacunoașterea este cunoașterea despre cunoștințe care conține informații generale despre principiile utilizării cunoștințelor. Nivelul de metacunoaștere include și strategia de gestionare a selecției și aplicării cunoștințelor procedurale.


3. Clasificarea cunoștințelor în funcție de gradul de fiabilitate a acesteia se bazează pe așa-numita. non-factori inerente cunoștințelor: informațiile incomplete despre fragmentul domeniului subiectului luat în considerare sunt inexactitatea evaluărilor cantitative și calitative, ambiguitatea regulilor de deducere a noilor cunoștințe, inconsecvența unor prevederi din baza de cunoștințe.

4. Superficial – cunoştinţe despre relaţiile vizibile dintre obiecte şi fenomene. Cunoașterea profundă se bazează pe analogii abstracte care ne permit să explicăm esența fenomenelor.


Reprezentarea cunoștințelor– exprimarea într-un limbaj formal a proprietăților diverselor obiecte și modele esențiale pentru rezolvarea problemelor.

Principalele domenii de cercetare legate de reprezentarea cunoștințelor:

· dezvoltarea unei metodologii de construire a modelelor matematice orientate spre probleme;

· dezvoltarea unui aparat formal de descriere a unor astfel de modele;

· dezvoltarea teoriilor de calcul în astfel de modele;

· dezvoltarea tehnologiilor pentru implementarea suportului software pentru astfel de modele.

Când se dezvoltă un model de reprezentare a cunoștințelor, pot fi puse întrebări: „Ce să reprezinte?” și „Cum să prezint?”

Prima problemă se referă la organizarea sau alegerea structurii cunoștințelor.

Al doilea este legat de reprezentarea cunoștințelor în structura aleasă.

Compoziția cunoștințelor despre sistemul informațional depinde de domeniul de studiu, de cerințele și obiectivele utilizatorului și de scopul structurii sistemului. Când dezvoltați aproape orice sistem de informații informaționale, trebuie să aveți următorul set minim de cunoștințe:

· cunoștințe despre procesul de rezolvare a problemelor;

· cunoașterea limbajului de comunicare și a modalităților de organizare a dialogului între sistem și utilizator;

· cunoștințe despre domeniul problemei și cunoștințe despre modalități de reprezentare și modificare a cunoștințelor.


Date apelați informații de natură faptică care descriu obiecte, procese și fenomene ale domeniului subiectului, precum și proprietățile acestora.

Cunoştinţe sunt o categorie mai complexă în comparație cu datele. Cunoașterea descrie nu numai fapte individuale, ci și relațiile dintre ele, motiv pentru care cunoștințele sunt uneori numite date structurate. Cunoașterea este rezultatul activității mentale a unei persoane care vizează generalizarea experienței sale dobândite ca urmare a activității practice.

Cunoștințele sunt obținute ca urmare a aplicării anumitor metode de prelucrare la datele sursă și a conectării procedurilor externe.

DATE + PROCEDURA DE PRELUCRARE = ​​INFORMAȚII

INFORMAȚIE + PROCEDURA DE PRELUCRARE = ​​CUNOAȘTERE

O trăsătură caracteristică a cunoașterii este că nu este conținută în sistemul sursă. Cunoașterea ia naștere ca urmare a comparării unităților informaționale, a găsirii și soluționării contradicțiilor dintre ele, i.e. cunoștințele sunt active; apariția sau lipsa acesteia duce la implementarea anumitor acțiuni sau la apariția unor noi cunoștințe. Cunoștințele diferă de date prin faptul că au următoarele proprietăți.


1. Interpretare internă – independența cunoștințelor față de programul de interpretare, capacitatea de a răspunde la întrebări referitoare la conținutul memoriei. Vă permite să corelați datele stocate în memorie cu conținutul său semantic. Prezența sa face posibilă construirea de proceduri care să răspundă la întrebările umane despre conținutul memoriei în numele computerului.

2, 3. Disponibilitatea structurilor de cunoștințe interne și externe. Extinderea principiului împărțirii obiectelor în componente deja identificate ale întregului face posibilă construirea reprezentărilor ierarhice pe mai multe niveluri. Obiectele părți pot fi interpretate independent unul de celălalt, de exemplu. ca elemente ale unui set. Dacă relația dintre elementele individuale ale părților este semnificativă, atunci trebuie reflectată în baza de cunoștințe. Pe o varietate de obiecte din domeniul subiectului, atât întregi, cât și părți ale acestora, sunt introduse diverse relații semantice (relații generice, temporale, spațiale) care descriu structura unui fragment din domeniul subiectului. O astfel de reprezentare structurală a disciplinei este un aspect foarte important al cunoașterii, deoarece principiile descompunerii obiectelor dintr-un domeniu de studiu și identificarea sistemului de relații dintre ele se bazează pe mecanisme similare ale gândirii umane.

4. Scalare. Vă permite să comparați și să organizați proprietăți și relații calitativ identice, dar diferite cantitativ, ale obiectelor din domeniul subiectului. În memoria umană, cunoștințele despre lumea din jurul nostru sunt ordonate, care sunt determinate de diverse scări. Scala este o succesiune de note, fiecare dintre acestea fiind asociată cu o valoare de evaluare sau cu valoarea unei anumite cantități. Se disting următoarele tipuri de scale: 1) Metric, care se împart în Absolut și Relativ; 2) Scale ordinale, care se împart în lingvistice și opoziționale. În scalele metrice, prin locația punctelor, puteți determina gradul de diferență între unitățile de informații corespunzătoare. Folosind scale metrice, puteți stabili relații cantitative și ordinea anumitor estimări sau cantități. În scalele metrice absolute, originea nu se schimbă niciodată. La scări relative, originea variază în fiecare caz și este determinată de situație sau de momentul actual în timp. ÎN ordinal scalele fixează ordinea unităţilor informaţionale în lingvistic Scalele ordinale folosesc cuantificatori care servesc la introducerea unor măsuri cantitative sau calitative. Astfel de cuantificatori nu sunt niciodată, foarte rar, rar, des etc. ÎN scale ordinale opoziţionale capetele scalei corespund proprietăților și relațiilor extreme sau incompatibile ale obiectelor, care sunt indicate prin perechi de antonime, poziția de mijloc este considerată neutră. Exemple de astfel de antonime sunt următoarele perechi: lent - rapid, puternic - slab. Scalele sunt specificate de trei parametri.

Capitolul 1 Concepte de bază

Această carte descrie metode de prelucrare a informațiilor prezentate sub diferite forme - sub formă de „date”, „cunoaștere”, „structuri” etc. Analiza tuturor acestor tipuri de informații se bazează pe două procedee: procedura de detectare a tiparelor conținute în informațiile prezentate și procedura de utilizare a modelelor descoperite pentru a prezice valoarea unei informații din valorile cunoscute ale altei piese. Dar înainte de a trece la descrierea acestor proceduri, este necesar să clarificăm semnificația termenilor folosiți în carte, în special a celor obișnuiți precum date, cunoștințe, ipoteze, model etc.

§ 1. Cum diferă „date” de „cunoaștere”?

Informațiile sursă care trebuie procesate cel mai adesea iau forma unor tabele numerice (matrici) formate din rânduri și coloane. Siruri de caractere reflectă informații despre obiectele sau fenomenele studiate și coloanele reflectă proprietățile (semnele, caracteristicile) acestor obiecte sau fenomene. Natura obiectelor poate fi orice - acestea pot fi corpuri fizice, organisme vii, semnale, procese sociale individuale, fabrici, sporturi, depozite etc. Este clar că setul de caracteristici care descriu aceste obiecte va fi diferit în fiecare caz și ar trebui să fie reflectă proprietățile lor cele mai importante.

La intersecția rândului al treilea și coloanei a treia este indicată valoarea celui de-al treilea atribut al celui de-al treilea obiect. Considerăm un astfel de fapt (de exemplu, că acea casă are o înălțime de 12 m) ca o parte atomică a datelor despre un anumit obiect. Datele complete despre al-lea obiect sunt conținute în totalitatea tuturor elementelor din al-lea rând. Informațiile despre toate proprietățile specificate ale tuturor obiectelor studiate, înregistrate în tabelul „obiect-proprietate”, se numesc tabel de date. Astfel, datele sunt o colecție de fapte specifice individuale.

Lăsați tabelul de date să conțină descrieri ale unui număr mare de clădiri rezidențiale și ne interesează doar trei proprietăți ale acestor case: din ce material sunt construite, din ce culoare sunt pictați pereții și cât de înalți sunt. După examinarea tabelului de date, putem descoperi câteva modele. De exemplu, se dovedește că toate casele cu panouri vopsite cu gri au o înălțime de 15 până la 25 m, casele cu panouri verzi - de la 8 până la 16 m, iar casele din cărămidă, indiferent de culoarea pereților, au o înălțime mai mică de 10. m. Să notăm semnul „tip de material de construcție” prin . Acest semn capătă două semnificații clare: (panou) sau (cărămidă). Semnul „culoarea peretelui”, notat cu ia următoarele valori: = gri, = verde sau = orice. Atributul „înălțime” poate lua orice valoare numerică de la zero la 30 m. Apoi, modelele descoperite pot fi scrise concis sub forma următoarelor afirmații logice:

Aceste declarații nu conțin informații sub forma caracteristicilor specifice fiecărei case individuale, dar reflectă cunoștințele noastre despre unele caracteristici generale ale tuturor caselor descrise în tabelul de date.

Așa arată tranziția de la date la cunoaștere. Cunoașterea este o descriere scurtă și generalizată a conținutului principal al informațiilor reprezentate în date. Cunoștințele pot fi prezentate sub diferite forme. În viitor, vom folosi forma de mai sus sub forma unor reguli logice precum „dacă... atunci...”.

Diferențele dintre cunoștințe și date

Informații, date, cunoștințe

Informațiile există în trei forme: ca date ( Date), informația în sine ( informație) și cunoștințe ( Cunoştinţe).

În prelucrarea informatică a informațiilor, datele inițiale sunt înțelese ca dateși trebuie prezentate într-o formă care poate fi stocată, procesată și transmisă.

Date– observații înregistrate care la un moment dat nu au impact asupra luării deciziilor.

Datele sunt de obicei prezentate într-o formă care le permite să fie utilizate pentru procesarea și transmiterea computerizată, adică sunt codificate și pot fi stocate.

Exemple de date: dicționar - un set ordonat de date text, enciclopedie - un set ordonat de date, text liber (articol, rezumat).

Informațiile pot fi extrase din date.

informație– este vorba de date prelucrate care sunt prezentate într-o formă adecvată pentru luarea deciziilor de către destinatar.

Exemple de informații: interpretarea unui cuvânt extras dintr-un dicționar, sensul unui termen extras dintr-o enciclopedie.

Informația este conținutul, semnificația datelor sau faptele care sunt utilizate pentru a lua o decizie.

Cunoştinţe– fapte, mesaje de mediu, proceduri și reguli pentru manipularea faptelor și informații despre când și cum ar trebui aplicate aceste proceduri și reguli.

În general, cunoașterea este un rezultat testat în practică al cunoașterii realității, un tip de informație care reflectă cunoștințele unei persoane, un specialist în domeniu.

Cunoașterea diferă: există declarative (fapte) și procedurale (reguli). Declarativ este cunoașterea anumitor fenomene, evenimente, proprietăți ale obiectelor („Știu că...”). Procedural este cunoștințele despre acțiunile care trebuie întreprinse pentru a atinge un scop („Știu cum...”).

Diferențele dintre cunoștințe și date

1. Interpretare. Datele stocate pot fi interpretate doar de un om sau de un program. Datele nu conțin informații. Cunoașterea conține atât date, cât și descrierea acestora (reguli de interpretare).

2. Disponibilitatea link-urilor de clasificare. Datele nu descriu în mod eficient relațiile dintre diferitele tipuri de date. Cunoașterea este structurată deoarece este posibil să se stabilească o corespondență între unitățile de cunoaștere.

3. Disponibilitatea conexiunilor situaționale. Conexiunile descriu multe situații curente ale unui obiect. Datele sunt greu de analizat. Din structura și compoziția cunoștințelor în funcție de situație, se pot construi proceduri de analiză a cunoștințelor.

Abordări pentru determinarea cantității de informații
(metode de măsurare a informațiilor)

Teoria informației a demonstrat că informația poate fi cuantificată, adică poate fi măsurată în mod obiectiv.

Evident, pentru aceasta este necesar să se facă presupuneri: în anumite condiții, trăsăturile calitative ale informațiilor pot fi neglijate. Cantitatea de informații poate fi apoi măsurată numeric, prin urmare cantitatea de informații conținute în diferite mesaje poate fi comparată.