Знания как особая форма информации. Отличие знаний от данных. Понятие данных, информации и знаний. Свойства знаний и отличие их от данных

Презентация без названия

Ба́за да́нных определение

Представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

База данных - совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных.

База данных - совокупность данных, организованных в соответствии с концептуальной структурой, описывающей характеристики этих данных и взаимоотношения между ними, причём такое собрание данных, которое поддерживает одну или более областей применения.

База данных - организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей.

База данных - некоторый набор перманентных (постоянно хранимых) данных, используемых прикладными программными системами какого-либо предприятия.

База данных - совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации.

База знаний

База знаний (БЗ; англ. knowledge base, KB) в информатике и исследованиях искусственного интеллекта - это особого рода база данных, разработанная для оперирования знаниями (метаданными). База знаний содержит структурированную информацию, покрывающую некоторую область знаний, для использования кибернетическим устройством (или человеком) с конкретной целью. Современные базы знаний работают совместно с системами поиска информации, имеют классификационную структуру и формат представления знаний.

Полноценные базы знаний содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации. Область наук об искусственном интеллекте, изучающая базы знаний и методы работы со знаниями, называется инженерией знаний.

Иерархический способ представления в базе знаний набора понятий и их отношений называется онтологией. Онтологию некоторой области знаний вместе со сведениями о свойствах конкретных объектов также можно назвать базой знаний.

Отличия

База знаний - семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и экспертных систем.

База данных - совокупность связанных данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, независимая от прикладных программ. База данных является информационной моделью предметной области. Обращение к базам данных осуществляется с помощью системы управления базами данных (СУБД)

Основные свойства

Основные определения. Информация, с которой имеют дело ЭВМ, разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная информация - в данных, с которыми эти программы работают. Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов - битов. Машинное слово для представления данных и машинное слово для представления команд, образующих программу, могут иметь одинаковое или разное число разрядов. Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц и выполнять операции над командами, как над данными. Содержимое памяти образует информационную базу. Машинное слово является основной характеристикой информационной базы, т.к. его длина такова, что каждое машинное слово хранится в одной стандартной ячейке памяти, снабженной индивидуальным именем - адресом ячейки. По этому имени происходит извлечение информационных единиц из памяти ЭВМ и записи их в нее. В языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом. Появление баз данных (БД) знаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно храниться большие объемы информации, а специальные средства, образующие систему управления базами данных (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из базы данных и записывать их в нужном порядке в базу. По мере развития исследований в области ИС возникла концепция знаний, которые объединили в себе многие черты процедурной и декларативной информации. В ЭВМ знания так же, как и данные, отображаются в знаковой форме - в виде формул, текста, файлов, информационных массивов и т.п. Поэтому можно сказать, что знания - это особым образом организованные данные. В системах ИИ знания являются основным объектом формирования, обработки и исследования. База знаний, наравне с базой данных, - необходимая составляющая программного комплекса ИИ. Машины, реализующие алгоритмы ИИ, называются машинами, основанными на знаниях, а подраздел теории ИИ, связанный с построением экспертных систем, - инженерией знаний. отличия между данными и знаниями: 1. внутренняя интерпретируемость знаний (например: данные – 243849..., знания – предложения естественного языка) 2. активность знаний. Если есть знания, то появления новых знаний может привести к изменению старых знаний и появлению новых. 3. связность знаний. Знания не интересны сами по себе, они интересны в совокупности (система знаний). 4. знания динамичны, а данные как правило статичны Интенсиональные знания определяются через понятие более высокого уровня с указанием специфических

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.

Классификация знаний

Трактовки знаний

Представление знаний

Тема 1. Понятие знания

Знание – это проверенный практикой результат познания действительности, отражение в сознании человека.

Знание – закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам решать задачи в этой области.

Знания – это результат, полученный познанием.

Знания – это формализованная информация, на которую ссылаются когда делают различные заключения на основе имеющихся данных с помощью логических выводов.

Знаниями называют хранимую в ЭВМ информацию, формализованную в соответствии со структурными правилами, которую можно использовать при решении проблем.

· Психологическая : Знание – психологические образы или мысленные модели.

· Интеллектуальная : Знания – совокупность сведений о некоторой предметной области, включающих факты об объектах предметной области, о свойствах объекта, и связывающих их отношений, описаний процессов протекающих в данной предметной области и содержащих информацию о решении типовых задач.

· Формально логическая : Знание – формализованная информация, используемая для получения или вывода новых знаний с помощью специализированных процедур.

· Информационно -технологическая : Знание – структурированная информация, хранящаяся в памяти ЭВМ и используемая при работе интеллектуальных систем.

1. В зависимости от источника:

a. априорные

b. накапливаемые

i. экспертные

ii. наблюдаемые

iii. выводимые

2. В зависимости от характера использования при решении задач:

a. декларативные

b. процедурные

c. метазнания

3. В зависимости от степени достоверности:

a. четкие знания

b. нечеткие знания

4. В зависимости от глубины:

i. поверхностные:

b. знании-копии

c. знания-знакомства

i. глубинные:

1.1. Априорные – закладываются в базу знаний до начала функционирования ИИС включающую эту базу знаний. Кроме того, при работе с базой знаний достоверность содержащихся в ней априорных знании непереоценивается.

1.2. Накапливаемые знания – формируются в процессе работы базы знаний. Источниками этих знаний могут быть эксперты (экспертные), внешние искусственные устройства наблюдатели (наблюдаемые), правила и процедуры вывода и верификация знаний действующих в рамках интеллектуальной системы (выводимые).

2.2. Процедурные знания – информация о способах решения типовых задач в некоторой предметной области.

2.3. Метазнания – знания о знаниях, которые сдержат общие сведения о принципах использования знаний. К уровню метазнаний также относят стратегию управления выбором и применением процедурных знаний.


3. В основе классификации знания в зависимости от степени их достоверности лежат т.н. нефакторы присущие знаниям: неполнота информации о рассматриваемом фрагменте предметной области – это неточность количественных и качественных оценок, неоднозначность правил вывода новых знаний, несогласованность некоторых положений в базе знаний.

4. Поверхностные – знания о видимых взаимосвязях объектов и явлений. Глубинные знания основываются на абстрактных аналогиях позволяющих объяснять суть явлений.


Представление знаний – выражение на к\л формальном языке свойств различных объектов и закономерностей существенных для решения задач.

Основные направления исследований, связанные с представлением знаний:

· разработка методологии построения проблемно-ориентированных математических моделей;

· разработка формального аппарата для описания таких моделей;

· разработка теорий вычислений в таких моделях;

· разработка технологий реализации программной поддержки таких моделей.

При разработке модели представлений знаний могут быть поставлены вопросы: «Что представлять?» и «Как представлять?».

Первый вопрос связан с организацией или выбором структуры знаний.

Второй связан с представлением знаний в выбранной структуре.

Состав знаний ИИС зависит от предметной области от требований и целей пользователя и от назначения структуры системы. При разработке практически любой ИИС требуется иметь следующий минимальный набор знаний:

· знания о процессе решения задач;

· знания о языке общения и способах организации диалога системы с пользователем;

· знания о проблемной области и знания о способах представления и модификации знаний.


Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их свойства.

Знания являются более сложной категорией по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

Знания получаются в результате применения к исходным данным некоторых методов обработки, подключения внешних процедур.

ДАННЫЕ + ПРОЦЕДУРА ОБРАБОТКИ = ИНФОРМАЦИЯ

ИНФОРМАЦИЯ + ПРОЦЕДУРА ОБРАБОТКИ = ЗНАНИЯ

Характерная особенность знаний состоит в том, что они не содержаться в исходной системе. Знания возникают в результате сопоставления информационных единиц, нахождения и разрешения противоречий между ними, т.е. знания активны их появление или недостача приводит к реализации некоторых действий или появлению новых знания. Знания отличаются от данных наличием следующих свойств.


1. Внутренняя интерпретация – независимость знаний от интерпретирующей программы, возможность отвечать на вопросы, касающиеся содержимого памяти. Она позволяет соотнести данные хранящиеся в памяти с их смысловым содержанием. Ее наличие обеспечивает возможность построения процедур отвечающих от имени компьютера на вопросы человека о содержимом памяти.

2, 3. Наличие внутренних и внешних структур знания . Распространение принципа деления объектов на уже выделенные компоненты целого, позволяет строить многоуровневые иерархические представления. Объекты части могут интерпретироваться независимо друг от друга, т.е. как элементы множества. Если взаимосвязь отдельных элементов частей является существенной, то ее необходимо отражать в базе знаний. На множестве объектов предметной области, как целых, так и их частей вводятся различные семантические отношения (родовидовые отношения, временные. пространственные) описывающие структуру фрагмента предметной области. Такое структурное представление предметной области является очень важным аспектом знаний, т.к. принципы декомпозиции объектов предметной области и выделения системы отношений между ними базируются на подобных механизмах человеческого мышления.

4. Шкалирование. Позволяет сопоставлять и упорядочивать качественно одинаковые, но различающиеся в количественном плане свойства и отношения объектов предметной области. В памяти человека знания об окружающем мире упорядочены, что определяются различными шкалами. Шкала представляет собой последовательность меток с каждой из которых связано значение оценки или значение некоторой величины. Выделяют следующие виды шкал: 1) Метрические, которые делятся на Абсолютные и Относительные; 2) Порядковые шкалы, которые делятся на лингвистические и оппозиционные. В метрических шкалах по расположению точек можно определить степень отличия соответствующих информационных единиц. С помощью метрических шкал можно установить количественные отношения и порядок тех или иных оценок или величин. В абсолютных метрических шкалах начало отсчета никогда не меняется. В относительных шкалах, начало отсчета меняется в каждом случае и определяется ситуацией или текущим моментом времени. В порядковых шкалах фиксируется порядок информационных единиц в лингвистических порядковых шкалах используются квантификаторы, которые служат для введения количественных или качественных мер. Такие квантификаторы как никогда, очень редко, редко, часто и т.д. В оппозиционных порядковых шкалах концы шкалы соответствуют крайним или несовместимым свойствам и отношениям объектов, которые обозначаются парами антонимов, среднее положение считается нейтральным. Примерами таких антонимов могут служить такие пары: медленный – быстрый, сильный – слабый. Шкалы задаются тремя параметрами.

Глава 1 Основные понятия

В этой книге описываются методы обработки информации, представленной в различной форме - в виде «данных», «знаний», «структур» и т. д. В основе анализа всех этих видов информации лежат две процедуры: процедура обнаружения закономерностей, содержащихся в представленной информации, и процедура использования обнаруженных закономерностей для предсказания значения одной части информации по известным значениям другой ее части. Но прежде чем переходить к описанию этих процедур, нужно пояснить смысл употребляемых в книге терминов, в частности таких распространенных, как данные, знания, гипотеза, закономерность и т. п.

§ 1. Чем отличаются «данные» от «знаний»?

Исходная информация, которую нужно обрабатывать, чаще всего имеет вид числовых таблиц (матриц), состоящих из строк и столбцов. Строки отражают информацию об изучаемых объектах или явлениях, а столбцы отражают свойства (признаки, характеристики) этих объектов или явлений. Природа объектов может быть любой - это могут быть физические тела, живые организмы, сигналы, отдельные социальные процессы, заводы, виды спорта, месторождения и т. д. Понятно, что набор признаков, описывающих эти объекты, будет в каждом случае своим и должен отражать их наиболее важные свойства.

На пересечении -й строки и -го столбца указывается значение -го признака у -го объекта. Такой факт (например, что -й дом имеет высоту 12 м) считаем атомарной частью данных о конкретном -м объекте. Полные данные об -м объекте содержатся в совокупности всех элементов -й строки. Информация же о всех заданных свойствах всех изучаемых объектов, записанная в таблице «объект-свойство», и называется таблицей данных. Таким образом, данные представляют собой совокупность отдельных конкретных фактов.

Пусть в таблице данных представлены описания большого количества жилых домов, а нас интересуют только три свойства этих домов: из какого материала они построены, в какой цвет покрашены их стены и какой они высоты. После изучения таблицы данных мы можем обнаружить некоторые закономерности. Например, выясняется, что все панельные дома, окрашенные в серый цвет, имеют высоту от 15 до 25 м, панельные зеленые дома - от 8 до 16 м, а кирпичные, вне зависимости от цвета стен, имеют высоту меньше 10 м. Обозначим признак «вид строительного материала» через . Этот признак принимает два понятных значения: (панель) или (кирпич). Признак «цвет стен», обозначаемый через принимает значения: = серый, = зеленый или = любой. Признак «высота» может принимать любое числовое значение от нуля до 30 м. Тогда обнаруженные закономерности можно сжато записать в виде таких логических высказываний:

Эти высказывания не содержат информации в виде конкретных характеристик каждого отдельного дома, но зато отражают наши знания о некоторых обобщенных характеристиках всех домов, описанных в таблице данных.

Так выглядит переход от данных к знаниям. Знания представляют собой краткое обобщенное описание основного содержания информации, представленной в данных. Знания могут быть представлены в различной форме. В дальнейшем мы будем пользоваться приведенной выше формой в виде логических правил типа «если... то...».

Отличия знаний от данных

Информация, данные, знания

Информация существует в трех видах: в виде данных (Data ), собственно информации (Information ) и знаний (Knowledge ).

При компьютерной обработке информации исходные данные понимаются как данные , и должны быть представлены в форме, которую можно хранить, обрабатывать, передавать.

Данные – зафиксированные наблюдения, которые в данный момент времени не оказывают воздействия на принятие решения.

Данные обычно представлены в форме, которая позволяет использовать их для компьютерной обработки и передачи, то есть, закодированы, могут храниться.

Примеры данных: словарь – упорядоченный набор текстовых данных, энциклопедия – упорядоченный набор данных, произвольный текст (статья, конспект).

Из данных можно извлечь информацию.

Информация – это обработанные данные, которые представлены в виде, пригодном для принятия получателем решения.

Примеры информации: извлеченное из словаря толкование слова, извлеченное из энциклопедии значение термина.

Информацией является содержание, значение данных, или факты, которые используются для принятия решения.

Знания – факты, сообщения об окружающей среде, процедуры и правила манипулирования фактами, а также информация о том, когда и как следует применять эти процедуры и правила.

В целом, знания – это проверенный практикой результат познания действительности, вид информации, которая отображает знания человека, специалиста в предметной области.

Знания различаются: есть декларативные (факты) и процедурные (правила). Декларативные, это знания об определенных явлениях, событиях, свойствах объектов («Я знаю, что…»). Процедурные, это знания о действиях, которые нужно предпринять для достижения какой-либо цели («Я знаю, как…»).

Отличия знаний от данных

1. Интерпретация . Хранимые данные могут быть интерпретированы только человеком или программой. Данные не несут информации. Знания содержат как данные, так и их описание (правила интерпретации).

2. Наличие связей классификации . Данные не имеют эффективного описания связей между различными типами данных. Знания структурированы, так как можно установить соответствие между единицами знаний.

3. Наличие ситуационных связей . Связи описывают множество текущих ситуаций объекта. Данные трудно поддаются анализу. Из структуры и состава знаний по ситуации возможно построение процедур анализа знаний.

Подходы к определению количества информации
(способы измерения информации)

В теории информации доказано, что информация допускает количественную оценку, то есть может быть измерена объективно.

Очевидно, что для этого нужно сделать допущения: в определенных условиях можно пренебречь качественными особенностями информации. Тогда количество информации может быть измерено числом, следовательно, можно сравнить количество информации, содержащейся в различных сообщениях.