Лекция: Кодирование информации. Способы кодирования. Кодирование информации - учебная и научная деятельность анисимова владимира викторовича

Cтраница 1

Способы кодирования и передачи информации в различных системах различны. Например, в отечественной системе АТСК для этой цели используют быстродействующий многочастотный код. Каждая цифра абонентского номера передается из регистра в маркер по разговорным проводам кратковременной посылкой токов двух из шести заданных ча-етот. Таким образом, с помощью различных комбинаций двух частот из шести обеспечивается возможность передачи любой Цифры, содержащейся в абонентском номере, зафиксированном в приемнике информации. По окончании соединения в пределах всего коммутируемого тракта регистр отключается и может устанавливать новое соединение.

Способы кодирования числовой информации - способы счета и представления чисел - в истории человечества последовательно менялись. Следы древних систем счета и представления чисел встречаются и сегодня в культуре и обычаях многих народов. К древнему Вавилону восходит деление часа на 60 минут и угла на 360 градусов. Например, часто пишут XIX век, XX век вместо 19 век и 20 век. К англосаксам - жителям Британских островов - восходит традиция счета дюжинами: в году 12 месяцев, в футе 12 дюймов, сутки делятся на два периода по 12 часов.

Способы кодирования десятичной информации определяются тлпом выбранных для ее хранения и обработки физических устройств, возможностью создания простых схем машины, возможностью организации контроля и некоторыми другими соображениями. Необходимо отметить, что выбор физических устройств и способов кодирования представляет собой сложную задачу, которая не имеет однозначного решения. Этим объясняется боль-шов разнообразие способов представления и кодирования информации в существующих моделях ЭКВМ. Рассмотрим наиболее распространенные из них.

Какие способы кодирования информации вам известны.

Различные более хитрые способы кодирования десятичных цифр внутри тетрады обусловлены избыточностью кодирования и применяются для автоматического обнаружения ошибок и сбоев в вычислениях.

Представлены некоторые способы кодирования цифровых сигналов, получаемых из аналоговых при аналого-цифровых преобразованиях. Эти способы учитывают особенности и свойства аналого-цифровых преобразований и рассматриваемых исходных аналоговых сигналов. Показано, что такой учет приводит к существенному сокращению длины кодовых слов.

Излагаются некоторые способы кодирования цифровых сигналов, отвечающих аналоговым сигналам с полным амплитудным ограничением. Эти способы основаны на принципе локального кодирования Лупанова и учитывают особенности и свойства как исходных аналоговых сигналов, так и применяемых аналого-цифровых преобразований. Проведенный в работе анализ получающихся кодов показывает, что представленные способы кодирования позволяют добиться существенного сжатия, информации - в смысле сокращения длин кодов.

Применяемые программные языки и способы кодирования этих языков для нанесения на программоноситель зависят прежде всего от той системы счисления, в которой задается станку числовая информация, определяющая требуемые размеры перемещений его рабочих органов, задаваемые каждым кадром программы.

Для отрицательных чисел применяют способы кодирования прямой, дополнительный и обратный коды. При этом заметим, что при выбранном ранее способе кодирования знаков чисел двоичными цифрами (плюс цифрой 0, а минус цифрой 1) любой код положительного числа совпадает с самим числом.

Векторное и фрактальное изображения.

Векторное изображение - это графический объект, состоящий из элементарных отрезков и дуг. Базовым элементом изоражения является линия. Как и любой объект, она обладает свойствами: формой (прямая, кривая), толщиной., цветом, начертанием (пунктирная, сплошная). Замкнутые линии имеют свойство заполнения (или другими объектами, или выбранным цветом). Все прочие объекты векторной графики составляются из линий. Так как линия описывается математически как единый объект, то и объем данных для отображения объекта средствами векторной графики значительно меньше, чем в растровой графике. Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами.

К программным средствам создания и обработки векторной графики относятся следующие ГР: CorelDraw, Adobe Illustrator, а также векторизаторы (трассировщики) - специализированные пакеты преобразования растровых изображений в векторные.

Фрактальная графика основывается на математических вычислениях, как и векторная. Но в отличии от векторной ее базовым элементом является сама математическая формула. Это приводит к тому, что в памяти компьютера не хранится никаких объектов и изображение строится только по уравнениям. При помощи этого способа можно строить простейшие регулярные структуры, а также сложные иллюстрации, которые иммитируют ландшафты.

Задачи.

Известно, что видеопамять компьютера имеет объем 512 Кбайт. Разрешающая способность экрана 640 на 200. Сколько страниц экрана одновременно разместится в видеопамяти при палитре
а) из 8 цветов;
б) 16 цветов;
в) 256 цветов?

Сколько бит требуется, чтобы закодировать информацию о 130 оттенках? Нетрудно подсчитать, что 8 (то есть 1 байт), поскольку при помощи 7 бит можно сохранить номер оттенка о 0 до 127, а 8 бит хранят от 0 до 255. Легко видеть, что такой способ кодирования неоптимален: 130 заметно меньше 255. Подумайте, как уплотнить информацию о рисунке при его записи в файл, если известно, что
а) в рисунке одновременно содержится только 16 цветовых оттенков из 138 возможных;
б) в рисунке присутствуют все 130 оттенков одновременно, но количество точек, закрашенных разными оттенками, сильно различаются.

А) очевидно, что для хранения информации о 16 оттенках достаточно 4 бита (половина байта). Однако так как эти 16 оттенков выбраны из 130, то они могут иметь номера, не умещающиеся в 4 битах. Поэтому воспользуемся методом палитр. Назначим 16 используемым в нашем рисунке оттенкам свои “локальные” номера от 1 до 15 и закодируем весь рисунок из расчета 2 точки на байт. А затем допишем к этой информации (в конец содержащего ее файла) таблицу соответствия, состоящую из 16 пар байтов с номерами оттенков: 1 байт - наш “локальный” номер в данном рисунке, второй - реальный номер данного оттенка. (когда вместо последнего используется закодированная информация о самом оттенке, например, сведения об яркости свечения “электроннык пушек” Red, Green, Blue электронно-лучевой трубки, то такая таблица и будет представлять собой палитру цветов). Если рисунок достаточно велик, выигрыш в объеме полученного файла будет значительным;
б) попытаемся реализовать простейший алгоритм архивации информации о рисунке. Назначим трем оттенкам, которыми закрашено минимальное количество точек, коды 128 - 130, а остальным оттенкам - коды 1 -127. Будем записывать в файл (котрый в этом случае представлыет собой не последовательность байтов, а сплошной битовый поток) семибитные коды для оттенков с номерами от 1 до 127. Для оставшихся же трех оттенков в битовом потоке будем записывать число-признак - семибитный 0 - и сразу за ним двухбитный “локальный” номер, а в конце файла добавим таблицу соответствия “локальных”и реальных номеров. Так как оттенки с кодами 128 - 130 встречаются редко, то семибитных нулей будет немного.

Заметим, что постановка вопросов в данной задаче не исключает и другие варианты решения, без привязки к цветовому составу изображения - архивацию:
а) на основе выделения последовательности точек, закрашенных одинаковыми оттенками и замены каждой из этих последовательностей на пару чисел (цвет),(количество) (этот принцип лежит в основе графического формата РСХ);
б) путем сравнения пиксельных строк (запись номеров оттенков точек первой страницы целиком, а для последующих строк запись номеров оттенков только тех точек, оттенки которых отличаются от отенков точек, стоящих в той же позиции в предыдущей строке, - это основа формата GIF);
в) с помощью фрактального алгоритма упаковки изображений (формат YPEG). (ИО 6,1999)

Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, завывание ветра и шелест листьев, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют люди начали догадываться очень давно. Еще древнегреческий философ и ученый - энциклопедист Аристотель, исходя из наблюдений, объяснял природу звука, полагая, что звучащее тело создает попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то разряжает, то уплотняет воздух, а из-за упругости воздуха эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны. Достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

На слух человек воспринимает упругие волны, имеющие частоту где-то в пределах от 16 Гц до 20 кГц (1 Гц - 1 колебание в секунду). В соответствии с этим упругие волны в любой среде, частоты которых лежат в указанных пределах, называют звуковыми волнами или просто звуком. В учении о звуке важны такие понятия как тон и тембр звука. Всякий реальный звук, будь то игра музыкальных инструментов или голос человека, - это своеобразная смесь многих гармонических колебаний с определенным набором частот.

Колебание, которое имеет наиболее низкую частоту, называют основным тоном, другие - обертонами.

Тембр - разное количество обертонов, присущих тому или иному звуку, которое придает ему особую окраску. Отличие одного тембра от другого обусловлено не только числом, но и интенсивностью обертонов, сопровождающих звучание основного тона. Именно по тембру мы легко можем отличить звуки рояля и скрипки, гитары и флейты, узнать голос знакомого человека.

Музыкальный звук можно характеризовать тремя качествами: тембром, т. е. окраской звука, которая зависит от формы колебаний, высотой, определяющейся числом колебаний в секунду (частотой), и громкостью, зависящей от интенсивности колебаний.

Компьютер широко применяют в настоящее время в различных сферах. Не стала исключением и обработка звуковой информации, музыка. До 1983 года все записи музыки выходили на виниловых пластинках и компакт-кассетах. В настоящее время широкое распространение получили компакт-диски. Если имеется компьютер, на котором установлена студийная звуковая плата, с подключенными к ней MIDI-клавиатурой и микрофоном, то можно работать со специализированным музыкальным программным обеспечением.

Условно его можно разбить на несколько видов:

1) всевозможные служебные программы и драйверы, предназначенные для работы с конкретными звуковыми платами и внешними устройствами;
2) аудиоредакторы, которые предназначены для работы со звуковыми файлами, позволяют производить с ними любые операции - от разбиения на части до обработки эффектами;
3) программные синтезаторы, которые появились сравнительно недавно и корректно работают только на мощных компьютерах. Они позволяют экспериментировать с созданием различных звуков;
и другие.

К первой группе относятся все служебные программы операционной системы. Так, например, win 95 и 98 имеют свои собственные программы микшеры и утилиты для воспроизведения/записи звука, проигрывания компакт-дисков и стандартных MIDI - файлов. Установив звуковую плату можно при помощи этих программ проверить ее работоспособность. Например, программа Фонограф предназначена для работы с wave-файлами (файлы звукозаписи в формате Windows). Эти файлы имеют расширение.WAV . Эта программа предоставляет возможность воспроизводить, записывать и редактировать звукозапись приемами, аналогичными приемам работы с магнитофоном. Желательно для работы с Фонографом подключить микрофон к компьютеру. Если необходимо сделать звукозапись, то нужно определиться с качеством звука, так как именно от нее зависит продолжительность звукозаписи. Возможная продолжительность звучания тем меньше, чем выше качество записи. При среднем качестве записи можно удовлетворительно записывать речь, создавая файлы продолжительностью звучания до 60 секунд. Примерно 6 секунд будет продолжительность записи, имеющая качество музыкального компакт - диска.

А как же происходит кодирование звука? С самого детства мы сталкиваемся с записями музыки на разных носителях: грампластинках, кассетах, компакт-дисках и т.д. В настоящее время существует два основных способах записи звука: аналоговый и цифровой. Но для того чтобы записать звук на какой-нибудь носитель его нужно преобразовать в электрический сигнал.

Это делается с помощью микрофона. Самые простые микрофоны имеют мембрану, которая колеблется под воздействием звуковых волн. К мембране присоединена катушка, перемещающаяся синхронно с мембраной в магнитном поле. В катушке возникает переменный электрический ток. Изменения напряжения тока точно отражают звуковые волны.

Переменный электрический ток, который появляется на выходе микрофона, называется аналоговым сигналом. Применительно к электрическому сигналу «аналоговый» обозначает, что этот сигнал непрерывен по времени и амплитуде. Он точно отражает форму звуковой волны, которая распространяется в воздухе.

Звуковую информацию можно представить в дискретной или аналоговой форме. Их отличие в том, что при дискретном представлении информации физическая величина изменяется скачкообразно («лесенкой»), принимая конечное множество значений. Если же информацию представить в аналоговой форме, то физическая величина может принимать бесконечное количество значений, непрерывно изменяющихся.

Виниловая пластинка является примером аналогового хранения звуковой информации, так как звуковая дорожка свою форму изменяет непрерывно. Но у аналоговых записей на магнитную ленту есть большой недостаток - старение носителя. За год фонограмма, которая имела нормальный уровень высоких частот, может их потерять. Виниловые пластинки при проигрывании их несколько раз теряют качество. Поэтому преимущество отдают цифровой записи.

В начале 80-х годов появились компакт-диски. Они являются примером дискретного хранения звуковой информации, так как звуковая дорожка компакт - диска содержит участки с различной отражающей способностью. Теоретически эти цифровые диски могут служить вечно, если их не царапать, т.е. их преимуществами являются долговечность и неподверженность механическому старению. Другое преимущество заключается в том, что при цифровой перезаписи нет потери качества звука.

На мультимедийных звуковых картах можно найти аналоговые микрофонный предусилитель и микшер.

Цифро-аналоговое и аналого-цифровое преобразование звуковой информации.

Кратко рассмотрим процессы преобразования звука из аналоговой формы в цифровую и наоборот. Примерное представление о том, что происходит в звуковой карте, может помочь избежать некоторых ошибок при работе со звуком

Звуковые волны при помощи микрофона превращаются в аналоговый переменный электрический сигнал. Он проходит через звуковой тракт (см. приложения рисунок 1.11, схема 1) и попадает в аналого-цифровой преобразователь (АЦП) - устройство, которое переводит сигнал в цифровую форму.

В упрощенном виде принцип работы АЦП заключается в следующем: он измеряет через определенные промежутки времени амплитуду сигнала и передает дальше, уже по цифровому тракту, последовательность чисел, несущих информацию об изменениях амплитуды (.см. приложения рисунок 1.11, схема 2).

Во время аналого-цифрового преобразования никакого физического преобразования не происходит. С электрического сигнала как бы снимается отпечаток или образец, являющийся цифровой моделью колебаний напряжения в аудиотракте. Если это изобразить в виде схемы, то эта модель представлена в виде последовательности столбиков, каждый из которых соответствует определенному числовому значению. Цифровой сигнал по своей природе дискретен - то есть прерывист, поэтому цифровая модель не совсем точно соответствует форме аналогового сигнала.

Семпл - это промежуток времени между двумя измерениями амплитуды аналогового сигнала.

Дословно Sample переводится с английского как «образец». В мультимедийной и профессиональной звуковой терминологии это слово имеет несколько значений. Кроме промежутка времени семплом называют также любую последовательность цифровых данных, которые получили путем аналого-цифрового преобразования. Сам процесс преобразования называют семплированием. В русском техническом языке называют его дискретизацией.

Вывод цифрового звука происходит при помощи цифро-аналогового преобразователя (ЦАП), который на основании поступающих цифровых данных в соответствующие моменты времени генерирует электрический сигнал необходимой амплитуды (см. приложения рисунок 1.11, схема 3).

Параметры семплирования

Важными параметрами семплирования являются частота и разрядность.
Частота - количество измерений амплитуды аналогового сигнала в секунду.

Если частота семплирования не будет более чем в два раза превышать частоту верхней границы звукового диапазона, то на высоких частотах будут происходить потери. Это объясняет то, что стандартная частота для звукового компакт-диска - это частота 44.1 кГц. Так как диапазон колебаний звуковых волн находится в пределах от 20 Гц до 20 кГц, то количество измерений сигнала в секунду должно быть больше, чем количество колебаний за тот же промежуток времени. Если же частота дискретизации значительно ниже частоты звуковой волны, то амплитуда сигнала успевает несколько раз измениться за время между измерениями, а это приводит к тому, что цифровой отпечаток несет хаотичный набор данных. При цифро-аналоговом преобразовании такой семпл не передает основной сигнал, а только выдает шум.

В новом формате компакт-дисков Audio DVD за одну секунду сигнал измеряется 96 000 раз, т.е. применяют частоту семплирования 96 кГц. Для экономии места на жестком диске в мультимедийных приложениях довольно часто применяют меньшие частоты: 11, 22, 32 кГц. Это приводит к уменьшению слышимого диапазона частот, а, значит, происходит сильное искажение того, что слышно.

Если в виде графика представить один и тот же звук высотой 1 кГц (нота до седьмой октавы фортепиано примерно соответствует этой частоте), но семплированный с разной частотой (нижняя часть синусоиды не показана на всех графиках), то будут видны различия. Одно деление на горизонтальной оси, которая показывает время, соответствует 10 семплам. Масштаб взят одинаковый см. приложения рисунок 1.13). Можно видеть, что на частоте 11 кГц примерно пять колебаний звуковой волны приходится на каждые 50 семплов, то есть один период синусоиды отображается всего при помощи 10 значений. Это довольно неточная передача. В то же время, если рассматривать частоту оцифровки 44 кГц, то на каждый период синусоиды приходится уже почти 50 семплов. Это позволяет получить сигнал хорошего качества.

Разрядность указывает с какой точностью происходят изменения амплитуды аналогового сигнала. Точность, с которой при оцифровке передается значение амплитуды сигнала в каждый из моментов времени, определяет качество сигнала после цифро-аналогового преобразования. Именно от разрядности зависит достоверность восстановления формы волны.

Для кодирования значения амплитуды используют принцип двоичного кодирования. Звуковой сигнал должен быть представленным в виде последовательности электрических импульсов (двоичных нулей и единиц). Обычно используют 8, 16-битное или 20-битное представление значений амплитуды. При двоичном кодировании непрерывного звукового сигнала его заменяют последовательностью дискретных уровней сигнала. От частоты дискретизации (количества измерений уровня сигнала в единицу времени) зависит качество кодирования. С увеличением частоты дискретизации увеличивается точность двоичного представления информации. При частоте 8 кГц (количество измерений в секунду 8000) качество семплированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц (количество измерений в секунду 48000) - качеству звучания аудио- CD.

Если использовать 8-битное кодирование, то можно достичь точность изменения амплитуды аналогового сигнала до 1/256 от динамического диапазона цифрового устройства (2 8 = 256).

Если использовать 16-битное кодирование для представления значений амплитуды звукового сигнала, то точность измерения возрастет в 256 раз.

В современных преобразователях принято использовать 20-битное кодирование сигнала, что позволяет получать высококачественную оцифровку звука.

Вспомним формулу К = 2 a . Здесь К - количество всевозможных звуков (количество различных уровней сигнала или состояний), которые можно получить при помощи кодирования звука а битами

С появлением технических средств хранения и передачи информации возникли новые идеи и приемы кодирования.

Первым техническим средством передачи информации на расстояние стал телеграф, изобретенный в \(1837\) году американцем Сэмюэлем Морзе.

Телеграфное сообщение - это последовательность электрических сигналов, передаваемая от одного телеграфного аппарата по проводам к другому телеграфному аппарату.

Эти технические обстоятельства привели Морзе к идее использования всего двух видов сигналов - короткого и длинного - для кодирования сообщения, передаваемого по линиям телеграфной связи.

Такой способ кодирования получил название азбуки Морзе . В ней каждая буква алфавита кодируется последовательностью коротких сигналов (точек) и длинных сигналов (тире). Буквы отделяются друг от друга паузами - отсутствием сигналов. В кодовой таблице ниже показана азбука Морзе применительно к русскому алфавиту. Специальных знаков препинания в ней нет. Их обычно записывают словами: «тчк» - точка, «зпт» - запятая и т. п.

Кодовая таблица - это соответствие между набором знаков (символов) и их кодами.

Самым знаменитым телеграфным сообщением является сигнал бедствия «SOS » (S ave O ur S ouls - спасите наши души ).

Вот как он выглядит в коде азбуки Морзе:
Три точки обозначают букву S, три тире - букву О. Две паузы отделяют буквы друг от друга.

Характерной особенностью азбуки Морзе является переменная длина кода разных букв, поэтому код Морзе называют неравномерным кодом . Буквы, которые встречаются в тексте чаще, имеют более короткий код, чем редкие буквы. Например, код буквы «Е» - одна точка, а код буквы «Ъ» состоит из шести знаков. Зачем так сделано? Чтобы сократить длину всего сообщения. Но из-за переменной длины кода букв возникает проблема отделения букв друг от друга в тексте. Поэтому приходится для разделения использовать паузу (пропуск). Следовательно, телеграфный алфавит Морзе является троичным, так как в нём используется три знака: точка, тире, пропуск.

Азбука Морзе - неравномерный телеграфный код, где каждая буква и знак представлены при помощи длинных и коротких сигналов, так называемых «тире» и «точек».

Равномерный телеграфный код был изобретен французом Жаном Морисом Бодо в конце \(XIX\) века. В нём использовалось всего два вида сигналов. Неважно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала.

В коде Бодо длина кодов всех символов алфавита одинакова и равна пяти. В таком случае не возникает проблемы отделения букв друг от друга: каждая пятерка сигналов - это знак текста.

Код Бодо - это первый в истории техники способ двоичного кодирования информации. Благодаря идее Бодо удалось автоматизировать процесс передачи и печати букв. Был создан клавишный телеграфный аппарат. Нажатие клавиши с определенной буквой вырабатывает соответствующий пятиимпульсный сигнал, который передается по линии связи. Принимающий аппарат под воздействием этого сигнала печатает ту же букву на бумажной ленте.

Код Бодо - равномерный телеграфный \(5\) -битный код, использующий два отличающихся друг от друга электрических сигнала.

Свойства информации

Информация обладает следующими свойствами:

достоверность
полнота
точность
ценность
своевременность
понятность
доступность
краткость и т. д.

4) Классификация - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

1. Информацию можно подразделить по форме представления на 2 вида:
- дискретная форма представления информации- аналоговая или непрерывная форма представления информации

2. По области возникновения можно выделить информацию:
- элементарную- биологическую- социальную

3. По способу передачи и восприятия различают следующие виды информации:
- визуальную- аудиальную- тактильную- органолептическую- машинную

4. Информацию, создаваемую и используемую человеком, по общественному назначению можно разбить на три вида:
- личную- массовую- специальную

5. По способам кодирования выделяют следующие типы информации:
- символьную- текстовую- графическую.

5) Содержательный подход к измерению информации. Сообщение – информативный поток, который в процессе передачи информации поступает к приемнику. Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными Информация - знания человека? сообщение должно быть информативно. Если сообщение не информативно, то количество информации с точки зрения человека = 0. (Пример: вузовский учебник по высшей математике содержит знания, но они не доступны 1-класснику)

Алфавитный подход к измерению информации не связывает кол-во информации с содержанием сообщения. Алфавитный подход - объективный подход к измерению информации. Он удобен при использовании технических средств работы с информацией, т.к. не зависит от содержания сообщения. Кол-во информации зависит от объема текста и мощности алфавита. Ограничений на max мощность алфавита нет, но есть достаточный алфавит мощностью 256 символов. Этот алфавит используется для представления текстов в компьютере. Поскольку 256=2 8 , то 1символ несет в тексте 8 бит информации.

Вероятностный подход к измерения информации. Все события происходят с различной вероятностью, но зависимость между вероятностью событий и количеством информации, полученной при совершении того или иного события можно выразить формулой которую в 1948 году предложил Шеннон.

6) Количество информации – в теории информации это количество информации в одном случайном объекте относительно другого

Количество информации можно рассматривать как меру уменьшения неопределенности знания при получении информационных сообщений.

При всем многообразии подходов к определению понятия информации, с позиции измерения информации выделяют два из них: определение К. Шеннона, применяемое в математической теории информации (содержательный подход), и определение А. Н. Колмогорова, применяемое в отраслях информатики, связанных с использованием компьютеров (алфавитный подход).

Содержательный подход. Согласно Шеннону, информативность сообщения характеризуется содержащейся в нем полезной информацией - той частью сообщения, которая снимает полностью или уменьшает неопределенность какой-либо ситуации. По Шеннону, информация - уменьшение неопределенности наших знаний.

Но если число исходов не зависит от суждений людей (случай бросания кубика или монеты), то информация о наступлении одного из возможных исходов является объективной.

Если сообщение уменьшило неопределенность знаний ровно в два раза, то говорят, что сообщение несет 1 бит информации.

1 бит - объем информации такого сообщения, которое уменьшает неопределенность знания в два раза.

Алфавитный подход. Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита.

Алфавит - упорядоченный набор символов, используемый для кодирования сообщений на некотором языке.

I – количество информации

N - количество разных событий.

Обратная формула N=2 I

7) Как уже было сказано, основная единица измерения информации - бит. 8 бит составляют 1 байт.

Наряду с байтами для измерения количества информации используются более крупные единицы:

1 Кбайт (один килобайт) = 210 байт = 1024 байта;

1 Мбайт (один мегабайт) = 210 Кбайт = 1024 Кбайта;

1 Гбайт (один гигабайт) = 210 Мбайт = 1024 Мбайта.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

1 Терабайт (Тб) = 1024 Гбайта = 240 байта,

1 Петабайт (Пб) = 1024 Тбайта = 250 байта.

1 байт = 8 бит;

1 Килобайт (Кбайт) = 2 10 байт

1 МегаБайт (Мбайт) = 2 10 Кбайт или 2 20 байт

1 Гигабайт (Гбайт) = 2 10 Мбайт или 2 30 байт

1 Терабайт (Тбайт) = 2 10 Гбайт или 2 40 байт

9) 2 - двоичная (в дискретной математике, информатике, программировании);
3 - троичная;
8 - восьмеричная;
10 - десятичная (используется повсеместно);
12 - двенадцатеричная (счёт дюжинами);
13 - тринадцатеричная;
16 - шестнадцатеричная (используется в программировании, информатике);
60 - шестидесятеричная (единицы измерения времени, измерение углов и, в частности, координат, долготы и широты).

9) Система счисле́ния - символический метод записи чисел, представление чисел с помощью письменных знаков.

Система счисления:

· даёт представления множества чисел (целых и/или вещественных);

· даёт каждому числу уникальное представление (или, по крайней мере, стандартное представление);

· отражает алгебраическую и арифметическую структуру чисел.

10) сложение, вычитание, деление, умножение недесятичных чисел.

11) это перевод из 1 системы счисления в другую

Способы кодирования информации.

Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества - письменность и арифметика - есть не что иное, как система кодирования речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.

Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Код - (1) правило, описывающее соответствие знаков или их сочетаний одного алфавита знакам или их сочетаниям другого алфавита; - (2) знаки вторичного алфавита, используемые для представления знаков или их сочетаний первичного алфавита.

Кодирование - перевод информации, представленной посредством первичного алфавита, в последовательность кодов.

Декодирование - операция, обратная кодированию, т.е. восстановление информации в первичном алфавите по полученной последовательности кодов.

Операции кодирования и декодирования называются обратимыми, если их последовательное применение обеспечивает возврат к исходной информации без каких-либо ее потерь.

13) Двоичная система – основа кодирования информации для ЭВМ

14) Существуют два способа представления чисел в памяти ЭВМ. Они называются так: форма с фиксированной точкой и форма с плавающей точкой. Форма с фиксированной точкой применяется к целым числам, форма с плавающей точкой - к вещественным числам (целым и дробным). Под точкой здесь подразумевается знак-разделитель целой и дробной части числа.

15) Таким образом, кодирование предшествует передаче и хранению информации. При этом, как указывалось ранее, хранение связано с фиксацией некоторого состояния носителя информации, а передача - с изменением состояния с течением времени (т.е. процессом). Эти состояния или сигналы будем называть элементарными сигналами - именно их совокупность и составляет вторичный алфавит.

Без технических сторон передачи и хранения сообщения (т.е. того, каким образом фактически реализованы передача-прием последовательности сигналов или фиксация состояний), математическая постановка задачи кодирования, дается следующим образом.

По типу линий связи: проводные; кабельные; оптико-волоконные;

линии электропередачи; радиоканалы и т.д.

2. По характеру сигналов: непрерывные; дискретные; дискретно-непрерывные (сигналы на входе системы дискретные, а на выходе непрерывные, и наоборот).

3. По помехозащищенности: каналы без помех; с помехами.

18) Или короче: алгоритм – это строго определенная последовательность действий, необходимых для решения данной задачи

19) На практике распространены следующие формы представления алгоритмов:

словесная (запись на естественном языке);
графическая (изображения из графических символов);
псевдокоды (полуформализованные описания алгоритмов на условном алгоритмическом языке, включающие как элементы языка программирования, так и фразы естественного языка, общепринятые математические обозначения и др.);
программная (тексты на языках программирования).

20) Сжатие информации - это процесс преобразования информации, хранящейся в файле, в результате которого уменьшается ее избыточность, соответственно, требуется меньший объем Памяти для хранения.

Архивный файл - это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т. д.

Архивация (упаковка) - помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде.

22) Код - набор символов (условных обозначений) дли представления информации. Кодирование - процесс представления информации в виде кода.

Урок "Кодирование инфомации".

Информацию друг другу мы передаем в устной и письменной форме, а также в форме жестов и знаков.

Знаки могут иметь различную физическую природу . Например, для представления информации с использованием языка в письменной форме используются знаки, которые являются изображениями на бумаге или других носителях, в устной речи в качестве знаков языка используются различные звуки (фонемы), а при обработке текста на компьютере знаки представляются в форме последовательностей электрических импульсов (компьютерных кодов ).

Виды информации

Информация, как объект классифицируется по видам. Таких классификаций несколько. Каждая наука вводит свою классификацию. Для информатики главным является то, каким образом информация вводится/выводится, обрабатывается, хранится, используя средства вычислительной техники. Поэтому в информатике принята следующая классификация видов информации:

Аналоговая – непрерывная (воспринимается человеком)		Дискретная – скачкообразная (воспринимается ВТ)

визуальная аудиальная тактильная обонятельная вкусовая

*Примеры:* скрипка телевизор телефон картина в музее графики функций		*Примеры:* фортепьяно монитор музыкальный центр мобильный телефон

Формы представления информации

Так как аналоговую информацию человек воспринимает с помощью своих органов чувств, то он стремится зафиксировать ее таким образом, чтобы она стала понятна другим. При этом одна и та же информация может быть представлена в разных формах.

В любом виде информация для нас выражает сведения о ком-то или о чем-то. Она отражает происходящее или происшедшее в нашем мире, например: что мы делали вчера или будем делать завтра, как будет выглядеть выпускное платье или место будущей работы. Но при этом информация обязательно должна получить некоторую форму, наиболее удобную для восприятия:

· текстов, рисунков, фотографий, чертежей;

· жестов и мимики;

· запахов и вкусовых ощущений;

· радиоволн;

· электрических и нервных импульсов;

· магнитных записей;

· хромосом

Получение информации - это, в конечном счете, получение фактов, сведений и данных о свойствах, структуре или взаимодействии объектов и явлений окружающего нас мира.

Язык как знаковая система

В процессе развития человеческого общества люди выработали большое число языков. Среди них язык жестов и мимики, язык рисунков и чертежей, язык музыки и язык математики, разговорный язык, алгоритмический язык и т. д.

Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.), то есть информация представляется с помощью естественных языков.

Примеры алфавитов: В основе русского языка лежит кириллица , содержащая 33 знака, английский язык использует латиницу (26 знаков), китайский язык использует алфавит из десятков тысяч знаков (иероглифов ).

Последовательности символов алфавита в соответствии с правилами грамматики образуют основные объекты языка - слова. Правила, согласно которым образуются предложения из слов данного языка, называются синтаксисом . Необходимо отметить, что в естественных языках грамматика и синтаксис языка формулируются с помощью большого количества правил, из которых существуют исключения, так как такие правила складывались исторически.

Схема передачи информации через письменность

УСТНАЯ РЕЧЬ

Письмо

ТЕКСТ

Чтение

УСТНАЯ РЕЧЬ

КОДИРОВАНИЕ ДЕКОДИРОВАНИЕ

Кодирование информации

Общая схема обмена информацией

Источник информации

Кодирующее устройство

Передача информации

Декодирующее устройство

Получатель информации

Кодирование текстовой информации

Языки представления информации
*Естественные:* Английский, французский, …			*Формальные:* Математики, программирования, ноты, …
Кодирование информации
Цели кодирования
засекречивание информации	быстрый способ записи	передача по техническим каналам связи		выполнение математических вычислений
*Шифрование*	*Стенография*	*Телеграфный код*		*Системы счисления*
Алгоритмы криптографии	Один знак – слово или сочетание букв	Код Морзе	Код Бодо	Для человека: десятичная	Для ПК: двоичная

Существует много способов кодирования, например

Азбука Морзе:

Стенография (от греч. στενός - узкий, тесный и γράφειν - писать) - способ письма посредством особых знаков и целого ряда сокращений, дающий возможность быстро записывать устную речь. Скорость стенографического письма превосходит скорость обычного в 4-7 раз.

Так как выбор значков для стенографии в основном произвольный, то из сочетаний различных значков образовалось бесчисленное множество стенографических систем, каждая из которых имеет свои достоинства и недостатки.

Искусство стенографии существовало уже, как можно заключить по некоторым данным, у древних египтян , где условным знаком записывались речи фараонов ; от египтян это искусство перешло к грекам и римлянам , у которых имелись скорописцы. 5 декабря 63 г. до н. э. в Древнем Риме состоялось первое известное в истории применение стенографии.

В некоторых случаях возникает потребность засекречивания документа или текста. В этом случае текст шифруется. В давние времена зашифрованный текст назывался тайнописью.

Шифрование - способ преобразования открытой информации в закрытую и обратно. Применяется для хранения важной информации в ненадёжных источниках или передачи её по незащищённым каналам связи .

Шифрование – это тоже кодирование, но с засекреченным методом, известным только адресату и источнику. Методами шифрования занимается наука криптография .

Рассмотрим в качестве примера кодирования соответствие цифрового и штрихового кодов товара. Такие коды имеются на каждом товаре и позволяют полностью идентифицировать товар (страну и фирму производителя, тип товара и штриховой коды товара.

Знакам цифрового кода (цифрам) соответствуют группы знаков штрихового кода (узкие и широкие штрихи, а также размеры промежутков между ними).

Для человека удобен цифровой код, а для автоматизированного учета и штриховой код, который считывается с помощью узкого светового луча и подвергается последующей обработке в компьютерных бухгалтерских системах учета.

Домашнее задание - придумайте или вспомните какую-либо информацию и представьте ее в разных формах, создать схему:

Создание новой мелодии