История, форматы, типы мультимедиа приложений. Измерение звуковой волны. Предварительные настройки уменьшают проблемы


Автор: Jack M. Germain
Дата публикации: November 3rd, 2010
Перевод: Н.Ромоданов
Дата перевода: ноябрь 2010 г.

Когда дело касается громадного количества форматов, используемых на цифровых носителях, у пользователя любой платформы может закружиться голова, а пользователи, которые, возможно, думают о переходе на Linux, могут решить, что на ОС с открытым кодом определенные типы файлов просто не удастся воспроизвести. В действительности этого бояться нечего - ниже описаны три приложения, с помощью которых можно преобразовать обычные и малоизвестные форматы цифровых носителей в те, которые легко воспринимаются Linux.

Одним из опасений, которое сохранятся у потенциальных пользователей Linux, это то, что, уйдя из Windows, они не смогут воспроизводить свои аудио и видео записи. Когда-то это действительно было проблемой. Но сейчас об этом не стоит больше беспокоиться.

С помощью трех сравнительно новых приложений, предназначенных для Linux, можно таким образом конвертировать звуковые и видео записи, что их можно будет воспроизводить в большинстве дистрибутивов Linux. Приложения , и могут вместе или по отдельности переместить в Linux все ваши любимые мультимедийные файлы.

Эти три приложения действительно ключевые, если вы хотите использовать Linux в качестве реальной настольной системы, альтернативной Microsoft Windows. У пользователей компьютеров появляется все больше портативных устройств, которые потребляют безумное количество аудио и видео записей. Ничего не оттолкнет новичков от Linux так быстро, как отсутствие возможности использовать звуковые или видеозаписи.

Вопросы проприетарности

Большим камнем преткновения при работе с видео и аудио файлами являются проприетарные кодеки, которые используются программами на других платформах. Преобразование форматов не предназначено для несанкционированного использования музыки или содержание видеозаписи. Просто я хочу иметь возможность воспроизводить то, что у меня уже есть, на той компьютерной платформе, которую я выберу. Приложения, осуществляющие преобразование аудио и видео, служат для этой цели.

Это означает, что у вас должна быть возможность получать файлы в проприетарных форматах, используемых на других платформах, например, Real Media, Apple Quicktime и Microsoft Windows Media Video, и быстро и легко конвертировать их для проигрывания с помощью плейеров с открытым исходным кодом.

Используем Arista

В приложении Arista Transcoder вы можете в качестве исходных видеозаписей выбирать файлы в любой кодировке и любого типа, если они доступны для чтения с помощью GStreamer. К ним относится и содержимое DVD. Вы также можете выбрать формат выходного файла.

Это приложение исключительно удобно благодаря тому, что вместе с ним поставляется огромное количество предварительных настроек, предназначенных для широкого спектра портативных устройств. Предварительные настройки избавляют пользователя от необходимости гадать о том, как выполнить преобразование, что постоянно случается в случае других программ, используемых для преобразования мультимедийных форматов.

Эти предварительные настройки позволяют избежать необходимости возиться с такими особенностями, как выбор различных видео и аудио кодеков, размеров выходного изображения, частоты смены кадров и так далее.

Рис. 1. Приложение Arista Transcoder

Бесплатный инструмент

Я до сих пор не встречал программу-конвертер, которая была бы настолько же проста, как Arista Transcoder. В панели Edit / Preferences (Редактирование / Настройки) практически ничего не нужно выбирать.

Если вы поставите отметку Search (Поиск), то приложение само найдет источник мультимедийной записи, который вы подключили к компьютеру. В противном случае, вам придется сделать выбор самостоятельно, используя для этого диалоговое окно.

С помощью быстро открывающегося меню можно выбрать тип устройства, например, оптический диск, указать устройство, например, компьютер или подключенное мобильное устройство (я полагаю, что I iPod, смартфон, Sony PSP и т.д.) и выбрать предварительную настройку.

Индикатор процесса преобразования указывает время, оставшееся до завершения преобразования. В окошке Live Preview (Предпросмотр) можно с частотой в два кадра в секунду следить за создаваемым изображением.

Предварительные настройки уменьшают проблемы

В интерфейсе вариантов выбора совсем немного. Но это неплохо. В предварительных настройках все за вас сделано, учтены возможности ввода "живого" мультимедийного сигнала, использование лицензионно чистого преобразования, а также выбора следующих уровней качества: низкий, средний и высокий.

Есть предварительные настройки для iPod, компьютера, плейра DVD, PSP, PlayStation 3 и многих других устройств. Встроена возможность автоматического обновления предварительных настроек.

Основные возможности SoundConverter

SoundConverter имеет репутацию надежного и полезного приложения. Он является лидирующим приложением для рабочего стола GNOME, предназначенным для преобразования звука.


Рис.2. Приложение для записи звука

Точно также, как и Arista Transcoder, приложению SoundCoverter нужна библиотека GStreamer. С помощью этого дуэта вы сможете прочитать все, что подадите на вход приложения.

Приложение читает следующие форматы: Ogg Vorbis, AAC, MP3, FLAC, WAV, AVI, MPEG, MOV, M4A, AC3, DTS, ALAC, MPC, Shorten, APE, SID, MOD, XM, S3M и многие другие. И записывает файлы в форматах WAV, FLAC, MP3, AAC и Ogg Vorbis./p>

Получите по следующей ссылке краткое руководство, в котором описано, как запустить приложение SoundConverter в дистрибутивах Ubuntu, Fedora, Mandriva, Gentoo и Debvian.

Быстро и используя все ресурсы

Благодаря использованию многопоточности, приложение SoundConverter работает очень быстро. Оно может "на лету" задействовать несколько ядер.

Оно также может извлекать аудиодорожки из видеозаписей. Благодаря этому скорость работы повышается.

Приложение SoundConverter построено на базе простого графического интерфейса, использующего GTK+ и предназначенного для рабочего стола GNOME.

Интерфейс в SoundConverter очень аскетичный. Все действия сделаны невидимыми для пользователя. У вас очень мало возможностей для выбора файла, создаваемого при преобразовании.

Небольшой выбор вариантов

Самое большое количество настроек приложения SoundConverter доступно в панели Edit/Preferences (Редактирование / Настройки). Здесь вы указываете, где будет размещен выходной файла, а также задаете другие выходные характеристики.

Вы можете указать либо тот директорий, где находится входной файл, либо выбрать другое место. Вы также можете прямо из панели создать поддиректорию или удалить исходный файл.

В SoundConverter также есть незначительные возможности настройки частоты дискретизации, которая зависит от других выбранных вами настроек. Например, для целевого битрейта установите значение 192kpbs. Если вы посмотрите настройки Resample, то увидите что у вас есть семь вариантов выбора настроек.

Хорошее управление

Когда дело касается приложений, преобразующих форматы, очень важна возможность управлять настройками результирующего файла. Мне нравится вариант, предлагаемый в SoundControl, так как он не встречаются в других приложениях.

В выпадающем списке вы можете задать имя выходного файла. Также можно указать номер и название дорожки, перечислить исполнителей и добавить свои собственные данные.

Вы можете указать тип формата и в выходном фильтре. Можно выбрать Vorbis (.ogg), FLAC без потерь (.flac) или MS Wave (.wav). Последний вариант, вероятно, будет более комфортным для тех, кто пришел из мира Windows.

В панели Preferences (Настройки) этого приложения есть иерархия настроек, предназначенная для задания различных уровней качества выходного файла. Вы можете выбрать один из шести уровней качества. Они варьируются от очень низкого и до безумно высокого.

Используем формат Ogg

OggConvert является утилитой Gnome и GTK, предназначенной для преобразования мультимедийных файлов в свободный от патентов формат Vorbis. Эта утилита немного более гибкая, чем другие приложения. Утилита OggConvert может работать с последними версиями формата.

Рис.3. Приложение OggConvert

Используются форматы Theora, Dirac и VP8. Не путайте утилиту OggConvert с приложением Ogg Converter. Это совершенно разные программы.

Общее, что есть в OggConvert, SoundConverter и Arista Transcoder, это то, что все они используют GStreamer для преобразования мультимедийных файлов в форматы Theora и Vorbis.

Ограничения

Преобразование форматов в OggConvert проще, чем с в других программах, которые я использовал. Единственный потенциальный недостаток этого приложения в том, что оно преобразует файлы только в форматы Ogg и Matroska.

Matroska является мультимедийным контейнером, имеющим открытый исходным код и открытый стандарт. Это, обычно, файлы с расширениями.MKV (Matroska видео), .MKA (Matroska аудио) и.MKS (субтитры). Этот формат также является основой для файлов.webm (WebM).

У меня не было возможности много работать с файлами Matroska. Но Ogg является стандартом, особенно для плейеров, используемых в Linux. Так что я считаю, что OggConvert хороший выбор, если приходится иметь дело с файлами в различных аудио и видео форматах.

Как использовать

Среди всех трех приложений-конвертеров, которые здесь обсуждались, OggConvert имеет самый скудный интерфейс. Разработчик даже обошелся без традиционных пунктов в меню — File (Файл) / Edit (Редактирование) / и т.д.

Использовать это приложение совсем несложно. Просто перейдите к месту, где у вас записаны мультимедийные файлы, и выберите файл. С помощью двух движков задайте качество аудио и качество видео.

Выберите в качестве выходного формата Ogg или Matroska и, если вы хотите, щелкните по заголовку окна и измените имя выходного файла. Укажите, где вы хотите сохранить выходной файл.

Вот и все, что нужно настроить. Просто нажмите кнопку Convert (Преобразовать) и все будет сделано.

В Библиотеке сайта вы найдете еще следующие статьи о преобразовании файлов в свободные форматы:

  • Jack Wallen, перевод: Н.Ромоданов, "Конвертирование файлов формата.mp3 в файлы форматов.wav и.ogg из командной строки"
    В этой статье вы увидите, насколько просто с помощью командной строки конвертировать друг в друга файлы этих форматов.
  • Nathan Willis, перевод А.Матвеев, "OggConvert - преобразуем видео-файлы в свободные форматы"
  • Сергей Иванов,

  • Темы Понятие мультимедиа. Аппаратные средства, необходимые для поддержки мультимедиа. Стандарты и форматы аудио. Стандарты и форматы видео. Текст. Графика. Форматы графических изображений. Программные средства для работы с мультимедиа. Средства доступа к сети Интернет, беспроводные средства. Работа в сети Интернет.


    Понятие мультимедиа Мультимедиа технологии - совокупность компьютерных технологий, одновременно использующих несколько информационных сред: графику, текст, видео, фотографию, анимацию, звуковые эффекты, высококачественное звуковое сопровождение. Технологию мультимедиа составляют специальные аппаратные и программные средства. Сетевые технологии – это набор стандартных протоколов и реализующих их программно-аппаратных средств, обеспечивающих функционирование локальной вычислительной сети. Сетевые мультимедиа технологии - объединение возможностей сетевых технологий с наглядностью мультимедийной формы представления.


    Аппаратные средства, необходимые для поддержки мультимедиа. Звуковые карты, усилители, AV-ресиверы, колонки и микрофоны. Основные виды, параметры и характеристики. Видеокарты. Основные виды, параметры и характеристики. GPU. 3D-графика: Direct 3D, Open GL, CUDA и т.д. Телевизоры, приемники, TV и FM - тюнеры. Основные виды, параметры и характеристики. Устройства отображения: Мониторы, мультимедиа проекторы, очки. Основные виды, параметры и характер-ки. 3D-видео: Методы отображения объемного (3D) изображения. 3D-очки, принцип действия. Видео- и фото- камеры. Основные виды, параметры и характеристики. Телевидение высокой четкости. Спутниковое ТВ. Ресиверы, антенны и т.д. Параметры и характеристики. Методы защиты каналов от несанкционированного просмотра. Кодировки. Интерфейсы передачи видео и звука: Компонентный, композитный, S-Video, SCART, DVI, D-SUB, HDMI, коаксиальный, SP-DIF, Toslink,… Оптические приводы и носители: CD, DVD, BD и т.д. Основные параметры и характеристики. Flash/SSD-накопители: Flash-карты, USB/SATA-Flash/SSD драйвы и т.д. Основные параметры и характеристики.


    Стандарты и форматы аудио. Аудио - общий термин, относящийся к звуковым технологиям. Зачастую под термином аудио понимают звук, записанный на звуковом носителе; реже под аудио подразумевается запись и воспроизведение звука, звукозаписывающая и звуковоспроизводящая аппаратура.


    Стандарты и форматы аудио. Форматы аудио-файлов: WAVE, MIDI, MP3, WMA,... Алгоритмы сжатия аудио: PCM, ADPCM, MPEG, GSM,... Параметры качества звука: частота дискретизации, число каналов, число бит на канал, скорость потока,... Объемное звучание. Форматы объемного звучания: Dolby Pro Logic, Dolby Pro Logic II, Dolby Digital, Dolby Digital EX, Dolby True HD, Dolby Digital Plus, DTS, DTS-ES, DTS-HD.


    Стандарты и форматы аудио. WAVE Wave форма звука получается при оцифровке, или дискретизации, непрерывной звуковой волны (англ. wave – волна), точнее, аналогового аудиосигнала. При оцифровке специальное устройство – аналого-цифровой преобразователь (АЦП) – измеряет амплитуду волны через равные промежутки времени со скоростью несколько тысяч измерений в секунду и запоминает в Wave-файл измеренные значения. Они называются выборками (по англ. sample, откуда еще одно название дискретизации – сэмплинг).


    Стандарты и форматы аудио. MIDI MIDI (англ. Musical Instrument Digital Interface цифровой интерфейс музыкальных инструментов) стандарт на аппаратуру и программное обеспечение, позволяющее воспроизводить (и записывать) музыку путем выполнения/записи специальных команд, а также формат файлов, содержащих такие команды. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом. Описывает аппаратный интерфейс, который позволяет соединять электронные музыкальные инструменты и компьютеры различных производителей, описывает протоколы связи для передачи данных от одного устройства к другому. MIDI-устройства могут взаимодействовать с программными приложениями, используя коммуникационный протокол MIDI. Используя соответствующий программный MIDI-секвенсор, внешние MIDI-устройства могут посылать информацию на синтезатор звуковой карты. MIDI базируется на пакетах данных, каждый из которых соответствует MIDI-событию (англ. MIDI- events), от нажатия клавиши до простой паузы, эти события разделяются по каналам. Сложная среда MIDI может включать различную аппаратуру, причём каждая часть системы будет отвечать за события на соответствующем канале. Альтернативным вариантом может быть одиночный синтезатор, который сам может управлять всеми каналами.


    Стандарты и форматы аудио. MP3 MP3 лицензируемый формат файла для хранения аудио- информации. В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. Существует три версии MP3 формата для различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными диапазонами битрейта и частоты дискретизации: кбит/c при частотах дискретизации Гц, Гц и Гц для MPEG-1 Layer 3; кбит/c при частотах дискретизации Гц, Гц и Гц для MPEG-2 Layer 3; 8160 кбит/c при частотах дискретизации 8000 Гц и Гц для MPEG-2.5 Layer 3.


    Стандарты и форматы аудио. WMA Windows Media Audio лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации. Изначально формат WMA позиционировался как альтернатива MP3, но на сегодняшний день Microsoft противопоставляет ему формат AAC. Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматом AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft. Особенно стоит отметить что ранние версии формата (или его реализации) имели проблемы на низких скоростях потока. Также многие меломаны и владельцы цифровых плееров недолюбливают формат WMA за низкую стойкость к ошибкам. Если при кодировании/передаче файла WMA некоторая часть его повреждается, то воспроизведение файла становится невозможным, как после места повреждения, так и за несколько десятков секунд до него.


    Стандарты и форматы видео. Стандарты видео: PAL, SECAM, NTSC. Цифровое телевидение, стандарты: DVB, ATSC, ISDB и их модификации. Цифровое телевидение в России. Форматы видео: VIDEO-CD, DVD,... Форматы объемного (3D) изображения. Алгоритмы сжатия видео: MPEG, WAVELETS,... Форматы видео файлов: AVI, 3gp, MP4, WMV, … Параметры качества видео: разрешение, количество цветов, число кадров в секунду, скорость потока,...


    Стандарты и форматы видео. Видео под этим термином понимают широкий спектр технологий записи, обработки, передачи, хранения и воспроизведения визуального и аудиовизуального материала. В быту под «видео» обычно понимают видеоматериал, телесигнал или кинофильм, записанный на физическом носителе (видеокассете, видеодиске и т.п.). Характеристики видеосигнала: Количество кадров в секунду Чересстрочная развёртка Разрешение Соотношение сторон экрана Количество цветов и цветовое разрешение Битрейт или ширина видеопотока


    Стандарты и форматы видео. AVI AVI - RIFF медиа-контейнер, впервые использованный Microsoft в 1992 году. Формат файлов с расширением.avi известен как медиа-контейнер, это формат файлов, так же как MP3 или JPG. Но, в отличие от этих форматов,AVI это формат-контейнер. Это означает, что он может содержать видео/аудио данные сжатые с использованием разных комбинаций кодеков, что позволяет синхронно воспроизводить видео со звуком. Так если MP3 и JPG файлы построены на использовании только основного вида компрессии данных (MPEG Audio Layer 3 и JPEG), AVI файл может содержать различные виды компрессированных данных (например, DivX - видео + WMA - аудио или Indeo - видео + PCM - аудио), в зависимости от того, какой кодек используется для кодирования/декодирования.Как и DVD, AVI файлы поддерживают многопотоковое аудио-видео. AVI-файлы могут содержать различные виды сжатых данных, к примеру DivX для видео-информации и MP3 для аудио. Все AVI файлы выглядят одинаково снаружи (имеют расширение.AVI), но внутри они могут отличаться очень сильно.


    Стандарты и форматы видео. 3gp 3gp - видеофайлы для мобильных телефонов 3-го поколения. Некоторые современные мобильные телефоны (не обязательно 3G) имеют функции записи и просмотра аудио и видео в формате.3GP. Этот формат упрощённая версия ISO Media Format, который похож на MOV, используемый QuickTime. 3gp сохраняет видео как MPEG-4 или H.263. Аудио сохраняется в форматах AMR-NB или AAC-LC. Готовые видео ролики в формате 3gp имеют малый размер по сравнению с другими форматами видео, но к сожалению это сильно отражается на качестве (оно очень низкое).


    Стандарты и форматы видео. MP4 MP4 или MPEG4 уже успели завоевать заслуженную популярность среди широкой аудитории пользователей ПК. Такие фильмы обычно умещаются на одном компакт-диске, а по качеству изображения могут успешно конкурировать с видеокассетами. MPEG-4 задумывался как способ передачи потоковых медиа-данных, в первую очередь видео, по каналам с низкой пропускной способностью. Стандарт неожиданно завоевал популярность у бюджетного пользователя: применение более сложных алгоритмов компрессии позволило размещать полнометражные фильмы длительностью полтора-два часа в приемлемом качестве всего на одном компакт-диске! При одном и том же битрейте и определённых условиях кодирования, качество изображения фильма в MPEG-4 может быть сравнимо или даже лучше, чем в случае применения MPEG-1 или MPEG-2. Однако применение новых алгоритмов сжатия повлекло за собой и существенное увеличение требований к вычислительным ресурсам, необходимым для качественной декомпрессии изображения из этого формата. Качество фильмов в формате MPEG-4 зависит от многих факторов, их можно условно разделить на три группы. 1) Качество исходного материала. 2) Параметры сжатия исходного видеоматериала: битрейт (поток данных, который проходит через декодер), размер изображения и другие, менее существенные. 3) Параметры декомпрессии сжатого видео, настройки видеокарты, монитора/телевизора и быстродействие компьютера, используемого для просмотра.


    Стандарты и форматы видео. Анимация. Анимация - технология мультимедиа; воспроизведение последовательности картинок, создающее впечатление движущегося изображения. Эффект движущегося изображения возникает при частоте смены видеокадров более 16 кадров в сек. GIF-анимация - последовательное отображение с заданной частотой растровых изображений, хранящихся в одном GIF-файле.


    Текст Текст в общем плане связная и полная последовательность знаков. Существуют две основных трактовки понятия «текст»: «имманентная» (расширенная, философски нагруженная) и «репрезентативная» (более частная). Имманентный подход подразумевает отношение к тексту как к автономной реальности, нацеленность на выявление его внутренней структуры. Репрезентативный рассмотрение текста как особой формы представления знаний о внешней тексту действительности.В лингвистике термин текст используется в широком значении, включая и образцы устной речи. Восприятие текста изучается в рамках лингвистики текста и психолингвистики. Текстовый файл разновидность файла, содержащая текстовые данные, как правило организованные в виде строк. Текстовый файл, как и прочие файлы, хранится в файловой системе. В отличие от термина «текстовый формат», характеризующего содержимое данных, термин «текстовый файл» относится к контейнеру, хранящему эти данные. Текстовый файл может содержать не только чистый текст, но и производные форматы к примеру, HTML-текст. Текстовый файл представляет из себя последовательность символов (принадлежащих некому набору символов). Символы сгруппированы в строки. В современных системах строки разделяются переводом строки, хотя в прошлом применялось хранение строк в виде записей постоянной или переменной длины. В силу своей простоты текстовые файлы нередко используются для хранения информации (пример, для логов). Текстовый формат служит основой для многих более специализированных форматов. Например: ini, SGML (а также HTML, XML), TeX, исходные тексты языков программирования…


    Графика Графика вид изобразительного искусства, использующий в качестве основных изобразительных средств линии, штрихи и пятна. Компьютерная графика область деятельности, в которой компьютеры используются как для синтеза изображений, так и для обработки визуальной информации, полученной из реального мира. Также компьютерной графикой называют и результат этой деятельности. Разработки в области компьютерной графики сначала двигались лишь академическим интересом и шли в научных учреждениях. Постепенно компьютерная графика прочно вошла в повседневную жизнь, стало возможным вести коммерчески успешные проекты в этой области. Разновидности компьютерной графики: 1) Векторная графика представляет изображение как набор геометрических примитивов. Обычно в качестве них выбираются точки, прямые, окружности, прямоугольники, а также как общий случай, сплайны некоторого порядка. Объектам присваиваются некоторые атрибуты, например, толщина линий, цвет заполнения. Рисунок хранится как набор координат, векторов и других чисел, характеризующих набор примитивов. При воспроизведении перекрывающихся объектов имеет значение их порядок. 2) Растровая графика всегда оперирует двумерным массивом (матрицей) пикселов. Каждому пикселю сопоставляется значение яркости, цвета, прозрачности или комбинация этих значений. Растровый образ имеет некоторое число строк и столбцов. Форматы графических изображений: Наиболее часто используемые форматы видео файлов: JPEG, BMP, PNG, TIFF


    Форматы графических изображений. JPEG JPEG - является широкоиспользуемым методом сжатия фотоизображений. Формат файла, который содержит сжатые данные обычно также называют именем JPEG; наиболее распространённые расширения для таких файлов.jpeg,.jfif,.jpg,.JPG, или.JPE. Однако из них.jpg самое популярное расширение на всех платформах. Формат является форматом сжатия с потерями, поэтому некорректно считать что JPEG хранит данные как 8 бит на канал (24 бит на пиксель). С другой стороны, так как данные, подвергающиеся компресии по формату JPEG и декомпрессированые данные обычно представляются в формате 8 бит на канал, иногда используется эта терминология. Поддерживается также сжатие черно-белых полутоновых изображений. При сжатии изображение переводится в цветовую систему YCbCr. Далее каналы изображения Cb и Cr, отвечающие за цвет, уменьшаются в 2 раза (по линейному масштабу). Уже на этом этапе необходимо хранить только четверть информации о цвете изображения.Реже используется уменьшение цветовой информации в 4 раза или сохранение размеров цветовых каналов как есть. Количество программ, которые поддерживают сохранение в таком виде, относительно невелико.Далее цветовые каналы изображения, включая черно-белый канал Y, разбиваются на блоки 8 на 8 пикселей. Каждый блок подвергается дискретно-косинусному преобразованию. Полученные коэффициенты подвергаются квантованию и упаковываются с помощью кодов Хаффмана.


    Форматы графических изображений. BMP BMP - формат хранения растровых изображений. Изначально формат мог хранить только аппаратно-зависимые растры, но с развитием технологий отображения графических данных формат BMP стал преимущественно хранить аппаратно-независимые растры. С форматом BMP работает огромное количество программ, так как его поддержка интегрирована в операционные системы Windows и OS/2. Файлы формата BMP могут иметь расширения.bmp,.dib и.rle. Кроме того, данные этого формата включаются в двоичные файлы ресурсов RES и в PE-файлы. Глубина цвета в данном формате может быть от 1 до 48 бит на пиксель, максимальные габариты изображения 65535×65535 пикселей.


    Форматы графических изображений. PNG PNG - растровый формат хранения графической информации, использующий сжатие без потерь. PNG был создан как для улучшения, так и для замены формата GIF графическим форматом, не требующим лицензии для использования. Обычно файлы формата PNG имеют расширение PNG или png и используют обозначение MIME-типа image/png. Формат PNG хранит графическую информацию в сжатом виде. Причём это сжатие производится без потерь, в отличие, например, от JPEG. Формат PNG спроектирован для замены устаревшего и более простого формата GIF, а также, в некоторой степени, для замены значительно более сложного формата TIFF (см. официальный сайт PNG или хронологическую страницу для дополнительной информации). Формат PNG позиционируется прежде всего для использования в сети Интернет и редактирования графики. Формат PNG обладает более высокой степенью сжатия для файлов с большим количеством цветов, чем GIF, но разница составляет около 5-25 %, что недостаточно для абсолютного преобладания формата, так как небольшие 2-16 цветные файлы формат GIF сжимает с не меньшей эффективностью.


    Форматы графических изображений. TIFF TIFF - формат хранения растровых графических изображений. Изначально был разработан компанией Aldus в сотрудничестве с Microsoft, для использования с PostScript. TIFF стал популярным форматом для хранения изображений с большой глубиной цвета, используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. TIFF был выбран в качестве основного графического формата операционной системы NeXTStep, и из неё поддержка этого формата перешла в Mac OS X. Владелец спецификаций Aldus впоследствии объединилась с Adobe, владеющей в настоящее время авторским правом на формата. Имеется возможность сохранять файл со сжатием. Степени сжатия зависят от хранимого изображения, а также и от используемого алгоритма.


    Гипертекстовые способы хранения и представления информации. Гипертекстовые информационные технологии Гипертекст (нелинейный текст) – это организация текстовой информации, при которой текст представляет множество фрагментов с явно указанными связями между этими фрагментами. WWW (сокращение от англ. World Wide Web – мировая паутина, всемирная паутина или всемирная сеть) – это глобальный механизм обмена информацией; информационная система и популярная служба Интернета. Это самое распространённое приложение Интернета. Основой WWW являются протокол передачи гипертекстовых данных (HTTP) и язык гипертекста (HTML), т.е. гипертекстовые технологии. HTTP – это гипертекстовый транспортный протокол для связи веб-серверов и веб-клиентов. Он предназначен для построения распределённых информационных сетей коллективного пользования, поддерживающих различные типы данных (текст, изображение, аудио- и видеоинформация) и загрузки веб-страниц (файлов).


    Гипертекстовые способы хранения и представления информации. Языки гипертекстовой разметки документов Гипертекстовый документ - это файл, содержащий различные виды информации и имеющий в своей структуре ссылки (гиперссылки) на другие файлы или сам являющийся документом, на который есть ссылка в другом файле, расположенном на некотором сервере в любой точке планеты. Гипертекстовый документ, размещённый на сервере с использованием WWW, называют Web-страницей (веб-страницей). Это минимальный фрагмент гипертекста, который можно за один раз загрузить и прочитать. Используя предлагаемые связи можно читать материал в любом порядке. Таким образом, текст становится открытым. В него можно вставлять любые объекты, указывая для них связи с имеющимися объектами. При этом структура текста не разрушается. Поэтому гипертекст стал новой информационной технологией представления неструктурированного легко наращиваемого знания. Структура гипертекстовых документов формируется с помощью последовательности тегов – элементов языка HTML, включающих тексты в формате ASCII. Они позволяют управлять шрифтом, цветом фона и текста, определять ссылки, вставлять объекты (графику, звук и видео). При этом сами тэги на странице в режиме её просмотра через браузер не видны. Тег или тэг (англ. Tag – метка) является признаком объекта, который управляет соответствующим кодом. Любая страница начинается с тега и заканчивается тегом.

    Мультимедиа технологии. Графические форматы

    Мультимедиа (лат. Multum + Medium ) - одновременное использование различных форм представления информации и ее обработки в едином объекте-контейнере.

    Например, в одном объекте-контейнере (англ. container ) может содержаться текстовая, аудиальная, графическая и видео информация, а также, возможно, способ интерактивного взаимодействия с ней.

    Термин мультимедиа также, зачастую, используется для обозначения носителей информации, позволяющих хранить значительные объемы данных и обеспечивать достаточно быстрый доступ к ним (первыми носителями такого типа были CD - compact disk.

    Классификация:

    Мультимедиа может быть грубо классифицировано как линейное и нелинейное .

    Аналогом линейного способа представления может являться кино. Человек, просматривающий данный документ никаким образом не может повлиять на его вывод.

    Нелинейный способ представления информации позволяет человеку участвовать в выводе информации, взаимодействуя каким-либо образом со средством отображения мультимедийных данных. Участие человека в данном процессе также называется «интерактивностью». Такой способ взаимодействия человека и компьютера наиболее полным образом представлен в категориях компьютерных игр. Нелинейный способ представления мультимедийных данных иногда называется «гипермедиа».

    В качестве примера линейного и нелинейного способа представления информации, можно рассматривать такую ситуацию, как проведение презентации. Если презентация была записана на пленку и показывается аудитории, то при этом способе донесения информации просматривающие данную презентацию не имеют возможности влиять на докладчика. В случае же живой презентации, аудитория имеет возможность задавать докладчику вопросы и взаимодействовать с ним прочим образом, что позволяет докладчику отходить от темы презентации, например поясняя некоторые термины или более подробно освещая спорные части доклада. Таким образом, живая презентация может быть представлена, как нелинейный(интерактивный) способ подачи информации…

    Графические форматы

    Графи́ческий форма́т - это способ записи графической информации. Графические форматы файлов предназначены для хранения изображений, таких как фотографии и рисунки.

    Графические форматы различаются по виду хранимых данных (растровая, векторная и смешанная формы), по допустимому объему данных, параметрам изображения, хранению палитры, методике сжатия данных (для EGA без сжатия требуется 256К) - DCLZ (Data Compression Lempel-Ziv), LZW (Lempel-Ziv & Welch), по способам организации файла (текстовый, двоичный), структуре файла (с последовательной или ссылочной (индексно-последовательной) структурой) и т.д.

    Растровый файл состоит из точек, число которых определяется разрешением, измеряемым обычно в точках на дюйм (dpi) или на сантиметр (dpc). Очень важным фактором, влияющим, с одной стороны, на качество вывода изображения, а с другой - на размер файла, является глубина цвета, т.е. число разрядов, отводимых для хранения информации о трех составляющих (если это цветная картинка) или одной составляющей (для полутонового не цветного изображения). Например, при использовании модели RGB глубина 24 разряда на точку означает, что на каждый цвет (красный, синий, зеленый) отводится по 8 разрядов и поэтому в таком файле может храниться информация о 2^24 = 16,777,216 цветах (Обычно в этом случае говорят о 16 млн. цветов). Очевидно, что даже файлы с низким разрешением содержат в себе тысячи или десятки тысяч точек. Так, растровая картинка размером 1024х768 точек и с 256 цветами занимает 768 Кбайт. Для уменьшения объемов файлов разработаны специальные алгоритмы сжатия графической информации. Именно они и являются основной причиной существования графических форматов.

    Векторный способ записи графических данных применяется в системах автоматического проектирования (CAD) и в графических пакетах. В этом случае изображение состоит из простейших элементов (линия, ломаная, кривая Безье, эллипс, прямоугольник и т.д.), для каждого из которых определен ряд атрибутов (например, для замкнутого многоугольника - координаты угловых точек, толщина и цвет контурной линии, тип и цвета заливки и т.д.). Записывается также место объектов на странице и расположение их друг относительно друга (какой из них "лежит" выше, а какой ниже). Векторный формат является доказательством идеи древнегреческих математиков о том, что любую существующую в природе форму можно описать, используя геометрические примитивы и компас.

    У каждого метода есть свои преимущества. Растровый позволяет передавать тонкие, едва уловимые детали образов, векторный же лучше всего применять, если оригинал имеет отчетливые геометрические очертания. Векторные файла меньше по объему, зато растровые быстрее вырисовываются на экране дисплея, так как для вывода векторного изображения процессору необходимо произвести множество математических операций. С другой стороны, векторные файлы гораздо проще редактировать.

    Существует множество программ-трансляторов, переводящих данные из векторного формата в растровый. Как правило, такая задача решается довольно просто, чего нельзя сказать об обратной операции - преобразовании растрового файла в векторный и даже о переводе одного векторного файла в другой. Векторные алгоритмы записи используют уникальные для каждой фирмы-поставщика математические модели, описывающие элементы изображения.

    Ниже описан ряд наиболее распространенных графических форматов.

    1. PCX - Простейший растровый формат. Первоначально этот формат использовался в программе PaintBrush фирмы Zsoft, однако в последствии получил широкое распространение среди пакетов редактирования растровых изображений, хотя до сих пор не признан в качестве официального стандарта. К сожалению, в процессе своей эволюции PCX претерпел настолько значительные изменения, что современная версия формата, поддерживающая 24-разрядный цветовой режим, не может использоваться старыми программами. С самого "рождения" формат PCX был ориентирован на существующие видеоадаптеры (сначала EGA, потом VGA) и поэтому является аппаратно-зависимым. В PCX используется схема сжатия данных RLE, позволяющая уменьшать размер файла, например, на 40- 70%, если используется 16 и менее цветов, и на 10- 30% для 256-цветных изображений.

    2. BMP - (Windows Bitmap) разрабатывался фирмой Microsoft как совместимый со всеми приложениями Windows. Для приложений в операционной системе OS/2 имеется собственная версия BMP. В формате BMP можно сохранять черно-белые, серые полутоновые, индексные цветные и цветные изображения системы RGB (но не двухцветные или цветные изображения системы CMYK). Недостаток этих графических форматов: большой объем. Следствие - малая пригодность для Internet-публикаций.

    3. GIF - поддерживает до 256 цветов, позволяет задавать один из цветов как прозрачный, дает возможность сохранения с чередованием строк (при просмотре сначала выводится каждая 8-я, затем каждая 4-я и т.д. Это позволяет судить об изображении до его полной загрузки). Способен содержать несколько кадров в одном файле с последующей последовательной демонстрацией (т.н. "анимированный GIF"). Уменьшение размера файла достигается удалением из описания палитры неиспользуемых цветов и построчного сжатия данных (записывается количество точек повторяющегося по горизонтали цвета, а не каждая точка с указанием ее цвета). Такой алгоритм дает лучшие результаты для изображений с протяженными по горизонтали однотонными объектами. Для сжатия файла используется высокоэффективный алгоритм Лемпела - Зива - Велча (LZW)

    4. TIFF (target image file format) - был разработан специально для использования в приложениях, связанных с компоновкой страницы и направлен на преодоление трудностей, которые возникают при переносе графических файлов с IBM-совместимых компьютеров на Macintosh и обратно. Он поддерживается всеми основными графическими пакетами и пакетами редактирования изображений и читается на многих платформах. Использует сжатие изображения (LZW). Формат TIFF очень удобен, но за это приходится расплачиваться огромными размерами получаемых файлов (например, файл формата А4 в цветовой модели CMYK с разрешением 300 dpi, обычно применяемым для высококачественной печати, имеет размер около 40 Мбайт). Кроме того, существует несколько "диалектов" формата, которые не каждая программа, поддерживающая TIFF, легко "понимает".

    5. JPEG - миллионы цветов и оттенков, палитра не настраиваемая, предназначен для представления сложных фотоизображений. Разновидность progressive JPEG позволяет сохранять изображения с выводом за указанное количество шагов (от 3 до 5 в Photoshop"e) - сначала с маленьким разрешением (плохим качеством), на следующих этапах первичное изображение перерисовывается все более качественной картинкой. Анимация или прозрачный цвет форматом не поддерживаются. Уменьшение размера файла достигается сложным математическим алгоритмом удаления информации - чем заказываемое качество ниже, тем коэффициент сжатия больше, файл меньше. Главное, подобрать максимальное сжатие при минимальной потере качества. Последний идентифицирует и отбрасывает данные, которые человеческий глаз не в состоянии увидеть (незначительные изменения в цвете не различаются человеком, тогда как улавливается даже малейшая разница в интенсивности, поэтому JPEG меньше подходит для обработки черно-белых полутоновых изображений), что приводит к существенному уменьшению размера файла. Таким образом, в отличие от метода сжатия LZW или RLE в результате применения технологии JPEG данные теряются навсегда. Так, файл, однажды записанный в формате JPEG, а затем переведенный, скажем, в TIFF, уже не будет тем же, что и оригинал. Наиболее подходящий формат для размещения в Интернете полноцветных изображений. Вероятно, до появления мощных алгоритмов сжатия изображения без потери качества останется ведущим форматом для представления фотографий в Web.

    Updated: March 30, 2011

    Applies To: Windows Home Server 2011

    Digital media refers to audio, video, and photo content that has been encoded (digitally compressed). Encoding content involves converting audio and video input into a digital media file such as a Windows Media file. After digital media is encoded, it can be easily manipulated, distributed, and rendered (played) by computers, and is easily transmitted over computer networks.

    Examples of digital media types include: Windows Media Audio (WMA), Windows Media Video (WMV), MP3, JPEG, and AVI. For information about the digital media types supported by Windows Media Player, see the article “Information about the Multimedia file types that Windows Media Player supports .

    Why would I want to stream my digital media?

    Like many people, you probably have a lot of music, video, and pictures in Windows Home Server 2011 shared folders. There may be times when you want to do following:

      Watch videos . Your home server can be used to store and stream large collections of videos and recorded TV shows to your home computers or other playback devices on your home network. You can stream videos to an Xbox 360 or to a home computer by using Windows Media Player.

      Play music . When you turn on Media Sharing for the Music shared folder, you can access your music from devices that support Windows Media Connect. You do not need to enable or configure any user accounts to stream from the Music shared folder after sharing is turned on.

      Present photo slide shows . You can store your digital photos in the Photos shared folder on your home server and then access them from any home computer or from an Xbox 360 that is connected to a TV in your home. You can watch photo slide shows, turning your TV into a large picture frame.

    Sharing copy-protected media

    Windows Home Server 2011 does not support the sharing of copy-protected media. This includes music purchased through an online music store.

    Copy-protected media can be played back only on the computer or device that you used to purchase it. Copy protection prevents you from playing media on more than one computer or device, even if you copy the media to your home server and play it from there. However, you can store the copy-protected media on Windows Home Server 2011 and continue to play back the media on the computer or device used to purchase it.

    БЕЛОРУССКАЯ ГОСУДАРСТВЕННАЯ ПОЛИТЕХНИЧЕСКАЯ АКАДЕМИЯ

    ПРИБОРОСТРОИТЕЛЬНЫЙ ФАКУЛЬТЕТ

    Кафедра «ИНЖЕНЕРНАЯ МАТЕМАТИКА»

    Подготовил студент: Бескаровайный А. Л.
    Группа 113039

    Руководитель работы: Анисимов В. Я.

    Минск 2000
    СОДЕРЖАНИЕ:

    МУЛЬТИМЕДИА. ФОРМАТЫ ЗВУКОВЫХ ФАЙЛОВ.

    Multimedia – это подхваченный всеми термин, обозначающий интерактивный инструмент для работы с графикой, анимацией, звуком и видео. Мультимедиа привносит блеск в презентации, живопись и игры, и, кроме того, доставляет удовольствие при обучении. Она превращает компьютер из настольной системы с клавиатурой и монитором в некий «космический аппарат», укомплектованный динамиками, микрофоном, наушниками, джойстиками и компакт-дисками.

    Что же такое мультимедиа?

    Мультимедиа позволяет работать на компьютере со всеми видами информации, а не только с текстом или обычными рисунками. Мультимедиа – это цифровая информация, имеющая более широкие возможности, чем другие ее виды.
      Поскольку звуковая и графическая информация записывается в цифровой форме, она может копироваться без потери качества.
      Цифровая информация может сжиматься до минимума для хранения.
      Можно записать огромное количество информации на CD-ROM, а сам CD-ROM занимает очень мало места.
      Интерактивные компьютерные программы, использующие цифровые медиасистемы, являются отличными средствами обучения.
    Если вы покупаете компьютер со встроенными средствами мультимедиа или устанавливаете на свой компьютер, то вам необходимо разобраться в многообразии средств мультимедиа, а также познакомиться с существующими способами записи и воспроизведения. Существуют два основных вида систем мультимедиа:
      Системы воспроизведения. Эти системы, как правило включают многоскоростной дисковод CD-ROM, звуковую карту, динамики и видеосистему с относительно высоким разрешением. Не помешает также наличие карты декомпрессии, работающей с цифровой информацией.
      Авторские системы. (системы, используемые для создания файлов систем мультимедиа). Авторские системы, как правило, включают такие компоненты, как микрофоны и видеокамеры для записи звука и съемки видеоизображений. Они также высокоскоростные, емкие жесткие диски, способные хранить и обслуживать большие объемы информации, требующиеся для цифрового видео.
    В 80-х годах персональный компьютер состоял из микропроцессора (CPU), клавиатуры, монитора, дисковода и принтера. Все, что вы могли сделать на компьютере, – это работать с текстом. Люди тратили очень много времени, оформляя письма, производя финансовые расчеты и просматривая базы данных.
    Но теперь, когда появились такие графические пользовательские интерфейсы, как Windows95/98(SE)/МЕ/NT/2k. , и значительно более мощные персональные компьютеры, начали появляться приложения, предоставляющие возможность использовать анимационные эффекты, звук и видео. В конце 1980г. люди начали сочинять музыку на компьютере, комбинируя анимацию и звук, создавая захватывающие мультимедиа-презентации со звуком и движущимися картинками. Оборудование, однако, было дорогим, а результаты часто не оправдывали ожиданий. Windows3.1 и DOS не имели достаточно ресурсов для поддержки систем мультимедиа, поэтому картинки на экране двигались очень медленно.

    Мультимедиа и Windows 95/98(SE)/МЕ/NT/2k/XP.

    Благодаря Windows все преобразовалось. Она поддерживает средства значительно улучшающие работу с мультимедиа.
      Windows95/98(SE)/МЕ/NT/2k. является 32-разрядной, многозадачной, многопоточной операционной системой. Это означает, что Windows поддерживает выполнение нескольких задач одновременно, проигрывание мультимедиа-презентаций и работу пользователей в диалоговом режиме.
      При установке Windows автоматически определяет конфигурацию мультимедиа устройств.
      Приложения Windows поддерживают мультимедиа. Вы можете создавать составные документы, т.е. документы, включающие звук, видео, графику, диаграммы, картинки и другие элементы различных приложений.
      Windows поддерживает форматы компакт-дисков Sony/Philips CD+ и Kodak PhotoCD, а также позволяет легко запускать программы и проигрывать диски с устройства CD-ROM.
      Видеостандарт Windows широко поддерживается в компьютерной индустрии. Разработчики мультимедиа-продуктов могут спокойно распространять свою продукцию, зная, что она будет работать под Windows.
      Мультимедиа-продукты, разработанные для Windows, как правило, являются продуктами высокого качества, так как Windows поддерживает большие видеоокна и 32-разрядная архитектура Windows улучшает прохождение данных.
      Windows поддерживает интерфейс Sony VISCA. Это означает, что в приложениях вы можете использовать так называемые VCR-кнопки (VCR – английская аббревиатура от Video Cassette Recorder – видеомагнитофон, т.е. кнопки, функционально аналогичные кнопкам перемотки, воспроизведения и другим на аудио- и видеовоспроизводящих устройствах) при проигрывании лазерных дисков.
      Качество игр в Windows значительно улучшено за счет нового программного графического интерфейса.
      Windows поддерживает множество различных стандартных промышленных звуковых и видеоустройств компрессии информации при ее записи в файл, а также декомпрессии при воспроизведении (так называемых кодек-устройств). Кодек сокращает объем мультимедиа-файлов и позволяет распространять их в различных форматах.
    Наиболее важным средством мультимедиа в последние несколько лет стало видео. Видео вмещает невероятное количество информации, которая может быть сжата перед перенесением ее с одного устройства на другое, например, из видеокамеры на жесткий диск через шину компьютера. Применение технологии сжатия аудио- и видеоинформации позволяет расширить рынок средств мультимедиа.

    Системы мультимедиа

    Дополнительными периферийными устройствами к компьютеру в середине 80-х годов были дисководы, сканеры, принтеры и коммуникационные средства типа модем. В 90-х годах появляется звуковые карты, видео-карты, дисководы CD-ROM и высокоскоростные коммуникационные средства, благодаря которым теперь вы можете связаться с информационной службой, передающей вам мультимедиа по проводам.
    Ниже перечислены минимальные требования для запуска мультимедиа под Windows.
      Процессор Intel 80486 (Для цифровых видеоприложений рекомендуется Pentium).
      Шина PCI для передачи данных для контроллера диска и видеокарты.
      Жесткий диск большого объем (от 300 Мбайт). Для высококачественных цифровых видеосистем требуется гигабайты памяти.
      CD-ROM со скоростью не ниже 4-х с регулировкой звука на передней панели.
      Звуковая карта, обеспечивающая частоты квантования 11,025; 22,05 и 44,1-кГц для стерео звучания. Также требуется многоголосные и многотембровые устройства, способные воспринимать на входе несколько источников, а на выходе представить стереозвучание.
      Видеоаппаратуру, поддерживающую высокие разрешения монитора. Microsoft рекомендует для лучшего качества представления видео использовать VESA или PCI видеокарты. В последнее время стали популярны AGP адаптеры.
      IBM-совместимый аналоговый порт джойстика.
      MIDI-порт, поддерживающий установленные стандарты для ввода, вывода и передачи данных. Некоторые звуковые карты содержат MIDI-синтезаторы, но в общем случае вы подсоединяетесь к внешнему MIDI-синтезатору, по внешнему виду напоминающему клавиатуру.
    MIDI (Musical Instrument Digital Interface – интерфейс цифровых музыкальных инструментов) является стандартом для записи нот и сопутствующей информации, связанной с проигрыванием музыки на электронном музыкальном устройстве. Реальный звук при этом не записывается.

    Вышеперечисленные компоненты необходимы для воспроизведения и записи средствами мультимедиа. Однако, если вы хотите сами создавать мультимедиа-клипы, то вам могут потребоваться дополнительная аппаратура.

    Типы и стандарты мультимедиа

    Мультимедиа-информация храниться в виде файлов специального формата, содержащих звук, видеоизображения, или в файлах формата MIDI.

    Аудиомедиа (звуковая медиа) хранится, в основном, в двух форматах, WAV и MIDI. Большинство WAV-файлов требует много дискового пространства, но они могут воспроизводиться с помощью любой звуковой карты. MIDI-файлы занимают значительно меньше места на диске, но могут проигрываться только на MIDI-совместимых устройствах. В настоящее время почти все карты способны воспроизводить MIDI-файлы.

    Визуальное медиа – это анимационные файлы и видеофайлы.
    Анимация. В Windows, если у вас есть соответствующее приложение, вы можете создавать изображения, перемещающиеся по экрану. Не существует стандартного формата анимационного файла, однако многие разработчики одновременно развивают производство как анимационных средств, так и воспроизводящей аппаратуры. Анимация может сопровождаться звуковыми файлами разных форматов.
    Видео. Video for Windows – это видеостандарт для Windows. Вы можете записать фильм с видеокамеры или лазерного диска на жесткий диск компьютера и сохранить его как файл в формате AVI либо MPG. Сжатие требуется лишь для высококачественного видео и его эффективного хранения.

    О звуковой мультимедиа

    Приложения для записи и воспроизведения звука были одними из первых известных приложений мультимедиа для персонального компьютера. Добавив звуковую карту, вы сможете записывать сообщение, переданное голосом, сохранять его как файл на диске, переносить его на другой компьютер, где оно также может быть воспроизведено. Вы также можете записывать музыку и звук для компьютерных презентаций.
    Существует два способа звукозаписи:
        Цифровая запись, когда реальные звуковые волны записываются и конвертируются в цифровые данные.
        MIDI-запись, вообще говоря, является не реальным звуком, а записью нажатий на клавиши или другой операций, выполняемых на синтезаторах или MIDI-совместимых электромузыкальных устройствах. MIDI-файл является электронным эквивалентом игры на фортепиано.

    Цифровая запись

    Звуковая плата преобразует звук на выходе в цифровую информацию путем измерения звука тысячи раз в секунду. Цифровой звук хранится в файлах с расширением WAV. При записи звука аналого-цифровой преобразователь конвертирует звук в цифровые данные. При воспроизведении звука цифроаналоговый преобразователь конвертирует цифровые данные в аналог звуковой волны.
    Звук представляет собой вибрации, которые формируют волну с соответствующими амплитудой и периодом, как это показано на рис.1. Амплитуда выражает высоту волны, или громкость звука. Период – это расстояние между двумя звуковыми волнами. Наконец, частота показывает количество периодов в секунду и измеряется в герцах. Например, сто периодов в секунду – это 100 Гц. Человек может воспринимать звук с частотой от 20 до 20000 Гц, и вся выпускаемая звуковоспроизводящая и звукозаписывающая аппаратура рассчитана на этот диапазон частот.

    Рис. 1. Измерение звуковой волны

    Для того чтобы записать звук и хранить его на цифровом устройстве типа вашего компьютера, производится квантование звука, т.е. разбиение звуковой волны на определенные интервалы по времени. Звуковая волна, показанная на рис.2, была разбита на 16 интервалов. Если предположить, что продолжительность звуковой волны равна одной секунде, то ее частота квантования – 16 Гц.

    Рис. 2. Квантование волны при частоте квантования 16 Гц
    Как правило, такая низкая частота квантования не используется. Даже цифровой звук с частотой квантования 100 или 1000 Гц не будет распознаваться при воспроизведении. Это происходит потому, что цифровое представление волны в данном случае не сглажено. Фильтрующая аппаратура сглаживает волну, однако наилучшим способом получения качественной цифровой записи является повышение частоты квантования. Следует учесть, что при этом увеличивается объем хранящихся данных, что потребует больше памяти на диске.
    Стандартам мультимедиа соответствуют три типа частоты квантования: 11,025; 22,05; 44,1 кГц. Частота квантования зависит от записываемого звука: 11,025 кГц подходит для записи голоса, но для получения высококачественной записи требуется частота квантования 44,1 или 48 кГц. Однако повышение частоты квантования приводит к увеличению размера файла и требуемого пространства на диске для его хранения. Формула для расчета дискового пространства будет приведена ниже, но прежде необходимо разобраться с одной переменной – числом разрядов (бит), используемым для хранения информации о квантовании.
    Каждый интервал содержит информацию о малом временном сегменте звука. Количество разрядов для записи каждого интервала определяет точность аппроксимации звуковой волны, однако увеличивает размер файла, в котором хранится цифровой звук. 4-разрядное разбиение на интервалы обеспечивает деление амплитуды звуковой волны по вертикали на 16 уровней, а 8-разрядное разбиение – на 256 уровней. Для высококачественной записи требуется 16-разрядное разбиение на интервалы по амплитуде, которое определяет 65536 уровней амплитуды.
    Предшествующее обсуждение касалось сглаженной звуковой волны, но реальная волна не сглажена – она состоит из многих различных частот, которые вместе создают тембр звука. Тембр – это уникальный звук, присущий инструменту. Например, колебания струны и резонатор определяют звучание скрипки (уникальное звучание скрипки Страдивари является результатом добавления ценных веществ в ее полировку). Скрипка производит целый комплекс звуковых волн, как это показано на рис. 3.
    Теперь вы видите важность повышения частоты квантования и разрядности звуковой платы при записи звука. Вам необходимо знать не только амплитуду каждого выбранного интервала, но и все, что происходит с волной за единицу времени. Повышение частоты квантования и разрядности звуковой платы обеспечивает качественную запись звука, однако, следует помнить, что это приводит к значительному увеличению дискового пространства, необходимого для хранения записываемого звука. К счастью, если вы записываете голос, то нет необходимости использовать большую частоту квантования и разрядность звуковой платы.

    Рис. 3. реальные звуковые волны имеют весьма сложную форму и для получения их высококачественного цифрового представления требуется высокая частота квантования

    Ниже приводится формула расчета требуемого дискового пространства для хранения цифрового звука:

    На секунду

    В табл. 1. приведено требуемое пространство на диске для хранения записи звука продолжительностью одна минута для каждой частоты квантования при разрядности 8 бит. Первая строка в таблице соответствует низкокачественной записи голоса, а последняя строка – стандартам, установленным для цифровых аудиокомпакт-дисков.

    Таблица 1. Требования по хранению звуковых файлов

    Заметим, что высокая частота квантования и разрядность не требуются, если звук был записан и проигрывается на оборудовании более низкого качества. Например, карманный микрофон записывает звук гораздо более низкого качества, чем запись при частоте квантования 44 кГц. Если у вас высококачественная запись, то для ее воспроизведения соответственно требуется аппаратура высокого качетва.

    Звук и типы звуковых файлов

    Звук – это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.
    Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.
    Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

    РСМ
    РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко (я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.
    DPCM
    Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.
    ADPCM
    Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.
    WAV
    Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали – это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.
    RIFF
    Resource Interchange File Format. Уникальная система хранения любых структурированных данных.
    IFF
    Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga – одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.
    MOD
    Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря, прошитый в синтезатор сэмпл.
    AIF или AIFF
    Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.
    AIFC или AIFF-С
    Тот же AIFF, только с заданными параметрами сжатия (компрессии).
    AU
    Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало "весят", за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры m-Law 8 кГц – моно. Но есть и 16-битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.
    MID
    Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.
    МР3
    Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.
    VQF
    Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF – процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.
    VOC
    Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).
    НСОМ
    То же самое, что и VOC (восемь бит, моно), но только для Apple Macintosh.
    UL
    Стандартный формат U-Law. 8 кГц, 8 бит, моно.
    RA
    Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.
    SND
    Бывает двух видов. Один – это тот же AU для SUN и NeXT. Другой – это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

    Существуют и другие типы звуковых файлов, но это, скорее всего, файлы различных программ для создания и обработки музыки. В основном, такие файлы читаются только той программой, в которой они были созданы.

    Компрессия аудиоданных

    Мультимедиа-информация состоит из огромного количества цифровых данных, которые необходимо хранить в сжатом виде. Windows включает в себя средства управления компрессией аудио- и видеоизображений, которые работают с одним или более модулями декомпрессии и называются кодеками (от Компрессия и ДЕКомпрессия). Большое количество программных кодеков поставляются с Windows. Когда вы записываете или воспроизводите звук или видеофайл, Windows автоматически использует кодек.
    Многие звуковые и видеокарты имеют встроенные аппаратные кодеки. Windows сначала использует аппаратный кодек, поскольку он быстрее и не очень нагружает процессор. Если аппаратный кодек отсутствует, то Windows применяет программные кодеки. Если она не смогла найти кодек, на экране появится сообщение об ошибке, поскольку сжатый файл невозможно распаковать.

    Программа управления компрессией аудиоданных (Audio Compression Manager, ACM) в Windows использует следующие кодеки для компрессии/декомпрессии аудиоданных.

        TrueSpeech Сodec. Кодек, ориентированный на голос, разработанный компанией DSP Group. Используйте этот кодек только при сжатии и передачи по сетям или телефонным линиям файлов, содержащих запись голоса. TrueSpeech производит компрессию данных не в реальном времени, в свою очередь, декомпрессия производится в реальном масштабе времени.
        Microsoft GSM Audio Codec. Кодек, производящий компрессию данных монохромных звуковых записей низкого качества в реальном масштабе времени. Используйте этот кодек при записи голосовых сообщений, вставленных в сообщения электронной почты (e-mail). Для записи голосовых сообщений вы можете использовать приложение Фонограф.
        Microsoft CCITT G.711 A-Law and U-Law Codec. Этот кодек обеспечивает совместимость телефонных стандартов в Европе и северной Америке. Он обеспечивает коэффициент сжатия данных 2:1.
        Microsoft ADPCM Codec. Этот кодек обеспечивает компрессию как в реальном, так и не в реальном масштабе времени, последняя используется пользователями авторских систем мультимедиа. Аудиофайлы лучше генерируются кодеком не в реальном времени масштабе времени.
        IMA ADPCM Codec. Этот кодек был рекомендован Interactive Multimedia Association для использования на различных платформах мультимедиа. Он осуществляет компрессию в реальном масштабе времени и подобен кодеку Microsoft ADPCM.
        Microsoft PCM converter. Этот конвертер позволяет проигрывать 16-разрядный звук на 8-разрядной звуковой карте. Вы также можете использовать этот кодек в случае, когда необходимо поддерживать частоту квантования 1 МГц для карты, поддерживающую другую частоту квантования.

    Программное обеспечение по преобразованию цифровой записи

    Существует множество программ- кодеков, разработанных специально для преобразований файлов с цифровой записью. Цель каждой такой программы одна – сжатие звукового файла с наименьшей потерей качества и наибольшей степенью сжатия. У каждой из них свои плюсы и минусы: у одних качество сжатия высоко, однако скорость этого сжатия желает лучшего, другие моментально кодируют но с потерей качества, кто же захочет слушать файл с любимой музыкальной композицией, которая кряхтит, свистит и шуршит как старая дедова пластинка.
    Наиболее популярные программы-кодеки приведены ниже.

    Voice

    Программное обеспечение состоит из четырёх модулей, которые могут работать как на одном компьютере, так и на разных.
    Первый модуль, работающий в среде Windows, отвечает за работу с внешней аппаратурой, производит непосредственно запись с телефонной (радио) линии и воспроизведение в телефонную (радио) линию звуковых файлов.

    Рис. 4. Диалоговое окно программы Voice

    Второй программный модуль, отвечающий за сжатие звуковых файлов, использует в свой работе стандартные алгоритмы сжатия Wav-файлов. Используемые алгоритмы сжатия позволяют упаковывать поступающие сообщения до уровня 4Кбайт - 600байт за секунду. Алгоритмы сжатия можно оперативно изменять в зависимости от требуемой степени сжатия и качества звучания.
    Третий программный модуль отвечает за ведение базы данных (добавление разговоров в базу данных и автоматическое удаление из неё по мере их старения). В базе данных информация хранится в течение заданного отрезка времени, после чего она либо архивируется, либо автоматически удаляется.
    Последний, четвёртый программный модуль предназначен для работы с базой данных: поиск разговоров, их прослушивание, перезапись и ручное удаление.
    Все модули работают в 32х разрядных средах Windows. Всё программное обеспечение одновременно может работать как друг с другом, так и с другими Windows-приложениями.

    Mpeg Encoder

    Одна из лучших программ-кодеков уходящего столетия.

    Рис.5. Диалоговое окно программы mpeg Encoder

    Один недостаток mpeg Encoder – уходит много времени на сжатие файла с цифровой записью. На обработку звукового файла продолжительностью около 3-5 минут уходит порядка 25-40 минут. Но ожидания стоят того – качество не отличается от оригинала.
    Программа состоит только из одного диалогового окна, что упрощает работу. Не требуется каких-либо дополнительных знаний в области преобразований цифровой информации и т.п., вы указываете путь к исходящему файлу в поле SOURCE и в поле TARGET конечную папку, в которой будет находиться сжатый файл в формате mp3 (по умолчанию). Задаете частоту квантования, параметры качества – стерео или моно и… вперед! Смело жмем кнопку Encode.

    LameBatch

    LameBatch - это незатейливая оболочка, написанная с целью упрощения работы с командными строками mp3-кодеров, называющегося LAME от Mark Taylor и компании. Оболочки основана на простом ядре.

    Рис. 6. Диалоговое окно с параметрами программы LameBatc h

    Содержит всего две вкладки «Files» и «Settings», в последней вы указываете все нужные вам параметры сжатия.

    Основные фишки:

      Только одно окошко (без всплывающих окон непосредственно кодера).
      Индивидуальные настройки кодирования каждого файла.
      Возможность их изменения для других файлов во время кодирования одного.
      Всяческая информация о ходе процесса.
      Проверка файлов на допустимость формата.
      Различные варианты сортировки очереди.
      Незатейливое прописывание тэгов.
      Возможность отложить работу на неопределенный срок.
      Различная настройка папки для результатов.
      Проверка перезаписи и доступного места.
      Поддержка Drag and drop.
      Встраивается в контекстное меню Explorer.
      Выключение машины по окончании процедуры.
    Последняя версия на сегодня это LameBatch 0.99c и выпущена 25 октября. При тестировании использовались LAME 3.35. LameBatch распространяется как халява, поэтому - никаких гарантий.

    Список программ и их достоинства, и недостатки можно перечислять очень долго. Программ-кодеков в последнее время разработано много, стоит подключиться к сети Internet, набрать в строке поискового портала «programs&encode&multimedia» как сразу получишь список программ для обработки звуковых и не только файлов.

    Заключение

    Порассуждаем немного о сжатии звуковых файлов. Для чего это нужно, особо говорить не стоит, упомяну лишь то, что широко распространенные способы сжатия цифровых музыкальных данных в 11–14 раз позволили неимоверно толкнуть вперед программную и «железную» музыкальную индустрию, не говоря уже о том, что с качественной музыкой теперь в Internet проблем, в общем-то, нет. Найти можно практически любую композицию. (На самом деле, конечно же, далеко не любую. Попробуйте поискать что-нибудь нетривиальное - Билли Маккензи, например, или Берни Марсдена, вряд ли у вас что-нибудь получится. Найти можно преимущественно популярную музыку или классику жанра, да и то далеко не всю.
    С момента начала своего бурного развития (около двух лет назад) открытая технология сжатия музыкальной (звуковой) информации качественных изменений технологии сжатия не претерпела. Другими словами, многочисленным поклонникам музыки приходится мириться с достаточно емкими файлами, т. к. никаких сдвигов на этом фронте не намечается. Сегодняшние пределы для сжатия без значительной потери качества составляют около 11–12 раз от оригинального размера музыкального файла. Как известно, на компакт-диске со стандартной частотой оцифровки 44 100 Гц (стерео, два байта на одно амплитудное значение) может уместиться до 74 минут звука - примерно по 10 Мбайт на минуту.
    При средней длительности музыкальной композиции 4 минуты имеем чистого (несжатого) звука 40 Мбайт. Много. Очень много для Internet. Имея модем со скоростью 33,6 Кбайт/с и полный канал для скачивания (т. е. в идеале - 3,5 Кбайт/с) 40 Мбайт мы получим только через 4–5 часов (обычно эта цифра в 1,5–2 раза больше).
    Применяя сжатие музыкального файла без потери его основных характеристик (стерео, частота дискретизации при оцифровке 44 100 Гц, 2 байта на выборку амплитуды), можно добиться уменьшения размера в 11–12 раз. Так что вместо 40 Мбайт получится всего 3,8–3,9 Мбайт. Это уже вполне приемлемо. Можно сжимать еще больше, но тогда ощутимо проигрываем в качестве: отличия от оригинала становятся слышимыми даже не меломану. Называемые здесь пределы - 11 или 12 раз - это уже подобранные и проверенные критерии качество/размер за всю недолгую историю использования программ-сжимателей звуковых файлов.

    Литература

      Том Шелдон. «Windows 95 проще простого»
    Диалектика. Киев. 1996г.
      А. Чижов. «Napster - панацея для MP3-меломана»
    Фантазия. 1999-2000г.
      Internet. Сайты:
        http://www.psf.by.ru
        http://www.submarine.ru
        http://www.nsk.su/~sibell
        http://www.sound_world.ru
        http://www.sulaco.org
    Поиск материала осуществлялся поисковыми системами:
          yandex.ru
          rambler.ru
          altavista.com
          yahoo.com