Все типы расширений файлов. Форматы файлов (типы)

Представьте, что вы получаете почту от своих друзей или коллег, а во вложении они отправили вам какой-то документ в виде прикреплённого к письму файла, в котором есть нужная вам информация. Вы сохраняете этот файл на свой компьютер, но видите, что вместо привычных значков какой-либо программы (Word, Excel, PDF и т.д.) никакого значка нет, а Windows считает, что это какой-то файл с неизвестным форматом. Зачастую это происходит из-за того, что файл в процессе прикрепления к письму отправителем (или при сохранении файла на компьютер получателем) теряет своё расширение, и операционная система Windows перестаёт понимать, что за тип файла перед ней, и соответственно не знает, какой программой нужно открывать такой файл. Что такое расширение файла, и как их отображать и скрывать в различных версиях Windows, вы можете прочитать в .

Второй наиболее частой причиной потери расширения файла является неаккуратное переименование файла, когда у вас в Windows задан режим отображения расширений всех известных типов файлов, и вы при попытке переименовать файл случайно стираете расширение файла и получаете в итоге документ неизвестного происхождения, который уже не сможете открыть двойным щелчком мышки. Например, файл у вас назывался «Письмо.doc», который раньше легко открывался с помощью программы Word, а после переименования он стал называться «Письмо по работе». Обратите внимание, что у файла теперь нет расширения «.doc», которое было случайно стёрто при изменении имени файла, и теперь этот файл не будет открываться двойным щелчком мышки, а попытается спросить у вас, какой именно программой нужно открывать этот файл.

Хорошо, если вы точно знаете, какой тип файла перед вами, и можете просто добавить ему нужное расширение, например, doc или xls, чтобы он автоматически открывался с помощью двойного щелчка мышки по нему. В отдельной статье вы можете прочитать о . Но что делать, если перед вами файл, тип которого вы не знаете? Есть как минимум два способа узнать, какой перед вами тип файла, и задать ему правильное расширение.

В этой статье мы с вами проведём эксперимент — возьмём несколько готовых файлов разных форматов, которые рассматривали в вышеуказанной статье, сотрём им расширения, как будто они были утеряны или случайно удалены, и попытаемся узнать, какой тип имеет каждый файл, и какое ему нужно добавить расширение, чтобы легко открыть его.

В нашем эксперименте будут участвовать несколько файлов:

  1. Bonnie Tyler — Turn around.mp3 — песня в формате mp3
  2. bonus.mp4 — небольшое видео в формате mp4
  3. KeePass-2.28.exe — установочный файл программы KeePass (об этой замечательной программе я расскажу вам в одной из следующих статей)
  4. math.zip — архив zip
  5. Point Break.avi — небольшое видео формата avi
  6. Tulips.jpg — картинка с тюльпанами
  7. Доклад.ppt — презентация, сделанная в MS PowerPoint 2003
  8. Материалы к совещанию.pptx — презентация, сделанная в MS PowerPoint 2007
  9. Письмо.doc — текстовый файл, сделанный в редакторе MS Word 2003
  10. Приказ.docx — текстовый файл, сделанный в редакторе MS Word 2007
  11. Приложение 4.rar — архив rar
  12. резолюция.pdf — файл в формате pdf
  13. Таблица соответствия.xlsx — файл с данным, сделанный в табличном редакторе MS Excel 2007
  14. Табличные данные.xls — файл с данным, сделанный в табличном редакторе MS Excel 2003

На картинке ниже у всех файлов стоят свои расширения (выделены рамочками с красными краями):

Удаляем все расширения файлов, и после этого пропадают все значки программ, с помощью которых можно открывать эти файлы. В Windows XP это выглядит так:

В Windows 7 это выглядит немного по-другому, но смысл тот же — операционная система не знает, какой программой открывать эти файлы.

Теперь при попытке открыть любой файл Windows предложит нам сначала выбрать программу, которой нужно открывать этот файл:

И здесь надо быть аккуратным, поскольку неправильный выбор программы для данного типа файла приведёт к тому, что файл не откроется, и программа выдаст ошибку, а за данным файлом закрепится неправильная ассоциация программы его открытия.

Иногда о том, какой перед нами тип файла и какое расширение у должно быть, можно догадаться и по названию файла. Но мы возьмём тот случай, когда это сделать невозможно.

Итак, перед нами куча файлов с неизвестными форматами и расширениями, и нам надо понять, что это за файлы.

Первый способ узнать, что за тип файла перед нами — это посмотреть содержимое этих файлов с помощью простых текстовых редакторов, например, Блокнота, а лучше — либо с помощью встроенных программ просмотра различных файловых менеджеров, таких, как Total Commander или Far, либо с помощью бесплатного усовершенствованного текстового редактора Notepad++. Рекомендую вам скачать и установить его, поскольку у него есть множество преимуществ перед обычным блокнотом.

Берём первый файл «Bonnie Tyler — Turn around», в списке программ для открытия выбираем Notepad++ (если не установили его — используйте обычный Блокнот, но лучше всё-таки Notepad++, поскольку при открытии больших файлов Блокнот просто зависает), и видим какие-то кракозябры:

Смущать это не должно, поскольку для определения типа файла достаточно посмотреть первую строчку содержимого файла. Здесь видно, что файл начинается с букв «ID3″.

Итак, запоминаем, что если внутри файла его содержимое начинается на «ID3 «, то это музыкальный файл формата mp3, и именно это расширение необходимо ему прописать. После указания расширения файл будет распознан системой как музыкальный, и вы сможете его прослушать.

Открываем второй файл «bonus» той же программой Notepad++ и смотрим его содержимое:

Как видим в первой строчке содержимого файла, в ней неоднократно упоминается, что это видеофайл формата mp4 (выделил красным на скриншоте выше). Да и в целом, если вы видите внутри файла текст вроде «ftypmp42 «, то, как правило, это видеофайл формата mp4.

Проделывая ту же самую операцию по просмотру содержимого со всеми остальными файлами, получаем следующую информацию:

  1. При открытии содержимого файла KeePass-2.28 видно, что файл начинается с букв MZ — это признак того, что перед нами исполняемый файл exe.
  2. При открытии содержимого файла math.zip видно, что файл начинается с букв PK — это говорит нам о том, что данный файл представляет собой архив. Учитывая, что архивы Rar имеют другую запись в содержимом файла, скорее всего это архив Zip, но при этом будьте внимательны и обратите внимание на пункт 6 ниже.
  3. При открытии содержимого файла Point Break в первой же строчке видим подсказку, что перед нами видеофайл формата avi.

  1. При открытии содержимого файла Tulips видим два определяющих формат файла слова — в начале строки «яШя» и затем — «Exif». Эти слова определяют графический формат файла, в частности jpg, и в данном случае мы точно уверены, что перед нами файл-картинка.

  1. Касательно файлов MS Office 2003 «Доклад», «Письмо» и «Табличные данные» — все они во внутреннем содержании начинаются с «РП», поэтому определить сразу, какой из них сделан в Word, Excel или PowerPoint, достаточно сложно. Единственное, в чём можно быть точно уверенным — это то, что данные файлы относятся к одному из приложений MS Office версии 2003 и ниже. Поэтому для открытия таких типов файлов можно использовать перебор трёх расширений, начиная с «doc», затем «xls», затем «ppt». Как правило, одно из них подойдёт.
  2. С файлами «Материалы к совещанию», «Приказ», «Таблица соответствия» немного сложнее — поскольку они сделаны в приложениях MS Office 2007, то по сути они представляют собой архивы, и поэтому в начале их содержимого вы увидите те же буквы, что и в архиве Zip — это буквы «PK». Тем не менее, далее в этой же строке можно увидеть строчку .xml, именно она нам подскажет, что перед нами не просто архив, а документ из серии MS Office Так же, как и в предыдущем пункте, можно использовать последовательный перебор трёх расширений «docx», затем «xlsx», затем «pptx». Одно из них должно подойти.
  1. При открытии содержимого файла «Приложение 4″ видим, что он начинается со слова «Rar» — это самое простое указание на то, что перед нами архив формата rar.
  2. При открытии содержимого файла «резолюция» с самого начала видно указание, что это за файл, поскольку он начинается со строчки «%PDF-1.3″. Цифры могут меняться, но тем не менее аббревиатура pdf обычно присутствует, и указывает на формат файла.

Второй способ определения типа файла требует наличия интернет-соединения, а также желательно, чтобы размер файла был небольшим, поскольку мы будем использовать интернет-сервис для определения формата файла.

Нажимаем мышкой на кнопку «выберите файл», указываем наш файл для анализа (я попробую проанализировать один из сложных файлов «Материалы к совещанию», чтобы увидеть, сможет ли этот анализатор справиться и понять, что этот файл был создан в MS PowerPoint 2007 (у него было расширение pptx, и мы его удалили при нашем эксперименте). После выбора файла нажимаем кнопку «Analize» и получаем следующий результат:

Как видим, сервис с 97%-ой вероятностью определил, что это файл PowerPoint с расширением pptx. И поскольку этот файл также является архивом-контейнером, содержащим внутри себя другие файлы, анализатор также указал трёхпроцентную вероятность, что это может быть архив zip.

Попробуем также проверить, сможет ли этот сервис определить тип нашего файла «резолюция», у которого мы стёрли расширение pdf. Загружаем файл на сервис, нажимаем кнопку «Analize» и видим, что сервис отлично справился с поставленной задачей:

Как я уже говорил, недостатком данного сервиса может быть то, что для анализа файла ему необходимо его полностью загрузить, и если у вас файл большого размера, то этот процесс может затянуться надолго, а то и вовсе не дойти до конца. Поэтому при больших размерах неопознанных файлов попробуйте сначала воспользоваться первым способом определения его типа, а именно — просмотр содержимого файла через файловый менеджер или редактор Notepad++.

Можно конечно воспользоваться специальными программами для определения типа файла, например, File Type Verificator, но на мой взгляд, гораздо проще и быстрее будет воспользоваться одним из двух предложенных выше способов.

Итак, уважаемые посетители сайта, сегодня мы с вами разобрали, как можно определить формат (тип) файла, если было утеряно его расширение. Если у вас появятся какие-либо вопросы, прошу задавать их в комментариях к этой статье.

Навигация записи

Компьютер работает с информацией, которая может быть текстовой, графической, аудио- или видео-формата. Вся информация, обрабатываемая на компьютере, хранится в файлах. Понятие файла является одним из базовых понятий компьютерной грамотности.

Файл – это поименованная область памяти на компьютерном носителе. Другими словами, файлом называется набор данных на компьютерном носителе (жёсткий диск, CD и DVD диск, флешка и т.п.), у которого есть свое имя (имя файла ).

Какие можно использовать символы в имени файла? В именах файлов рекомендуется использовать русские и латинские буквы, цифры, пробелы и знаки препинания. Однако имя файла не следует начинать с точки, а также использовать в имени квадратные или фигурные { } скобки. Недопустимыми для имен файлов являются следующие служебные символы / \ | : * ? “ < >

Существует ли максимальная длина имени файла? Длина имени файла не должна превышать 255 символов. На самом деле, обычно хватает 20-25 символов.

Windows не делает различий между строчными и прописными буквами для имен файлов. Это означает, что не получится хранить в одном и том же каталоге файлы, имена которых различаются только регистром. Например, два имени файла «Название.doc» и «НАЗВАНИЕ.doc» для Windows будет одним именем для одного и того же файла.

Как Вы считаете, могут ли быть в одном каталоге несколько файлов с одинаковым именем PRIMER? Это возможно при условии, что у имени PRIMER будут разные расширения.

Расширение имени файла указывает на тип файла (иногда еще говорят – формат файла ). Таким образом,

  • “тип файла”,
  • “формат файла”,
  • “расширение файла”,
  • “расширение имени файла” –

это, по большому счету, одно и то же.

Например,

PRIMER.doc(x) – типом файла является документ Word (или файл в формате Ворда),

PRIMER.bmp – типом файла является рисунок,

PRIMER.avi – типом файла является видеофайл,

PRIMER.wav – типом файла является аудиофайл.

Все эти файлы имеют разные имена (за счет разных расширений имени файла) и могут храниться в одном и том же месте, т.е. в одном каталоге. Если проводить аналогию с именами людей, то имя файла совпадает с именем человека, а расширение имени файла – с фамилией человека. Соответственно, PRIMER.doc и PRIMER.bmp по этой аналогии то же самое, что Иван Петров и Иван Сидоров. Файлы с именами PRIMER.doc и VARIANT.doc – это два брата из одного семейства документов (с одинаковым расширением.doc), так же как, например, Иван Петров и Федор Петров – братья из одной семьи Петровых.

Расширение имени файла – это часть имени файла, которая начинается с точки, после которой стоят несколько символов.

Распространены расширения, состоящие из трех букв – .doc, .txt, .bmp, .gif и.т.д. Регистр не имеет значения, поэтому.doc и.DOC – это одно и то же расширение документа.

Расширение является необязательным атрибутом в имени файла, т.е. его может и не быть. В таком случае в конце имени файла точка, как правило, не ставится. Расширение хоть и не обязательно, но все-таки желательно, т.к. оно указывает Windows на тип файла. Проще говоря, тип файла является подсказкой для Windows, с помощью какой программы следует этот файл открывать. Например, расширение.doc указывает, что файл следует открывать с помощью редактора Word, а расширение.cdr – на то, что файл открывается графической программой Corel Draw.

Есть зарезервированные (служебные) имена, которые нельзя использовать в качестве имен файлов, так как они являются именами устройств:

PRN – принтер,

COM1-COM4 – устройства, присоединяемые к последовательным портам 1-4,

AUX – то же, что COM1,

LPT1-LPT4 – устройства, присоединяемые к параллельным портам 1-4 (как правило, принтеры),

CON (consol) – при вводе – клавиатура, при выводе – экран,

NUL – «пустое» устройство.

Приведу примеры имен файлов, которые являются недопустимыми:

5<>8/7.txt – символы «<», «>» и «/» запрещены,

В чем вопрос? – символ «?» запрещен,

PRN.bmp – здесь PRN зарезервированное имя.

В зависимости от типа файла на экран Windows выводятся различные значки (иконки):

Проводник Windows (Пуск-Программы-Стандартные-Проводник) по умолчанию имеет режим, когда расширения имен файлов на экран не выводятся, но при этом выводятся значки (иконки) файлов.

При сохранении файла достаточно написать его имя и выбрать тип файла из имеющегося списка. Выбранное расширение автоматически добавится к имени файла. Например, на рисунке ниже к имени файла программа сама добавит расширение.jpg. В результате Windows запомнит этот файл с именем «рисунок в paint.jpg».

Во избежание недоразумений при сохранении файлов всегда обращайте внимание на строку «тип файла», если она есть. Ведь тип файла является для Windows подсказкой, с помощью которого система определяет какой именно программой этот файл можно открыть.

Если Вы скачали из Интернета файл, например, с расширением.rar, но на вашем компьютере не установлена программа-архиватор для работы с такими «сжатыми, заархивированными» файлами, то не удивляйтесь, что файл не открывается. Другими словами, надо отдавать себе отчет, что если открывать файлы, например, в видеоформате, то на компьютере должна быть в наличии соответствующая программа для работы с таким форматом.

Можно провести аналогию между файлом (точнее, между типом файла) и программой, работающей с таким типом файлов. Файл – замок, а программа, открывающая этот файл – ключик. Замок без ключика не открывается, да и ключик без замка особой ценности не представляет.

Упражнения по компьютерной грамотности:

1) Попробуйте на Рабочем столе создать две папки с именами: PRIMER и primer. Для этого на Рабочем столе кликните правой кнопкой мыши на свободном месте, а в появившемся окне – по опции «Создать» и, наконец, клик по опции «Папку». Вместо слов «Новая папка» введите «PRIMER». Затем все это повторяете для создания второй папки с именем «primer». Windows дал Вам «добро» на открытие второй папки?

2) Зайдите, например, в редактор Word и попробуйте сохранить документ с именем PRN. Windows разрешил такое имя для нового файла?

3) Как решить проблему: “С инета скачиваю файлы, а они в формате хsd (PM)/RAR и на компе не открываются, не читаются. Что делать?”

P.S. Статья закончилась, но можно еще прочитать:

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик .
Уже более 3.000 подписчиков

.

ЛЕКЦИЯ 19. СИСТЕМЫ ФАЙЛОВ

Понятие файла

Файл (file) – это смежная область логического адресного пространства. Как правило, файлы хранятся во внешней памяти.

Немного о терминологии. Слово файл уже несколько десятков лет используется как русское – один из многочисленных примеров программистских неологизмов. Первоначально, когда около 50 лет назад появился данный английский термин, в русскоязычной литературе специалисты пытались ввести другую терминологию – слово file переводили как фонд и даже тека (в смысле хранилище ). Однако исторически сложилось иное решение – слово файл стало русским. В английском языке слово file имеет много других значений: например, подшитый в папку бумажный документ и даже стадо (например, слонов) – в последнем случае, как можно предположить, размер "файла" может быть очень велик. У всех в памяти название легендарного сериала " X files" (в вольном русском переводе – "Секретные материалы").

Фирма IBM в документации по своей системе IBM 360 в 1960-х гг. использовала иной термин – набор данных (data set) – для обозначения этого же понятия, однако он не пережил операционную систему, в которой использовался.

Каждый файл имеет свой тип , определяющий, какая информация хранится в файле. Основные типы файлов – программа (код) или данные . Данные подразделяются на числовые, символьные (текстовые) идвоичные ( произвольная информация ).

Структура файла

В различных системах приняты различные точки зрения на структуру файлов. В ряде систем структура файла привязывалась к типу устройства, на котором он находится. В некоторых других системах структура файла была искусственно усложнена. Однако наиболее простую и унифицированную точку зрения из них предложили авторы системы UNIX : файл – это последовательность слов или байтов . Казалось бы, это очевидно, но преимущество данного подхода к файлам в том, что базовое представление файла и базовые операции над ним (read , write ) не зависят от типа устройства. В свое время для программистов нашего поколения такой подход к файлам был откровением, после сложностей системы файлов IBM 360, а затем – "Эльбруса". Можно сказать, что файлы в своем развитии прошли путь , аналогичный развитиюархитектур компьютеров – сначала в сторону значительных усложнений, затем – упрощения и унификации .

Файлы можно условно подразделять на файлы простой и сложной структуры (хотя точка зрения на структуру файла зависит от той программы, которая его обрабатывает).

Файлы простой структуры состоят из последовательности записей (records) – элементарных единиц, в терминах которых выполняются операции обмена с файлом. Записи могут быть:

· строками , если это текстовый файл ;

· двоичными данными фиксированной длины ;

· двоичными данными переменной длины .

Файлы сложной структуры могут быть самого разного вида, например:

· отформатированным документом Microsoft Office (такой файл, кроме собственно текста, содержит управляющие символы переключения шрифтов, цветов и т.д.);

· загрузочным модулем реального или виртуального двоичного кода, например, portable executable (PE) -файлом для платформы.NET; class-файлом для платформы Java; подобные файлы состоят из нескольких секций, содержат внутренние ссылки и таблицы и т.д.

Сложная структура файла может быть смоделирована записями путем добавления соответствующих управляющих символов .

Файлы интерпретируются операционной системой или программами их обработки.

Атрибуты файла

Практически в любой системе файлов можно считать, что файл состоит из заголовка и памяти .В заголовке файла хранятся его атрибуты – общие свойства, описывающие содержимое файла, память файла – это его записи, строки, секции и т.д., содержащие собственно хранимую в нем информацию.

Различаются следующие основные атрибуты файла :

Имя (Name) – название файла в символьной форме, воспринимаемое пользователем.

Тип (Type) – тип хранимой в файле информации. Отдельный атрибут тип необходим для систем, которые поддерживают различные типы файлов. Например, в системе "Эльбрус" значением атрибута тип файла является число, кодирующее тип: 0 – данные, 2 – код, 3 – текст и т.д. Однако более общепринятым подходом является подход, принятый в системах MS DOS , Windows , UNIX : тип файла кодируется расширением имени , например, book.txt – текстовый файл (.txt), содержащий текст книги.

Размещение (Location) указатель на размещение файла на устройстве.

Размер (Size) – текущий размер файла .

Защита (Protection) – управляющая информация , задающая полномочия чтения, изменения и исполнения файла.

Время и дата . Например, во всех системах хранится дата создания файла и дата последней модификации файла. Последняя играет важную роль при компиляции (сборке) больших программных проектов, так как утилиты для сборки проектов (например, make ) определяют по соотношению дат последней модификации файлов исходного кода и двоичного кода, следует ли перекомпилировать исходный файл .

В ОС UNIX дату модификации файла можно изменить командой touch f, где f – имя файла . Touch дословно означает потрогать . Кроме изменения времени модификации, больше никаких действий над файлом не производится.

Идентификация пользователя .В любой системе поддерживается понятие хозяин (создатель) файла (owner) .Именно хозяин вправе задавать другим пользователям полномочия для работы с файлом.

Информация о файлах хранится в структуре директорий ( или справочников - directories) ,иногда, например, в системе Windows , называемых также папками (folders) – структурами во внешней памяти, содержащими символьные имена файлов и ссылки на них. Важнейшая концепция директории подробно рассматривается далее в данной лекции.

Операции над файлами

Хотя набор операций над файлами и особенно их обозначений различается от системы к системе, можно выделить следующие основные операции над файлами.

· Создание файла (Create ). Создается заголовок файла; первоначально его содержимое (память) пусто.

· Запись в файл (Write ). Как правило, происходит записями (records) или блоками – более крупными логическими единицами информации, объединяющими несколько записей, с целью оптимизацииопераций ввода-вывода .

· Чтение из файла (Read ). Обычно также выполняется записями или блоками.

· Поиск позиции внутри файла (позиционирование) (Seek ). Позиция задается номером записи или блока, либо специальными именами, обозначающими начало файла (позиция перед первой записью) или конец файла (позиция после последней записи).

· Удаление файла (Delete ). В зависимости от реализации системы файлов, ошибочное удаление файла может быть фатальным (UNIX) или исправимым (MS DOS).

· Сокращение файла (Truncate ).

· Открытие файла (Open ) – поиск файла в структуре директорий по его символьному имени (пути) и считывание его заголовка и одного или нескольких смежных блоков в буфера в основной памяти.

· Закрытие файла (Close ) – запись содержимого буферов в блоки файла; обновление файла во внешней памяти в соответствии с его текущим состоянием; освобождение всех структур в основной памяти, связанных с файлом.

Для выполнения операций обмена с файлом (read, write ), как правило, файл необходимо открыть. Закрытие файла является обязанностью пользовательского процесса ; однако, если он по какой-либо причине этого не выполняет, то закрывает все файлы, открытые процессом, операционная система после завершения или прекращения процесса.

Типы файлов – имена и расширения

В таблица 19.1 приведены некоторые наиболее употребительные типы файлов и соответствующие им расширения имен.

Таблица 19.1. Типы файлов – имена и расширения
тип файла расширение имени функциональность
исполняемый код (загрузочный модуль) exe, com, bin или отсутствует готовая к выполнению программа в бинарном машинном коде
обьектный модуль obj , о откомпилированная программа в бинарном коде, но не слинкованная
исходный код на языке программирования с, сс, Java, pas, asm , а исходный код на различных языках (Си, Паскаль и др.)
командный файл bat, sh файл с командами для командного интерпретатора
текст txt, doc текстовые данные, документы
документ для текстового процессора wp, tex, rtf , doc документ в формате какого-либо текстового процессора
библиотека lib, a, so, dll, mpeg, mov, rm библиотеки модулей для программирования
файл для печати или визуализации arc , zip, tar ASCII или бинарный файл в формате для печати или визуализации
архив arc , zip, tar несколько файлов, сгруппированных в один файл, для архивации или хранения
мультимедиа mpeg, mov, rm бинарный файл , содержащий аудио- или видео информацию

Смысл их ясен из приведенной таблицы. Следует заметить, что унифицированных расширений имен, принятых в различных ОС, очень мало – по -видимому, только .txt (текст) и расширения для исходных кодов на языках программирования, например, .c – Си , .p или. pas – Паскаль и др. Объектные модули называются по -разному (в Windows .obj , в UNIX - .o ), библиотеки – тоже: статически линкуемые в Windows - .lib , вUNIX - .a ; динамически линкуемые в Windows - .dll , в UNIX – .so .Интересно отметить, что для исполняемого кода в Windows есть стандартное расширение - .exe ,а в UNIX – нет, зато есть весьма экзотическое полное стандартное имя: a.out (assembler output) .Унифицированы расширения имен для различных текстовых процессоров: . doc - Microsoft Word , .pdf – Adobe Acrobat и др.

Методы доступа к файлам

Традиционно различаются файлы последовательного доступа и прямого доступа .Файл последовательного доступа – это файл , доступ к которому возможен только позиционированием на начало и конец и затем операциями обмена вида считать или обновить следующую (предыдущую ) запись . Файл прямого доступа – это файл , для которого возможен непосредственный доступ по номеру записи и операция обмена с явным указанием номера записи. В любом случае, при выполнении обмена с файлом всегда существует некоторая текущая позиция по файлу, указывающая на некоторую запись , на позицию перед началом или после конца файла. В операциях над файлом последовательного доступа произвольная установка позиции не допускается, а разрешены только операции , автоматически передвигающие текущую позицию на следующую (предыдущую) запись .

Подобная особенность связана с различием устройств, на которых размещены файлы (например, магнитная лента – по сути дела, последовательное устройство), однако необходимость организации последовательных или прямых файлов может быть связана с сутью задачи.

По -видимому, последовательный доступ используется чаще: именно так происходит ввод данных, вывод результатов на печать или на экран.

Типичные :

reset – установка на начало файла для чтения

rewrite – установка на начало файла для записи.

Типичные операции прямого доступа:

position to n – позиционирование на запись с номером n

rewrite n, где n - относительный номер блока (записи).

Описанная трактовка последовательных файлов и операций над ними иллюстрируется рис. 19.1.

Рис. 19.1. Файл последовательного доступа.

При необходимости можно смоделировать операции последовательного доступа для файла с прямым доступом. Способ моделирования показан в таблица 19.2.

Указатель на текущую позицию, характерный для последовательного доступа , для файла прямого доступа моделируется переменной cp , а операции последовательного доступа – операциями прямого доступа с указанием cp в качестве номера блока.

Для ускорения доступа к файлу большого объема может использоваться индексный файл , содержащий ссылки на записи основного (относительного ) файла. рис. 19.2 изображен пример основного файла, содержащего упорядоченные по фамилиям анкетные данные людей. Индексный файл для данного основного файла содержит ссылки на первые логические записи анкет с заданной фамилией, например, Smith.


Рис. 19.2. Индексный файл и основной файл.

Директории

Директория (directory, folder) - узел, содержащий информацию о файлах – их имена и ссылки на файлы и на другие директории во внешней памяти. Таким образом, возможна организация иерархии директорий или их более сложных взаимосвязей, вплоть до произвольных графов. Как структура директорий, так и файлы хранятся на диске. С помощью директорий поддерживается именование файлов с помощью путей (paths) – многослоговых имен, состоящих из имени корневой директории (или логического диска) и последовательности имен директорий последующих уровней. Например, в системе Windows c:\doc\plan.txt путь доступа к файлу, задающий его расположение – на логическом диске C: ,в директории doc (документы), и имя файла plan.txt .Имя содержит расширение, указывающее на тип файла .

Резервное копирование (back-up) файлов и директорий выполняется на специальные предназначенные для этого носители – например, на ленту (стример ), flash-память , внешний переносной жесткий диск , компакт-диск (CD , DVD ). Настоятельно рекомендуется регулярно копировать на внешний носитель (или на несколько внешних носителей) наиболее важные директории.

Особенности системы файлов в "Эльбрусе"

Говоря о структуре директорий и именовании файлов, нельзя не упомянуть столь экзотическую систему файлов, как в МВК "Эльбрус". Это будет полезно читателям, чтобы сравнить и лучше оценить разнообразие подходов к системам файлов.

Основные концепции системы файлов МВК "Эльбрус" – это файлы , контейнеры , справочники . Понятие контейнера в "Эльбрусе" близко к современным понятиям тома и контейнера в системах Windows и Solaris: контейнер – это хранилище файлов на одном или нескольких дисках. Понятие справочника близко к понятию директории в традиционных файловых системах.

Файл в "Эльбрусе" состоит из заголовка и памяти. В заголовке хранятся атрибуты файла , число которых – порядка 100 (!).

Существенным отличием файловой системы "Эльбруса" является то, что возможно создание файла и управление им без присваивания ему имени , т.е. без отображения его в справочниках (директориях). Такой временный файл создается в программе, ссылка на файл хранится в глобальной или локальной переменной, и по окончании выполнения программы файл уничтожается, если на него не была сохранена ссылка в справочнике на диске. Кроме того, файлы могут ссылаться друг на друга (по прямой "физической" файловой ссылке, а не c помощью символьных путей) через справочники внешних ссылок (СВС) .СВС имеется у каждого файла. Его элементы адресуются по номерам, а не по именам. Типичный пример: файл объектного кода (ФОК) ссылается через свой СВС на файл дополнения к файлу объектного кода (ДФОК) ,содержащий в унифицированном виде таблицы именованных сущностей, определенных в программе и ее процедурах. Выражаясь современным языком, ДФОК содержит метаданные . Эта взаимосвязь используется при диагностике ошибок времени выполнения и для многих других целей.

К недостаткам файловой системы "Эльбруса" можно отнести усложненную структуру файлов, большое число атрибутов, зависимость логической структуры файла и набора операций над ним от типа внешнего устройства , на котором он расположен. По сравнению с системой файлов "Эльбруса", система файлов в UNIX гораздо проще и удобнее, но нисколько не уступает по функциональности.

Типичная организация файловой системы изображена на рис. 19.3.


Рис. 19.3. Организация файловой системы.

Файловые системы организуются на дисках . Каждый диск поделен на разделы (partitions) – смежные области дисковой памяти, имеющие свои логические имена (обычно в виде первых букв латинского алфавита). Однако возможна и организация раздела, занимающего несколько дисков. Для деления диска на разделы рекомендуем утилиту Partition Magic . В разделах хранятся директории и файлы. Каждый раздел имеет корневую директорию , у которой при необходимости могут быть организованы поддиректории , на которые она ссылается.

Следует иметь в виду, что в разных разделах могут быть установлены различные операционные системы, использующие разное форматирование и разные файловые системы для своей работы. Даже если на компьютере установлена только одна ОС, различные разделы могут использовать различные типы файловых систем, например, в Windows раздел A может использовать файловую систему FAT32 , а раздел B – файловую систему NTFS . В разделе C может быть инсталлирована ОС Linux, использующая свою собственную файловую систему Ext2Fs .


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-11

Большинству пользователей известно, что каждый файл имеет свое наименование, состоящее из самого имени и расширения. Между собой эти два элемента обычно бывают разделены точкой. Имя файла пользователь может выбрать самостоятельно. А вот с расширением все немного сложнее.


Дело в том, что оно привязано к типу файла. Изменять его не рекомендуется. Чаще всего человек работает с одним и тем же форматом файлов, который непосредственно связан с родом его деятельности. Так, например, профессиональные музыканты часто работают со звуковыми файлами. Но есть наиболее распространенные типы файлов, которые используют практически все пользователи в своей повседневной жизни.

К ним относятся:

1. Архивы.

Rar –группа файлов или один файл, который сжат с использованием технологии сжатия rar. Коэффициент сжатия более высокий, чем у формата zip. Аббревиатура rar расшифровывается следующим образом: roshal Archive от имени разработчика, Евгения Рошаля.

— zip – файл, сжатый при помощи технологии zip. Данный формат поддерживается большинством современных архиваторов. Пользователи Windows могут создавать такие архивы, используя программу WinZip.

2. Видео

— Avi — видео файлы с данными, закодированными при помощи различных кодеков. Формат использует меньшую степень сжатия, чем аналогичные форматы. Для воспроизведения avi файлов могут быть использованы различные медиа-плееры. Главное, чтобы программа поддерживала кодек, используемый при кодировании файла.

— mpeg1-2 (MPG) – формат для хранения звука и видео с потерей данных и компрессией.

— mpeg4 (MP4) – клип или видео, сжатый в формате MP4 обычно используется для передачи и обмена файлами в интернете. Также в данном формате могут использоваться различные технологии сжатия для видео и аудио дорожек.

— SWF – файлы с таким расширением создаются при помощи программы Macromedia Flash. Данный формат используется для хранения анимационных клипов и векторной графики. Файлы могут содержать звук. Для их просмотра нужен проигрыватель Flash Player и современный интернет-браузер. Файлы с расширением swf нельзя редактировать.

3. Графические файлы

— bmp – растровый графический формат. Это стандартный формат, используемый для графических файлов в ОС Windows. Сегодня практически все программы и приложения для редактирования изображений, могут читать и редактировать файлы в этом формате. Отличительной чертой формата является то, что изображение не подвергается сжатию.

— gif – Graphics Interchange Format – стандарт, разработанный фирмой CompuServe. Используется для хранения цветных растровых изображений. Формат был создан для использования в сети, поэтому файлы в этом формате имеют малый размер. Gif можно использовать для записи черно-белого изображения. Также можно использовать для сохранения анимации.

JPG — обычно используется для хранения растровых изображений. Формат JPEG отличается высокой степенью сжатия. Это позволяет значительно уменьшить размер файлов. Однако для данного формата характерна потеря качества. Сегодня JPEG считается одним из лучших форматов для хранения цветных изображений и фотографий. Его удобно использовать в Интернете и для рассылки по электронной почте.

— psd – графический формат, используемый при работе с программой Photo Shop.

— tif (tiff) – Тегированный формат, растровый графический формат. Данное расширение используется для сохранения изображений высокого качества. На сегодняшний день данный формат является стандартным для обмена данными. При использовании tif, можно сжимать изображение без потери информации. Tif широко используется пользователями цифровых фотоаппаратов.

4. Текстовые файлы

— doc – текстовый документ, созданный при помощи программы Microsoft Word. В нем может содержаться текст, таблицы, графики, диаграммы, параметры печати и форматирования.

— pdf – текстовый документ, используемый в программе Adobe Acrobat. Подходит для предоставления документов в фиксированной форме. Отображение документа не будет зависеть от типа устройства, но котором оно будет открыто. Это означает, что документ будет отображаться в таком виде, в каком он был создан.

— rtf – формат, используемый для хранения размеченных текстовых документов. Предложен компанией Microsoft. Документы в формате rtf сегодня поддерживается в большинстве текстовых редакторов. Также в наиболее распространенных редакторах реализована возможность импорта и экспорта в формат rtf. В связи с этим формат Rtf довольно часто используется для переноса текста из одной программы в другую. Встроенный в ОС Windows редактор текста WordPad сохраняет все документы в формате rtf по умолчанию.

— txt – стандартный текстовый формат. Позволяет сохранять неформатированный текст. Открыть документ в формате txt можно в любой программе для обработки текста.

5. Звуковые файлы

— midi – с помощью данного формата можно создавать схожие звуки на различных устройствах. Кроме того, этот формат позволяет организовать обмен данными между устройствами.

— mp3 – параметры сжатия, используемые формате MP3 аналогичны тем, которые используют в JPG изображениях. Используя данных формат можно добиться десятикратного сжатия, с соответственной потерей качества звука. Конечно, качество звука в этом формате является предметов споров, но для не профессиональных музыкантов этого вполне достаточно.

— wav – формат, разработанный компанией Microsoft. Используется в операционной системе Windows. При помощи данного формата можно достаточно точно передать звук. При этом формат не занимает много места на диске. Но для передачи в сети интернет формат Wav не подходит.

— wma – формат также разработан компанией windows. Используется для трансляции и хранения звуковых файлов.
Другие распространенные форматы

— exe – в данном формате хранятся приложения и программы. Запускается файл в формате exe при двойном клике мыши.

— html – Hyper Text Markup language – формат, используемый для создания интернет-страниц.

Файл (от англ. file - цепочка) - последовательный набор данных, который хранится на каком-либо физическом носителе. Чтобы пользователь мог найти то, что ему необходимо, файл имеет название. Чтобы компьютер «мог различать» файлы, они имеют расширение, жестко привязанное к формату. И если с названием файлов все понятно: мы сами назначаем название (например, фото с отпуска 2011), то форматы файлов - вещь более тонкая...

Итак, формат позволяет системе понять, к какому типу файл относится, и с помощью какой программы его можно открыть. К примеру, музыкальные файлы открываются с помощью музыкальных редакторов, текстовые документы - с помощью редакторов текстовых и так далее. На каждый формат файлов существует программа, с помощью которой этот файл можно открыть, и это вполне понятно, ведь файлы создавались каким-то образом, в какой-то программе, значит, как минимум, этой же программой файл можно открыть.

Тем не менее, не только компьютер должен различать файлы по форматам (расширениям), пользователь также может вынести много пользы из знаний о форматах - как минимум, вы сможете знать, о каком файле идет речь (музыкальном, видео, текстовом, об архиве), и примерно предполагать, какой именно программой файл можно открыть (хотя это знать в большинстве случаев необязательно - операционная система сама способна распознать формат файла по расширению, и подобрать нужную программу).

Итак, какие бывают форматы файлов?

Условно все многообразие форматов можно разделить на несколько групп: архивы, музыкальные файлы, видео, текстовые файлы. Остановимся на каждой категории более подробно.

Архивы предназначаются для пересылки и хранения данных в наиболее удобном компактном виде. Представлены, в основном, такими форматами, как ZIP и RAR, причем последний отличается большим коэффициентом сжатия, то есть, если вы заархивируете один из тот же файл, то в RAR-сжатии он будет весить меньше - а чем меньше архив, тем меньше потребуется места для его хранения, а для передачи понадобится меньше времени и меньшая пропускная способность канала передачи.

Видео файлы

Наиболее распространенным форматом видео файлов является формат AVI. Однако нужно заметить, что файлы этого формата могут кодироваться в различных кодеках, и чтобы плеер мог проиграть ролик, он должен поддерживать соответствующий кодек.

Для пересылки видео роликов в Интернете используют не менее распространенный формат MP4, который характеризуется раздельным сжатием видео и аудио дорожек - это может незначительно отражаться на качестве.

Аудио файлы

MP3 характеризуется высоким коэффициентом сжатия, при этом качество звука может теряться. Майкрософт предлагает свое решение - формат WAV, который не использует сжатия, благодаря чему качество звука остается на высоком уровне, но при этом файлы занимают много места на диске.

Графические файлы

Открываются графическими редакторами. Одним из наиболее популярных форматов является BMP - практически любые утилиты Windows способны читать и создавать файлы в этом формате.

Для обмена графическими данными в Сети используют, как правило, формат GIF .

JPG (JPEG) используют для растровых изображений. Этот формат называют аналогом MP3 (аудио файлы) и MP4 (видео файлы). Характеризуется высоким коэффициентом сжатия, но при этом нередко приводит к потере качества изображения.

Среди форматов текстовых файлов стоит отметить DOC (документ, создаваемый в Ворде), PDF (документ утилиты Adobe Acrobat), PTF (от Майкрософт), TXT (неформатированные тексты).

Выше представлены наиболее популярные сегодня форматы файлов, но список на этом не заканчивается - существует еще огромное количество разнообразных форматов, как для текстов и изображений, так и для аудио, видео роликов.