Прочее        27.11.2020   

Определение типа файла по содержимому. Как определить тип файла без расширения

Послал Вам кто-нибудь e-mail с файлом, с которым не знаете что делать? Вы скачали файл и не имеете понятия для чего он предназначен? В чём можно открыть файл с данным расширением? Ответы на эти вопросы найдёте в этой статье.

Со времён MS-DOS для различия отдельных файлов применяются так называемые расширения. Ранее применялись расширения длиной в три знака за точкой, сегодня же это ограничение уже не действует. Некоторым операционным системам, как например Linux, расширения вообще не нужны. Для идентификации файлов в этих системах применяется команда file, где параметром служит имя файла - впоследствии узнаете кое что о его содержании.

И всё же расширения в этих системах могут появляться, это может быть в случае приложения к e-mail´у или файла из Интернета. Задача расширения - различать файлы по их содержанию. На первый взгляд так можно определить, что будет файл содержать. Для примера можно определить, что файл.txt будет содержать текст, .jpg - картинку а.avi конечно же видео. А что например.bz2, .7z, .lha и т.д.. Не знаете? Читайте дальше и узнаете как это определить.

Как определить, какой это файл?

Первая проблема, с которой Вы можете столкнуться, это то, что расширение данного файла не известно Вашей системе и система спросит, в какой программе должен быть файл открыт. Если расширение неизвестно самому пользователю, нужно начать поиск в Интернете. Некоторые используют любимый поисковик как например Google, или используют прямо некоторые из специализированных сайтах. Благодаря им узнают, о каком файле идёт речь и в какую программу нужно искать. Некоторые сайты занимающиеся расширениями:

File extensions (http://www.file-extensions.org/)

Этот сайт предлагает простой поиск по расширению файла, начальной буквы, или можете просматривать расширения по их назначению. Если найдёте своё расширение, то узнаете и подробную информацию о данном формате, а так же в каких программах может быть данный файл открыт.

FileInfo.net (http://www.fileinfo.net/)

Этот сайт предлагает такие же функции как и предыдущий стой разницей, что не показывает и другие возможные расширения для данного формата. В отличие от предыдущего решения здесь найдёте и соответствующие программы для операционной системы Windows, Mac OS a Linux.

Расширения файлов (http://www.pndesign.cz/pripony-souboru.php)

Чешское подобие предыдущих сайтов. К сожалению много информации здесь не найдёте. Всё же основная информация о данном расширении здесь есть.

И всё таки если не получается?

Расширение можно элементарно поменять и поиски по расширению не обязательно приведут к правильной цели. С изменением расширения я столкнулся у одного пользователя, который не мог воспроизвести фильм, потому что его расширение было для установленного проигрывателя неизвестно (.mp4). Тогда изменили расширение на.avi и его любимый проигрыватель фильм воспроизвёл. Это решение всё же не совсем подходящее, поэтому его не рекомендую. В случае если кто то так уже сделал, решением могут быть разные online услуги для идентификации файлов. Между такими online услуги есть например такие:

iConv (http://www.iconv.com/file.htm)

Предлагает интересную online услугу, где достаточно закачать файл. В последствие Вам страничка "скажет", что этот файл содержит. К сожалению информация из этой услуги слишком скромная. Так что её использование только ориентировочное. Использовать можно только в случае, если существенно изменён формат, т.е. файл с расширением.txt на самом деле видео.

Online TrID File Identifier (http://mark0.net/onlinetrid.aspx)

Здесь можете опять закачать свой файл, о котором ничего не известно. Эта услуга Вам предоставит важную информацию о файле. В отличии от предыдущей программы, эта предоставляет больше информации.

А что если нет интернета? TrID

Проект Online TrID File Identifier имеет и offline версию в виде программы, которая управляется из командной строки. Это может быть для одного плюсом, для другого наоборот минусом. И эта программ сможет определить, что на самом деле файл собой представляет, использует не только расширение. Определение содержимого происходит при помощи исследования и сравнения структуры массива данных, поэтому идентификация у небольших файлов может длиться дольше чем у следующей программы.

File

Опять простая программа, которая управляется через командную строку. В результате работы программы получите информацию о данном файле в виде типа и meta данных. В этом случае можете узнать например имя автора данного документа. Идентификация больших файлов, по времени, всё таки более сложная, чем в предыдущем случае.

Наверняка каждому попадался файл без расширения? Возникают вопросы как его открыть? Один из способов это так просто догадаться, и попытаться изменить расширение файла на различные типы файлов и попробуйте открыть файл. Это иногда работает, а может не повезти, и не удастся угадать. И метод научного тыка может занять изрядно времени, если вы конечно упорный, и вам по зарез нужно открыть этот файл

В этой статье я покажу вам быстрый и более точный способ определения типа файла, который вы можете использовать. Для того, чтобы сделать это, я создал несколько тестовых файлов, PDF, JPEG, MP3, EXE и DLL, просто стер у них расширение. Очевидно, что ваш файл может быть различного типа, но процедура будет такой же, для любого типа файлов. Тестовые файлы выбрал совершенно случайно
Для этой процедуры вам необходимо узнать HEX – код файла. Ну что вы уже напугались и думаете, как все это заумно. Нет, для этого нам нужен текстовый редактор , такой как стандартный Блокнот , или можно скачать (я даже советую это сделать, он намного функциональней, и работает шустрее) Notepad++ .

Открываем файлы без расширения

А теперь просто открываем файлы без расширения в тестовом редакторе, у применяю Notepad++, но методика для всех одинакова.

Первый на очереди PDF тест и видим в первых же строчках информация, о расширении в явном виде.

И видим в JPEG в начале строки, какое не понятное JFIF , в DLL и EXE MZ , а MP3 ID3 . Далее интернет нам в помощь, вбиваем в поисковик фразу, например ID3 формат, или JFIF расширение. И увидим что ID3 – это от англ. Identify an MP3 , некий формат метаданных, но это неважно, это же наверняка mp3 файл. На запрос JFIF получили JPEG File Interchange Format , некая спецификация, MZ – формат исполнительных файлов EXE и DLL . То есть в первых строчках находиться вся нужная нам информации, и мы без труда можем открыть любой файл без расширения

В целом, я считаю, это будет гораздо быстрее так выяснить, чем случайно пробуя различные расширения файлов без какой-либо идеи. Если вы все еще не можете понять, какой файл у вас есть, оставляйте комментарии, и я постараюсь помочь. Наслаждайтесь!

Представим ситуацию, что вам отправили важный документ, после чего отправитель вышел из сети. Скачав файл, вы обнаруживаете, что у него отсутствует расширение. Конечно, лучше в таком случае уточнить информацию у отправителя файла, но не всегда есть возможность с ним связаться. Тогда вам нужно самостоятельно определить расширение, чтобы открыть этот файл. В данной статье будут рассмотрены способы выполнения данной задачи.

Как узнать расширение файла?

Если расширение файла было утеряно, мы должны открыть этот самый файл с помощью блокнота, чтобы посмотреть содержимое, но лучше использовать бесплатную программу Notepad++, потому что при открытии больших файлов блокнот перестает отвечать и очень долго загружает текст.

Возьмем 7 файлов:

  • img_jpg;
  • img_gif;
  • music;
  • document;
  • архив.zip;
  • rar архив;
  • программа.exe.

Изображения

Открываем первый, к примеру img, и видим набор непонятных букв и символов. Обратим свое внимание на первую строку с надписью ‰PNG. Это значит, что png.

У второго изображения мы увидим следующие:

Это значит, что данный файл в формате jpg (jpeg).

Если у вас имеется файл GIF, в этом случае в программе будет отображаться надпись GIF89a.

Музыка

Как узнать, какое расширение у файла аудиозаписи? Сделать это не так уж сложно.

Зайдя в Notepad, мы увидим следующие символы (изображение ниже), что говорят нам о том, что данный файл принадлежит к формату MP3.

Если вы увидели надпись OggS, то знайте, вы столкнулись с

Документы

Стоит отметить, что у всех программ (таблицы, приказ, материалы и тд), будет единая надпись "РП", если у вас Microsoft OFFICE 2003 и ниже или "РК", если у вас Microsoft OFFICE версии 2007 и выше. Дальше видим надпись .xml, что говорит нам о том, что это продукт компании MS. После этого просто перебираем все программы, начиная от Doc заканчивая Pptx. Это заметно увеличивает время поиска нужного формата, но тогда вы точно сможете найти нужный вам тип.

Если вам лень перебирать все типы, то можно воспользоваться онлайн-ресурсом Online TrID File Identifier, о котором пойдет речь ниже.

Архив

В архиве, так же как и в MS, будет "РК", однако, без всяких дополнительных надписей, уточняющих эту информацию. Это будет говорить о том, что перед вами архив ZIP. Когда вы откроете файл rar, то увидите, что он начинается с записи Rar.

Видеозапись

Чтобы узнать расширение файла видеозаписи, мы должны открыть его в Notepad++, где увидим следующие записи, говорящие о том, что перед нами видео формата MP4.

Если же вы столкнулись с AVI, то появится соответствующая запись.

Программа

Как узнать файл без расширения?

При открытии содержимого файла программы в самом начале мы можем наблюдать короткую запись MZ, которая говорит нам, что перед нами, несомненно, файл exe.

Online TrID File Identifier

Если вы не хотите скачивать Notepad++, или вам просто лень нажимать правую кнопку мыши, а затем левую, то к вашему вниманию сервис, который поможет вам узнать расширение файла. Сделать это совершенно не сложно, для этого выполните следующие простейшие действия.

Нужно выбрать файл и нажать кнопку "Старт". Ресурс с точностью до процентов покажет тип файла, который был загружен, название программы, ссылку на информацию о продукте.

Готово, теперь вы можете спокойно ставить потерянное расширение.

Как поставить расширение?

Для того чтобы поставить тип файла, вам нужно нажать правой кнопкой по файлу и переименовать его, добавив в конец названия точку и тип файла. Внимание! Пробелы в расширении ставить нельзя.

Существуют ли еще способы нахождения формата файла?

Да, существует большое количество ресурсов, программ и мануалов. Они подскажут, как можно узнать расширение файла.

Переименовал файл, но ничего не изменилось. Что делать?

В этом случае проверьте правильность написания расширения. Например, чтобы переименовать в MS Word, нужно написать не doc, а docx.

Также вы можете нажать два раза на файл левой кнопкой мыши и открыть его с помощью нужной программы из списка установленных, выбрать в магазине MS или найти программу на компьютере, если ее нет в списке.

Возможно, у вас не установлена программа, которая поддерживает данное расширение. Скачайте и установите данную программу.

Могут ли быть ошибки в онлайн-ресурсах? Где можно узнать расширение файла?

Да, определенно могут. Ни один сервис не застрахован от появления ошибок алгоритма. Но если вы боитесь, что ресурс ошибется, то просто сделайте все вручную.

Заключение

Поздравляем! Вы познакомились со способами, которые помогут вам узнать, какое расширение у файла. Теперь вы сможете его установить на свой компьютер. Данная информация может быть очень полезной для любого пользователя компьютера, ведь столкнуться с такой проблемой может каждый.

К ак известно любая информация будь то текст, изображение или видео, по сути, является ничем иным как набором двоичного кода - последовательности нулей и единиц. Именно в таком виде на жёстком диске хранятся данные. Понятие двоичный код едва ли не абстрактное, это не запись в привычном понимании этого слова, двоичный или машинный код это скорее состояние микроскопических ячеек на магнитной поверхности жесткого диска. Положительный заряд такой ячейки имеет знак плюс или 1, отрицательный - минус или 0.

Логически объединенные последовательности нулей и единиц как раз и составляют то, что мы называем файлами. Но ведь мы знаем и то, что типов файлов очень много. Есть текстовые файлы, мультимедийные, архивные, системные, исполняемые и так далее. Каким же образом операционная система определяет как читать или обрабатывать тот или иной файл? Прикладные программы распознают тип файла по его расширению - набору символов следующих после имени файла и отделенных от него точкой.

Но что будет, если расширение удалить? Всё правильно, операционная система не сможет открыть такой файл, так как не будет знать какую программу для этого использовать. Однако ни логическая структура, ни содержимое переименованного файла от этого не изменится. Вы и сами в этом можете убедиться удалив расширение какого-нибудь файла, а затем попробовав его открыть соответствующей программой. Уверены, с этим у вас проблем не возникнет.

Следовательно, вовсе не расширение определяет тип файла. Тогда что же? Тип файла определяет его формат или иначе спецификация структуры данных. Расширение и формат очень часто путают, хотя на деле это совершенно разные понятия. Тут возникает вполне закономерный вопрос, а как определить формат файла, если его расширение по какой-то причине оказалось утрачено? Оказывается очень просто.

Грубо говоря, все файлы состоят из двух частей. Первая часть это заголовок, содержащий различную метаинформацию включая те данные, которые позволяют прикладным программам этот самый файл идентифицировать. Вторая часть это «тело» файла. Отвечающая за определение типа файла часть заголовка файла именуется дескриптором или описанием. Наиболее распространёнными типами дескрипторов являются HEX и ASCII. Первый тип заголовков можно просмотреть только с помощью специальных утилит - шестнадцатеричных редакторов .

Для просмотра дескрипторов второго типа можно обойтись обычным текстовым редактором, тем же Блокнотом или . Однако следует учитывать, что далеко не все последовательности байтов можно перевести в ASCII-код, поэтому для определения формата всё-таки лучше использовать HEX-редакторы. Открытый в HEX-редакторе файл отображается в виде матрицы из последовательности байтов. Каждая ячейка соответствует одному байту. Данные дескриптора содержатся как раз в первых трёх ячейках (реже двух или четырех), расположенных по горизонтали. Представляют они из себя шесть символов в шестнадцатеричном счислении, например 49 44 33 или ff d8 e0 .

Естественно они нуждаются в расшифровке. А расшифровать их можно на специальных сайтах с описаниями форматов. Одним из лучших сайтов, где можно определить формат по HEX-дескриптору является open-file.ru . Есть и другие подобные ресурсы, но они не настолько удобны. На open-file.ru же имеется специальная поисковая форма, куда можно вставить HEX или ASCII дескриптор и пробить его по базе данных. Система быстро найдёт соответствующий формат и предоставит вам его полное описание.

С HEX-редакторами всё более или менее понятно, но как мы сказали для определения ASCII-заголовков также можно использовать редакторы текстовые. Принцип здесь тот же самый, открываем файл Блокнотом или Notepad++, копируем первые символы и вставляем их в поисковое поле того же open-file или другого сайта с поддержкой поиска по заголовкам.

Казалось бы всё очень просто, но есть в деле идентификации форматов и свои сложности. Иногда ASCII-заголовки совпадают с расширением файла (RAR и PDF), но может быть и такое, что заголовок оказывается принадлежащим сразу нескольким форматам. Это можно видеть на примере офисного формата DOCX (PK и 50 4b 03 04). В таких случаях точно определить формат проблематично.

1. Нажмите кнопку «FILE» или «URL», чтобы переключаться между локальными файлами или онлайн-файлами. Нажмите кнопку «Выбор файлов», чтобы выбрать локальный файл или ввести URL-адрес онлайн-файла.

2. Нажмите «Проанализируйте сейчас!». чтобы начать анализ. Результаты анализа будут перечислены в разделе «Результаты анализа».

относительно:

Не знаете, в каком формате находится ваш файл? Просто загрузите его и дайте нашему серверу проанализировать двоичные подписи файла, чтобы определить, что именно форматирует ваш файл.

Результаты анализа покажут все возможные форматы файлов. Например: если вы отправляете файл DOCX, результаты анализа будут идентифицировать файл как формата DOCX, так и формата ZIP. Это связано с тем, что документы DOCX хранятся в пакетах Open Packaging Convention (OPC), которые представляют собой файлы ZIP, содержащие XML и другие файлы данных. Файл DOCX можно переименовать в ZIP-файл и открыть с помощью программного обеспечения WinZIP.