Самый лучший музыкальный формат. Есть ли разница между аудио форматами MP3, AAC, FLAC и какой нужно использовать? Что такое сжатие файлов? Что значит сжать

Зачастую является мерилом качества трека. Много споров ведется о том, какой же самый лучший формат музыки. Вот и я на днях стал свидетелем подобного спора. Не виртуального, а реального.В общем, решил я написать статью про аудиоформаты и человеческим языком попытаться объяснить какой самый лучший формат аудио. Постараюсь избежать заумных терминов и описания характеристик, чтобы лишний раз не травмировать мозг читающих.

Сразу же признаюсь, что не буду петь дифирамбы в честь какого-то конкретного аудиоформата, равно как и «опускать» никого не собираюсь. Пускай каждый сам решает. Не буду залезать в «дебри» и пробегусь по наиболее известным форматам музыки высокого качества.

Я считаю, что споры эти ведут люди, мягко говоря, не сведущие в этой теме. Так как профессионалы (то есть люди, которые знают, что они делают и зачем они это делают) не будут заниматься подобным. При нынешнем изобилии аудио форматов любой нуждающийся найдет то, что ему нужно. Согласитесь, глупо будет выглядеть спор тракториста и шофера, на тему что лучше — трактор или машина. Для одних целей — трактор, для других — машина. Вот и здесь так же.

WAV — справедливо считается самым качественным форматом музыки. Этот формат аудио без сжатия и без потери качества. Используется при записи и обработке звука, это самый качественный звук, так как запись в WAV происходит без сжатия. Кодируется в любой другой аудиоформат. Ну и как результат — довольно много «весит», поэтому используется преимущественно при звукозаписи.

Сжатие звука с потерями

Начну со всем известного и всеми применяемого (хоть и не всегда любимого) формата MP3. Этот аудиоформат активно используется везде и всюду, где надо и где не надо. Но это не значит, что он недостоин места, которое занимает в своей нише. Очень даже достоин. Хоть «сидит» он в своей нише уже около двух десятков лет, никто его пока оттуда не «вышиб». А желающих было много надо сказать. И главный фаворит из них WMA (Windows Media ), который задуман был Microsoft, как альтернативаMP3. В итоге он альтернативой и является, не смотря на старания разработчиков. Следующий персонаж — OGG . Несмотря на более широкие возможности, чем MP3 , например, так и не получил массового признания. Хоть и поддерживается многими операционными системами. Пожалуй, стоит упомянуть еще аудиоформат AAC, который должен был в эстафете сменить . В нем улучшено качество кодирования и уменьшены потери при сжатии. Но… увы.

Главным преимуществом этих форматов является небольшой размер. Из минусов — потеря качества.

Сжатие звука без потерь

FLAC — пожалуй, самый популярный кодек кодирования и формат звука без потери качества. Меломаны постепенно переходят на этот формат. WavPack составляет ему достойную конкуренцию, но не так популярен. Такая же история и с Apple Lossless , в котором размер сжимается до 60%.

Здесь история с точностью до наоборот: качество лучше, а размер больше.

Скептики утверждают, что на слух практически невозможно отличить MP3 (320 кбит/c) от Losless . «А если разницы нет, зачем платить больше?». Действительно, на обычной аппаратуре почувствовать разницу аудиоформатов достаточно сложно, даже меломанам. Но есть и такие, которые эту разницу сразу чувствуют (лично присутствовал на эксперименте). А вот при прослушивании на хорошем аппарате разница огромная. Вся беда в том, что хороший аппарат далеко не все себе могут позволить.

Мы рассмотрим различные форматы звуковых файлов:

WAVE (.wav) - наиболее широко распространенный звуковой формат. Используется в OC Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять произвольные данные в структурированном виде. Для записи звука используются различные способы сжатия, поскольку звуковые файлы имеют большой объем. Самый простой способ сжатия - импульсно-кодовая модуляция (Pulse Code Modulation, PCM), но он не обеспечивает достаточно хорошего сжатия.

AU (.au,.snd) - формат звуковых файлов, используемый на рабочих станциях фирмы Sun (.au) и в операционной системе NeXT (.snd). Получил широкое распространение в сети Internet, на ранней стадии развития которой играл роль стандартного формата для звуковой информации.

MPEG-3 (.mp3) - формат звуковых файлов, один из наиболее популярных на сегодняшний день. Был разработан для сохранения звуков, отличных от человеческой речи. Используется для оцифровки музыкальных записей. Предшествующие версии формата: MP1 и MP2. При кодировании применяется психоакустическая компрессия, при которой из мелодии удаляются звуки, плохо воспринимаемые человеческим ухом. Ранние версии обеспечивают худшую компрессию, но менее требовательны к ресурсам компьютера при воспроизведении. Характеристики процессора напрямую влияют на качество звучания, - чем слабее процессор, тем больше искажения звука.

MIDI (.mid) - цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface). Этот стандарт разработан в начале 80-х годов для электронных музыкальных инструментов и компьютеров. MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком - это сокращенная форма записи музыки в числовой форме. MIDI-файл представляет собой последовательность команд, которыми записаны действия, например, нажатие клавиши на пианино или поворот регулятора. Эти команды, посылаемые на устройство воспроизведения MIDI-файлов, управляют звучанием, небольшое MIDI-сообщение может вызвать воспроизведение звука или последовательности звуков на музыкальном инструменте или синтезаторе, поэтому MIDI-файлы занимают меньший объём (единица звукового звучания в секунду), чем эквивалентные файлы оцифрованного звука.

MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот. Файлы в этом формате начинаются с набора образцов звука, за которыми следуют ноты и информация о длительности. Каждая нота воспроизводится с помощью одного из приведенных в начале звуковых шаблонов. Такой файл относительно невелик и имеет структуру, базирующуюся на нотах. Это облегчает его редактирование с помощью программ, имитирующих традиционную музыкальную запись. Он, в отличие от MIDI-файла, полностью задает звук, что позволяет воспроизводить его на любой компьютерной платформе.



IFF (.iff) - Interchange File Format – формат, первоначально разработанный для компьютерной платформы Amiga. Сейчас также используется на компакт-дисках в форме CD-I. Его структура очень похожа на структуру формата RIFF.

AIFF (.aiff) - Audio Interchange File Format - формат для обмена звуковыми данными, используется на компьютерных платформах Silicon Graphics и Mac. Во многом напоминает формат Wave, однако в отличие от него позволяет использовать оцифрованный звук и шаблоны. Многие программы способны открывать файлы в этом формате.

RealAudio (.ra, .ram) - формат, разработанный для воспроизведения звука в Internet в реальном времени. Разработан фирмой Real Networks (www.real.com). Получающееся качество в лучшем случае соответствует посредственной аудиокассете, для качественной записи музыкальных произведений использование формата mp3 более предпочтительно.

4.3. MIDI и цифровой звук: достоинства и недостатки

Формат WAVE представляет собой один из многочисленных, но далеко не единственный формат для записи цифрового звука. В отличие от MIDI-данных данные цифрового звука действительно представляют звук, записанный в виде тысяч единиц, называемых квантами (samples). Цифровые данные представляют амплитуду (или громкость) звука в дискретные моменты времени. Звучание цифровых данных не зависит от устройства воспроизведения и поэтому их звучание всегда одинаково. Но за это приходится расплачиваться большими объемами звуковых файлов.

MIDI-данные по отношению к цифровым данным - то же самое, что и векторная графика по отношению к растровым изображениям. То есть MIDI-данные зависят от устройств воспроизведения звука, а цифровые данные не зависят. Так же как вид векторных графических изображений зависит от принтера или экрана монитора, так и звучание MIDI-файлов зависит от MIDI-устройства для воспроизведения этих файлов. Аналогично, звучание мелодии, сыгранной на концертном фортепиано, будет отличаться от звучания этой же мелодии на простом пианино. Цифровые данные, с другой стороны, идентичны и не зависят от системы воспроизведения. Стандарт MIDI в этом смысле аналогичен стандарту PostScript и позволяет управлять инструментами на понятном языке.

По сравнению с цифровым звуком MIDI имеет следующие преимущества:

§ MIDI-файлы занимают меньший объем памяти, и размер этих файлов не влияет на качество звучания. В среднем MIDI-файлы в 200 - 1000 раз меньше цифровых файлов и поэтому занимают малый объем в оперативной памяти, на дисках, и для них не требуется больших ресурсов центрального процессора.

§ В некоторых случаях звучание MIDI-файлов лучше, чем цифровых аудиофайлов. При этом источник звучания MIDI-файлов должен быть высокого качества.

§ Вы можете изменять длину MIDI-файлов, изменяя темп звучания и при этом сохраняя качество и громкость звучания. MIDI-данные можно легко редактировать, даже на уровне отдельных нот. Вы можете манипулировать небольшими сегментами MIDI-композиции (с точностью до миллисекунд), что невозможно в случае цифрового звука.

Основной недостаток MIDI-файла вытекает из его достоинств. Поскольку MIDI-данные не являются сами по себе звуком, то воспроизведение будет настолько точным, насколько устройство воспроизведения MIDI-данных идентично устройству, которое использовалось для создания исходного файла. Даже звук MIDI-инструмента в соответствии со стандартом General MIDI зависит от электронного устройства воспроизведения и используемого при этом метода. MIDI-звук не используют для воспроизведения речи.

Основное преимущество цифрового аудио перед MIDI-звучанием заключается в том, что качество воспроизведения цифрового звука всегда постоянно, и здесь MIDI-звучание уступает цифровому звучанию. Существуют две причины, по которым следует работать с цифровым звуком:

§ более широкий выбор программ и систем, которые поддерживают работу с цифровым звуком;

§ для подготовки и создания цифровых звуковых элементов не требуется знание музыкальной теории, чего не скажешь о MIDI-данных.

Существует множество различных аудио форматов. Наиболее часто используются такие форматы как MP3 (MPEG-2 Audio Layer III) и WAV. Тип формата обычно определяется расширением файла (то, что идет после точки в имени файла.mp3, .wav, .ogg, .wma)

Кодек - это определенный алгоритм кодирования и сжатия данных в аудио-формат. Для некоторых типов файлов кодек однозначно определен. Например в формате mp3 всегда используется кодек MPEG Layer-3, а в формате mp4 могут быть использованы разные кодеки.

Часто понятия кодека и формата используют в одном смысле. Особенно, когда в формате всегда используется один и тот же кодек. Но, иногда, важно различать понятия форматов и кодеков. Для удобства, можно считать, что формат является своего рода контейнером, в котором может быть записан аудио или видео сигнал с помощью определенного кодека.

Некоторые форматы, такие, например, как mp4 или flv могут содержать в себе как аудио, так и видео потоки.

Если вы не знаете, какой программой открыть тот или иной аудио-формат, то советуем воспользоваться нашим аудио-конвертером . Он поддерживает почти все форматы.

Кодеки разделить на два вида, в зависимости от типа сжатия:

Без потери качества звучания (lossless)

Данная группа форматов записывает кодирует звук таким образом, что при раскодировании он может быть в точности восстановлен.

Наиболее популярные форматы кодирующие звук без потери качества:

  • FLAC (Free Lossless Audio Codec)
  • APE (Monkey’s Audio)
  • ALAC (Apple Lossless Audio Codec)

С потерей качества звучания (lossy)

При сжатии с потерями звук модифицируется. Например, из него вырезаются неслышные человеческому уху частоты. Раскодированный файл будет отличаться от оригинального с точки зрения записанной в нем информации, но звучать будет примерно так же.

Популярные форматы с потерей качества:

Подробнее о популярных аудио-форматах

WAV - один из первых аудио-форматов. Обычно используется для хранения несжатых аудио-записей (PCM), идентичных по качеству звука записям на компакт-дисках (audio-CD). В среднем одна минута звука в формате wav занимает около 10 мегабайт. Часто в него копируют аудио-CD, а потом конвертируют в mp3 с помощью аудио конвертора.

MP3 (MPEG Layer-3) - набиолее распространенный в мире звуковой формат. MP3, как и многие другие форматы с потерей качества, урезает звук, который не слышится человеческим ухом, тем самым уменьшая размер файла. На текущий момент mp3 не является лучшим форматом по соотношению размера файла к качеству звучания, но в силу своей распространности и поддерживаемости большинством устройств, многие хранят свои записи именно в нем.

WMA (Windows Media Audio) - формат, принадлежащий компании Microsoft. Изначально данный формат был представлен, как замена MP3, имеющая, по заявлению Microsoft, более высокие характеристики сжатия. Но данный факт был поставлен под сомнения некоторыми независимыми тестами. Так же формат WMA поддерживает защиту данных через DRM.

OGG - открытый формат, поддерживающий кодирование аудио различными кодеками. Наиболее часто в ogg используется кодек Vorbis. По качеству сжатия формат сопоставим с MP3, но при этом менее распространен с точки зрения поддержки в аудио-проигрывателях и плеерах.

AAC - запатентованный аудио-формат, имеющий большие возможности (количество каналов, частоты дискретизации) по сравнению с mp3 и дающий несколько лучшее звучание, при том же размере файла. На данный момент aac является одним из самых качественных алгоритмов кодирования звука с потерями. Формат поддерживается большинством устройств. Файл этого формата может иметь расширения aac, mp4, m4a, m4b, m4p, m4r.

FLAC - популярный формат сжатия без потерь. Он не вносит изменений в аудио-поток и закодированный с его помощью звук идентичен оригиналу. Часто используеется для прослушивания звука на звуковых системах высокого уровня. Имеет огранченную поддержику устройствами и плеерами, поэтому обычно для того, чтобы слушать flac в плеере, его предварительно конвертируют.

Cразу оговоримся, что статья говорит ТОЛЬКО об общих характеристиках и не будет включать в себя некоторые подробности. В будущем Лайфхакер проведёт собственное беспристрастное исследование. А сегодня попробуем обобщить уже так или иначе известный опыт.

Есть аналог и цифра.

Аналог - хорошо, но недолговечно и неудобно. Поэтому аналоговые носители, несмотря на высокие продажи винила, не вернутся.

Аудиоцифра может быть трёх основных типов:

  • в формате, не использующем сжатие;
  • в формате, использующем сжатие без потерь (lossless);
  • в формате, использующем сжатие с потерями (lossy).

На графиках - хороший AudioCD, сжатый OGG с переменным битрейтом 350 кбит/с и MP3 с использованием Lame. Чем ниже располагается график, тем ближе звучание к оригиналу. Получается очень интересная картина. Несмотря на то, что MP3 обладает явно срезанными высокими частотами, в отличие от OGG, в котором видно завал ниже 2 кГц.

Частотно-временное распределение звука говорит о не менее интересных вещах. При постоянном битрейте 320 кбит/с MP3 почти совпадает с оригинальной записью. Кажется, теперь всё встаёт на свои места. Но… На самом деле всё ещё больше запутывается.

Зачем вообще пользоваться lossy, когда есть доступный lossless

Здравый смысл.

Дело в том, что большая часть аналоговых записей не содержит того количества информации, которое необходимо было бы хранить в высококачественных форматах. Не стоит забывать, что родной частотой дискретизации для CD является 44,1 кГц, квантование - всего 16 бит.

Предыдущие графики неплохо демонстрируют высокую точность передачи MP3. А ведь для аудиокассеты, магнитной ленты (если, конечно, это не мастер-тейп) характеристики AudioCD недостижимы. Да и для массового студийного оборудования возможность записи аналогового звука, соответствующего AudioCD, появилась относительно недавно. Нет никакого смысла оцифровывать во FLAC (и тем более в WAV) концертную запись или пластинку из доцифровой эпохи, в особенности сделанные с магнитных носителей. Они не содержат тех спектров и того количества информации, которые могут хранить контейнеры без сжатия.

Что изменилось сегодня

Редкий звукорежиссёр делает цифровую мастер-запись (с которой затем производится размножение на физические носители), используя современные технологии на полную катушку. Поэтому шанс того, что 24-битный трек на самом деле всего лишь 16-битный, крайне высок.

Аналоговую высококачественную запись на высококачественном оборудовании сегодня встретить ещё сложнее - если только у фанатов подобного звучания. Таким, например, является Джек Уайт, экс-лидер группы White Stripes. При этом часть его записей относится к вариациям lo-fi, и искать там запредельные звуковые характеристики дорожки становится своеобразным удовольствием для гурманов.

Если представить себе идеальный исходник, то только тренированный слух или прослушивание на качественном аудиооборудовании позволит найти сжатый файл. И уже опираясь на это (и ), стоит сделать следующий вывод:

Необходимым и достаточным для среднеценового оборудования является AAC, в отсутствие которого (и при отсутствии исходников, которые можно кодировать в AAC) - MP3 с постоянным битрейтом 320 кбит/с, созданный при помощи кодека Lame 3.93 (рекомендуемые ключи при декодировании: —cbr -b320 -q0 -k -m s).

Исключение составляют записи, изначально полученные в высоком качестве, скажем, записанные на DVD-Audio, SACD, или записи, изначально собранные в DSD (или аналогичном формате) с высоким битрейтом.

Хотя кое-какие особенности у lossless есть. И о них мы расскажем в следующий раз.

Cразу оговоримся, что статья говорит ТОЛЬКО об общих характеристиках и не будет включать в себя некоторые подробности. В будущем Лайфхакер проведёт собственное беспристрастное исследование. А сегодня попробуем обобщить уже так или иначе известный опыт.

Есть аналог и цифра.

Аналог - хорошо, но недолговечно и неудобно. Поэтому аналоговые носители, несмотря на высокие продажи винила, не вернутся.

Аудиоцифра может быть трёх основных типов:

  • в формате, не использующем сжатие;
  • в формате, использующем сжатие без потерь (lossless);
  • в формате, использующем сжатие с потерями (lossy).

На графиках - хороший AudioCD, сжатый OGG с переменным битрейтом 350 кбит/с и MP3 с использованием Lame. Чем ниже располагается график, тем ближе звучание к оригиналу. Получается очень интересная картина. Несмотря на то, что MP3 обладает явно срезанными высокими частотами, в отличие от OGG, в котором видно завал ниже 2 кГц.

Частотно-временное распределение звука говорит о не менее интересных вещах. При постоянном битрейте 320 кбит/с MP3 почти совпадает с оригинальной записью. Кажется, теперь всё встаёт на свои места. Но… На самом деле всё ещё больше запутывается.

Зачем вообще пользоваться lossy, когда есть доступный lossless

Здравый смысл.

Дело в том, что большая часть аналоговых записей не содержит того количества информации, которое необходимо было бы хранить в высококачественных форматах. Не стоит забывать, что родной частотой дискретизации для CD является 44,1 кГц, квантование - всего 16 бит.

Предыдущие графики неплохо демонстрируют высокую точность передачи MP3. А ведь для аудиокассеты, магнитной ленты (если, конечно, это не мастер-тейп) характеристики AudioCD недостижимы. Да и для массового студийного оборудования возможность записи аналогового звука, соответствующего AudioCD, появилась относительно недавно. Нет никакого смысла оцифровывать во FLAC (и тем более в WAV) концертную запись или пластинку из доцифровой эпохи, в особенности сделанные с магнитных носителей. Они не содержат тех спектров и того количества информации, которые могут хранить контейнеры без сжатия.

Что изменилось сегодня

Редкий звукорежиссёр делает цифровую мастер-запись (с которой затем производится размножение на физические носители), используя современные технологии на полную катушку. Поэтому шанс того, что 24-битный трек на самом деле всего лишь 16-битный, крайне высок.

Аналоговую высококачественную запись на высококачественном оборудовании сегодня встретить ещё сложнее - если только у фанатов подобного звучания. Таким, например, является Джек Уайт, экс-лидер группы White Stripes. При этом часть его записей относится к вариациям lo-fi, и искать там запредельные звуковые характеристики дорожки становится своеобразным удовольствием для гурманов.

Если представить себе идеальный исходник, то только тренированный слух или прослушивание на качественном аудиооборудовании позволит найти сжатый файл. И уже опираясь на это (и ), стоит сделать следующий вывод:

Необходимым и достаточным для среднеценового оборудования является AAC, в отсутствие которого (и при отсутствии исходников, которые можно кодировать в AAC) - MP3 с постоянным битрейтом 320 кбит/с, созданный при помощи кодека Lame 3.93 (рекомендуемые ключи при декодировании: —cbr -b320 -q0 -k -m s).

Исключение составляют записи, изначально полученные в высоком качестве, скажем, записанные на DVD-Audio, SACD, или записи, изначально собранные в DSD (или аналогичном формате) с высоким битрейтом.

Хотя кое-какие особенности у lossless есть. И о них мы расскажем в следующий раз.