Первые идеи об использовании психоакустической маскировки для компрессии аудиоданных относятся к 1979 году. Однако соответствующие аудиокодеры начали получать широкое распространение лишь с середины 90-х годов, когда вычислительных мощностей персональных компьютеров стало хватать для воспроизведения сжатого аудио в реальном времени и появился стандарт MPEG-1 Audio Layer 3, более известный как МР3. Аудиоформаты с компрессией стали незаменимыми при передаче звука через интернет, обеспечивая «практически прозрачное» качество стереозвука (то есть кодированный сигнал для большинства слушателей неотличим от оригинала) при битрейтах выше 128 кбит/с. С основными принципами формата МР3 можно познакомиться в статьях К. Гласмана (2…8/2005)
Развитие методов сжатия данных и психоакустики постепенно приводило к тому, что стандарт МР3 стал «тесным» для реализации новых идей в кодировании аудио. В результате, к 1997 году институтом Фраунгофера (Fraunhofer IIS), который в начале 90-х создал МР3, а также компаниями Dolby, AT&T, Sony и Nokia — был разработан новый метод компрессии аудио — Advanced Audio Coding (AAC), вошедший в стандарты MPEG-2 и MPEG-4. Основными отличиями от стандарта МР3 стали:
- поддержка более широкого набора форматов (вплоть до 48 каналов) и частот дискретизации звука (от 8 кГц до 96 кГц);
- более эффективный и простой банк фильтров: гибридный банк фильтров МР3 был заменен обычным MDCT (модифицированным дискретным косинусным преобразованием);
- более широкие пределы варьирования частотно-временного разрешения в банке фильтров — в восемь раз (в МР3 — в три раза) — привели к улучшению кодирования транзиентов (переходных процессов) и стационарных участков аудиосигнала;
- более качественное кодирование частот выше 16 кГц;
- более гибкий режим кодирования стереосигналов, позволяющий переключаться в режим M/S («joint stereo») независимо в различных частотных полосах;
- дополнительные возможности стандарта, повышающие эффективность компрессии: технология формирования шума во временной области (TNS), предсказание MDCT-коэффициентов по времени (long term prediction), режим параметрического кодирования стереосигнала (parametric stereo), синтез шумов (perceptual noise substitution), технология восстановления высоких частот (SBR).
Благодаря этим особенностям, стандарт AAC способен достигать более гибкого и эффективного, а значит — и более качественного кодирования звука. В результате широкого распространения формата МР3, стандарт AAC до сих пор не приобрел сравнимой с МР3 популярности. Тем не менее AAC является основным форматом в популярном интернет-магазине iTunes Store, плеерах iPod, iTunes, телефоне iPhone, игровых приставках PlayStation 3, Nintendo Wii и в цифровом радиовещании DAB+/DRM.
Рассмотрим основные особенности AAC подробнее.
Содержание
- Банк фильтров
- Технология TNS — формирование амплитудной огибающей шума
- Технология SBR — восстановление высоких частот
- Технология Parametric stereo
- Технология PNS — генерация шумов
- Технология Long term prediction — предсказание по времени
- Квантование и сжатие MDCT-коэффициентов
- Качество звучания
- Выводы
- В каком формате лучше слушать музыку. Три кита lossy
- Какой формат лучше — mp3,aac или wma?
- MP3 vs AAC vs OGG Vorbis — чем лучше жать аудио рипы сегодня?
- Принципы работы AAC
- Знакомство с MP3
- Что общего между ними
- В чем отличия
- Какой формат лучше
Банк фильтров
Как и другие психоакустические аудиокодеры, AAC работает по следующей схеме. Входной сигнал пропускается через банк фильтров — преобразование, переводящее сигнал из временной области в частотно-временную область (аналогично построению спектрограммы). Параллельно с этим психоакустическая модель анализирует сигнал и определяет пороги психоакустической маскировки. Далее спектральные коэффициенты сигнала на выходе банка фильтров квантуются так, чтобы спектр шума по возможности (если позволяет битрейт) оказался ниже порогов маскировки и не был слышен. Квантованные коэффициенты сжимаются без потерь в выходной файл формата AAC. Таким образом, сам банк фильтров не сжимает сигнал, он лишь переводит его в форму, более пригодную для сжатия.
![]() |
| Рис. 1. Эффект пред-эха. Сверху вниз: исходный сигнал; сигнал после сжатия с фиксированным размером окна (видно сильное пред-эхо); сигнал после сжатия с переменным размером окна (пред-эхо уменьшилось) |
Особенностью каждого банка фильтров является его частотное разрешение, то есть число частотных полос, на которые он делит спектр сигнала. В большинстве банков фильтров, используемых для сжатия звука, число полос составляет несколько сотен. Это означает, что в силу соотношения неопределенностей такие банки фильтров имеют временное разрешение порядка нескольких десятков миллисекунд. Когда спектральные коэффициенты сигнала квантуются, то вносимая ошибка квантования при декодировании сигнала распространяется по времени на всю длину окна банка фильтров. В некоторых случаях это приводит к нежелательному эффекту, называемому пред-эхом (pre-echo). Он проявляется, когда ошибка квантования от транзиента (резкого всплеска энергии в сигнале) распространяется по времени на предшествующий транзиенту участок времени и становится слышна (рис. 1). Чтобы уменьшить этот эффект, применяют банки фильтров с переменным частотно-временным разрешением. Например, в МР3 используется переключение временного разрешения банка фильтров между 26 и 9 мс. Для стационарных сигналов используются окна длиной 26 мс, дающие хорошее частотное разрешение, а для транзиентов используются окна длиной 9 мс, уменьшающие эффект пред-эха (см. рис. 1).
В алгоритме AAC также используется переключение размера окон MDCT. При этом разница в размере окон восьмикратная: 6 и 48 мс (256 и 2048 отсчетов). Благодаря этому алгоритм способен адаптироваться к более широкому диапазону сигналов и достигать лучшей степени компрессии.
Технология TNS — формирование амплитудной огибающей шума
Одной из проблем современных психоакустических кодеров аудиосигнала является работа с транзиентами (переходными процессами в аудиосигнале). Для обеспечения прозрачного кодирования нужно обеспечить попадание шума квантования под порог маскировки, зависящий от времени. Однако на практике этому требованию трудно удовлетворить вблизи переходных процессов, т.к. шум квантования, возникший при кодировании, распространяется по времени при декодировании на всю длину окна MDCT. Это может приводить к значительным превышениям шумом квантования порогов временной маскировки.
Технология TNS (temporal noise shaping, формирование шума во временной области) в стандарте AAC позволяет управлять распространением шума квантования по времени в пределах каждого окна MDCT. Технология TNS основана на подобии (частотно-временном дуализме) амплитудной огибающей сигнала и огибающей его спектра, а также на использовании линейного предсказания (LPC) по частоте при квантовании спектра.
Хорошо известно, что для сигналов со спектром, сильно отличающимся от белого (например, тональных сигналов), использование линейного предсказания (LPC) во временной области позволяет эффективно «отбеливать» спектр и кодировать такие сигналы путем их разложения на коэффициенты предсказания и сравнительно небольшую по амплитуде ошибку предсказания (residual). При декодировании фильтр линейного предсказания формирует спектр ошибки согласно спектру исходного сигнала.
![]() |
| Рис. 2. Технология TNS: формирование амплитудной огибающей шума квантования. Сверху вниз: исходный сигнал; ошибка квантования алгоритмом AAC с технологией TNS; ошибка квантования алгоритмом МР3 с тем же битрейтом |
В кодере AAC линейное предсказание используется противоположным образом: для предсказания отсчетов спектра в частотной области. Разность исходных и предсказанных коэффициентов MDCT квантуется согласно порогам маскировки (в традиционных кодерах квантуются исходные коэффициенты MDCT). Коэффициенты линейного предсказания также записываются в выходной файл. При декодировании сигнала фильтр линейного предсказания, применяемый к разностному сигналу в частотной области (включающему ошибку квантования), формирует амплитудную огибающую исходного сигнала (и ошибки квантования) во временной области. Таким образом, амплитудная огибающая ошибок квантования становится близкой к амплитудной огибающей исходного сигнала (рис. 2).
Технология TNS снижает эффект пред-эха и заметность ошибок квантования на некоторых гармонических сигналах с импульсным характером звукоизвлечения (речь, некоторые духовые и струнно-смычковые инструменты). На рис. 2 сравниваются ошибки квантования, вносимые в вокальный сигнал алгоритмами AAC и МР3 с одинаковыми битрейтами. Вместе с общим понижением ошибки квантования (в силу большей эффективности AAC) наблюдается формирование амплитудной огибающей ошибки квантования по времени согласно огибающей исходного сигнала.
В стандарте AAC технология TNS может применяться к отдельным частотным полосам спектра независимо или отключаться совсем.
Технология SBR — восстановление высоких частот
Достоверная передача широкого частотного диапазона — важное требование для качественного кодирования. Однако передача каждой следующей октавы звукового диапазона в полтора-два раза повышает требования к битрейту для традиционного аудиокодера. Чтобы снизить битрейт и при этом сохранить высокие частоты в кодируемом материале, была создана технология искусственного синтеза высоких частот SBR (spectral band replication).
Технология основывается на том, что наш слух анализирует высокие частоты с меньшей точностью, чем средние и низкие. Для создания эффекта присутствия высоких частот необязательно математически точно реконструировать форму волны, а достаточно лишь восстановить некоторые существенные психоакустические параметры сигнала на высоких частотах. Ктаким существенным параметрам относятся частотно-временное распределение (огибающая) энергии сигнала и степень его тональности/зашумленности.
Идея алгоритма такова. При кодировании осуществляется анализ высоких частот в исходном аудиосигнале и извлекаются их параметры: в первую очередь — амплитудная огибающая в нескольких (обычно в восьми) частотных полосах. Далее высокие частоты из записи удаляются и кодируются только оставшиеся низкие и средние частоты. При этом в выходной файл также добавляется сравнительно небольшой поток информации о параметрах утерянных высоких частот.
При воспроизведении сначала декодируется сигнал низких и средних частот. Далее (в случае его наличия в плеере) начинает работу декодер SBR. Первым шагом он осуществляет синтез высокочастотного сигнала путем транспонирования (точнее — частотного сдвига) имеющихся средних частот. Поскольку степень тональности/зашумленности спектра на средних и высоких частотах примерно равна, то в результате этого шага получается высокочастотный сигнал с правдоподобной структурой спектра. На втором шаге декодер SBR использует дополнительную сохраненную информацию о высоких частотах для придания им нужной амплитудной огибающей в каждой частотной полосе. В результате получается сигнал, у которого высокие частоты полностью синтезированы из средних, но при этом сохраняют звучание исходных высоких частот.
Технология SBR может быть пристроена ко многим существующим методам кодирования аудио. Например, SBR в сочетании с МР3 называется МР3 PRO, а SBR в сочетании с AAC называется HE-AAC (high efficiency AAC). В основном, SBR используется при кодировании с относительно низкими битрейтами: 64 кбит/с и ниже. Технология позволяет значительно расширить частотный диапазон аудиосигнала с минимальным увеличением битрейта (несколько кбит/с).
Технология Parametric stereo
Передача стереосигнала обычно требует от кодера почти в 2 раза большего битрейта, чем передача монофонического сигнала. При этом стереоканалы можно кодировать как независимо, так и после M/S преобразования. В последнем случае на S-канал зачастую тратится меньший битрейт, чем на M-канал. Этот режим кодирования также называется joint stereo. В стандарте AAC этот режим может включаться и отключаться кодером независимо для каждой частотной полосы.
Для более эффективного кодирования стереосигналов на совсем низких битрейтах (16…32 кбит/с) была разработана технология параметрического кодирования стереопанорамы (parametric stereo). Она заключается в том, что стереосигнал перед кодированим сводится к моно, но в выходной файл добавляется небольшой поток (2…3 кбит/с), содержащий информацию о стереопанораме исходного стереофайла. Этот поток содержит (в сжатом виде) своеобразную «карту панорамы» для частотно-временной плоскости.
На стадии декодирования к полученному монофоническому сигналу применяется частотно-зависимое панорамирование. Это можно производить одновременно с декодированием, применяя к изначально равным коэффициентам MDCT левого и правого каналов соответствующие амплитудные множители.
Технология Parametric stereo дает хорошее впечатление об исходной стереопанораме звука ценой лишь небольшого увеличения битрейта по сравнению с кодированием моносигнала. Однако она не позволяет добиться полностью прозрачного звучания, так как неспособна учесть все нюансы стереопанорамы, например фазовые сдвиги между стереоканалами.
Технология Parametric stereo была включена в стандарт HE-AAC v2.
Технология PNS — генерация шумов
Для дополнительного увеличения эффективности кодирования шумовых сигналов в стандарте AAC предусмотрена технология PNS (perceptual noise substitution) для синтеза шумов. Известно, что наше ухо более чувствительно к амплитудному спектру сигнала, чем к фазовому. Поэтому вместо кодирования MDCT-коэффициентов исходного сигнала в шумовых областях можно лишь передавать параметры шума: его мощность в зависимости от частоты и времени.
Так и работает технология PNS. При кодировании идентифицируются участки спектра, представляющие собой шум, и соответствующие группы MDCT-коэффициентов исключаются из процесса кодирования. Частотная полоса помечается как шумовая, и для нее запоминается общая энергия шума.
При декодировании в частотные полосы, помеченные как шумовые, подставляются псевдослучайные MDCT-коэффициенты с требуемой общей мощностью. В результате в указанных частотных диапазонах синтезируется шум, близкий по звучанию к исходному шуму.
Технология Long term prediction — предсказание по времени
Психоакустическое кодирование тональных сигналов требует более высокого локального отношения сигнал/шум, чем кодирование шумовых сигналов (например, 20 дБ и 6 дБ соответственно). А это, в свою очередь, требует повышенного битрейта. Однако MDCT-коэффициенты тональных сигналов являются предсказуемыми по времени. Это обстоятельство позволяет эксплуатировать их зависимость по времени для уменьшения битрейта.
В стандарте AAC предусмотрен режим Long term prediction, в котором MDCT-коэффициенты дополнительно кодируются по времени с помощью линейного предсказания. Термин «long term» означает, что предсказание осуществляется не по соседним отсчетам, а по отсчетам, отстоящим на наиболее вероятный период тона на данной частоте.
Квантование и сжатие MDCT-коэффициентов
Аналогично стандарту МР3, в AAC используется нелинейное квантование MDCT-коэффициентов и сжатие их методом Хаффмана. Коэффициенты MDCT квантуются после возведения в степень 0,75, что позволяет увеличивать ошибку квантования для мощных сигналов и уменьшать ее для слабых сигналов в пределах каждой частотной полосы. Таким образом осуществляется дополнительное неявное формирование спектра шума.
После квантования MDCT-коэффициенты сжимаются с помощью набора фиксированных таблиц Хаффмана. В стандарте AAC этих таблиц больше, чем в МР3, и шире возможности по группировке коэффициентов. Это приводит к дополнительному увеличению сжатия.
Качество звучания
При оценке качества звучания аудиокодеров обычно используются субъективные тесты. Слушателям представляются фрагменты сжатых разными кодерами записей, и они оценивают чистоту звучания каждого фрагмента по шкале от 1 до 5. Лучшим кодеком считается тот, который способен достичь более высокого качества звучания по сравнению с конкурентами при заданном битрейте.
Достаточно авторитетным интернет-источником, где приведены результаты таких тестов, является сайт http://www.rjamorim.com/test/ На нем представлены тестирования различных кодеков на множестве битрейтов. Приведенные результаты в целом хорошо согласуются с другими источниками. Приведем несколько результатов для кодеров МР3 и AAC, помогающих сравнить их качество.
Лучшим кодером МР3 является бесплатный Lame. Однако на большинстве битрейтов он уступает в качестве более новым стандартам сжатия. На высоких битрейтах (выше 128 кбит/с) это отставание невелико, и лидером является кодер Ogg Vorbis.
На битрейте 64 кбит/с преимущество AAC уже становится ощутимым. В варианте HE-AAC алгоритм зарабатывает оценку 3,68. Это примерно соответствует Lame с битрейтом 96 кбит/с и означает преимущество AAC над МР3 примерно в 1,5 раза. Оценка Lame с битрейтом 128 кбит/с — 4,29.
На битрейте 32 кбит/с кодер AAC от компании Nero серьезно выигрывает в качестве по сравнению с МР3: оценки 3,23 и 1,72 соответственно. Однако AAC лишь ненамного опережает формат МР3PRO, получивший оценку 3,08. Это указывает, что технология SBR действительно значительно улучшает качество при низких битрейтах.
Выводы
Благодаря примененным в стандарте AAC новым технологиям, данный формат имеет заметное преимущество перед MPEG-1 Layer 3 (MP3), позволяя достигать лучшего качества звука при таких же битрейтах. Особенно сильный выигрыш наблюдается в области низких битрейтов: 96 кбит/с и ниже. Это подтверждает перспективность формата AAC для цифрового радиовещания.
Популярность AAC для распространения музыки в интернете на сегодняшний день остается низкой по сравнению с форматом MP3. Пользователи продолжают предпочитать лучшую переносимость MP3 более сильному сжатию AAC. Значительная часть музыкальных архивов на сайтах, распространяющих музыку, уже изначально находится в формате MP3, и доступа к несжатым записям у провайдеров не имеется. Это значит, что перекодировать такие записи в формат AAC большого смысла не имеет — качество зачастую уже потеряно. Однако новые карманные плееры и некоторые онлайн-магазины уже поддерживают формат AAC, часто — с верификацией легальности контента (что также отпугивает пользователей, предпочитающих не ограничивать себя в копировании музыки).
Будучи весьма перспективным, формат AAC не является единственным наиболее качественным форматом компрессии звука. На высоких битрейтах (выше 128 кбит/с) AAC часто уступает в качестве кодерам форматов Ogg Vorbis и Musepack. На самых низких битрейтах (менее 32 кбит/с) AAC может уступать параметрическим кодерам звука, в том числе — специализированным кодерам для сжатия речи. Однако в диапазоне средне-низких битрейтов AAC на данный момент сохраняет пальму первенства.
Алексей Лукин
Журнал «Звукорежиссер» 2008 #1
АБСОЛЮТНО НЕКОРРЕКТНО поставлен вопрос.
1. Кроме формата есть ещё и битрейт. Мы что будем сравнимать — mp3 с наинизшим битрейтом и m4a с наивысшим, или наоборот. И почему именно m4a, когда тот же ogg даёт не менее, а в чём-то даже и более лучший результат?
3. Непонятна цель телодвижений (конечная) — скопировать диск с максимальным качеством? — для этого уже давно придуманы, так называемые, LossLess форматы — APE или FLAC (к примеру). Хотя тот же (чистый) wav — по сути тот-же LossLess (но и размер отдельных файликов у него весьма неслабый).
Что же всётаки надо — найти формат в котором соотношение размер файла/качество звука было бы максимально оптимальным? ИМХО — ogg (с максимальными настройками) или mp3 (320kbs, кодированный последним Лаймом). Скоприровать без потерь в качестве — APE или FLAC.
В каком формате лучше слушать музыку. Три кита lossy
Разобраться в цифровых аудиоформатах совсем не просто. Сделать однозначный вывод, в каком именно формате лучше слушать музыку, и того сложнее. Если посмотреть сравнительную таблицу аудиоформатов в «Википедии», в глазах начнёт рябить от столбиков молчаливых цифр. Попробуем разобраться, что за этим стоит.

Cразу оговоримся, что статья говорит ТОЛЬКО об общих характеристиках и не будет включать в себя некоторые подробности. В будущем Лайфхакер проведёт собственное беспристрастное исследование. А сегодня попробуем обобщить уже так или иначе известный опыт.
Есть аналог и цифра.
Аналог — хорошо, но недолговечно и неудобно. Поэтому аналоговые носители, несмотря на высокие продажи винила, не вернутся.
Аудиоцифра может быть трёх основных типов:
- в формате, не использующем сжатие
- в формате, использующем сжатие без потерь (lossless)
- в формате, использующем сжатие с потерями (lossy).
На первый взгляд, более перспективны форматы, использующие сжатие без потерь. Это не всегда так, о чём мы подробнее расскажем в одном из следующих материалов. Форматы без сжатия не имеют какого-либо смысла, кроме хранения мастер-записей, необходимых при создании аудиоконтента. Они легче поддаются восстановлению. Для хранения и прослушивания домашних записей излишни.
Из множества параметров цифрового аудио пользователя в первую очередь должны волновать частота дискретизации (точность оцифровки аналогового сигнала по времени), разрядность (точность оцифровки по амплитуде — громкости), битрейт (количество содержащейся в файле информации в пересчёте на секунду).
Сегодня поговорим о lossy.
Для сжатого звука очень важно понятие психоакустической модели — представления учёных и инженеров о том, как человек воспринимает звук. Ухо воспринимает весь спектр поступающих на него акустических волн. Однако обрабатывает сигналы мозг.
Справочная величина слышимого человеком диапазона составляет от 16 Гц до 20 кГц, но одновременно слышать и осознавать все поступающие звуки он не способен.
Слух дискретен, и его звуковая восприимчивость нелинейна.
Современные психоакустические модели достаточно точно оценивают человеческий слух и постоянно улучшаются. На деле, несмотря на заверения любителей музыки, музыкантов и аудиофилов, для среднестатистического нетренированного слуха первоначальный вид MP3 в максимальном качестве стал предельно воспринимаемым. Исключения есть, их не может не быть. Но они не всегда легко заметны при слепом прослушивании.
Форматы, использующие психоакустические модели сжатия
Таких форматов для сжатия аудио с потерями довольно много. Наиболее распространены сегодня следующие.
OGG (Vorbis)
Вообще, файл с расширением *.ogg является «контейнером»: внутри могут находиться несколько звуковых записей с собственными тегами и характеристиками. Чаще всего хранимые в нём файлы сжимаются кодеком Ogg Vorbis, хотя могут использоваться и другие, в том числе MP3 или FLAC.
В качестве его основных преимуществ стоит назвать большой диапазон возможных параметров при кодировании: частота дискретизации звука может достигать 192 кГц, разрядность — 32 бит. По умолчанию OGG использует переменный битрейт (хотя при отображении свойств это не указывается), который может достигать 1 000 кбит/с.
В отличие от свободного OGG, MP3 разработан очень важным для современной акустики Обществом Фраунгофера — объединением институтов прикладных исследований Германии. В среде аудиофилов, кстати, это крайне уважаемая контора, правда, признаваться они в этом не любят. Но за их разработками пристально следят.
В отличие от OGG, может обладать как переменным (VBR), так и постоянным битрейтом (CBR). Кстати, именно благодаря MP3 обнаружилось, что не всякая запись может быть качественно кодирована с переменным битрейтом (причины смотрите выше, алгоритмы кодирования и их результаты в данном случае могут быть различны при кодировании одного и того же источника).
Ввиду преклонного возраста MP3 имеет значительные ограничения: разрядность может быть 16—24 бита, частота дискретизации выражается только в дискретных значениях (8, 11,025, 12, 16, 22,05, 24, 32, 44,1, 48), битрейт ограничен 320 кбит/с. К тому же в обычной версии MP3 число каналов ограничено двумя.
Те же грабли, только в профиль. Тоже разработка Общества Фраунгофера. Более поздняя и использует другую психоакустическую модель, более современную. Общедоступная информация позволяет сделать вывод: да, им удалось улучшить собственное творение.
Даже если опираться на самые простые цифры, AAC — более гибкий формат. Разрядность файлов, полученных при помощи этой разработки, составляет от 16 до 24, частота дискретизации тоже при желании позволит не потерять звуковой картины и лежит в диапазоне 8—192 кГц. Поток данных вообще приближается к таковым у lossless-форматов (до 512 кбит/с), при том что максимальное число каналов AAC-файлов достигает 48.
Какой формат стоит назвать однозначно лучшим
Если учесть, что AAC — переосмысленный спустя десяток лет MP3, то выбор в его пользу. При желании имеет смысл сравнивать только MP3 и OGG. Давайте посмотрим на картинки, сделанные уважаемым Андреем Аспидовым с ixbt.com:


Частотно-временное распределение звука говорит о не менее интересных вещах. При постоянном битрейте 320 кбит/с MP3 почти совпадает с оригинальной записью. Кажется, теперь всё встаёт на свои места. Но. На самом деле всё ещё больше запутывается.
Зачем вообще пользоваться lossy, когда есть доступный lossless
Дело в том, что большая часть аналоговых записей не содержит того количества информации, которое необходимо было бы хранить в высококачественных форматах. Не стоит забывать, что родной частотой дискретизации для CD является 44,1 кГц, квантование — всего 16 бит.
Предыдущие графики неплохо демонстрируют высокую точность передачи MP3. А ведь для аудиокассеты, магнитной ленты (если, конечно, это не мастер-тейп) характеристики AudioCD недостижимы. Да и для массового студийного оборудования возможность записи аналогового звука, соответствующего AudioCD, появилась относительно недавно. Нет никакого смысла оцифровывать во FLAC (и тем более в WAV) концертную запись или пластинку из доцифровой эпохи, в особенности сделанные с магнитных носителей. Они не содержат тех спектров и того количества информации, которые могут хранить контейнеры без сжатия.
Что изменилось сегодня
Редкий звукорежиссёр делает цифровую мастер-запись (с которой затем производится размножение на физические носители), используя современные технологии на полную катушку. Поэтому шанс того, что 24-битный трек на самом деле всего лишь 16-битный, крайне высок.
Аналоговую высококачественную запись на высококачественном оборудовании сегодня встретить ещё сложнее — если только у фанатов подобного звучания. Таким, например, является Джек Уайт, экс-лидер группы White Stripes. При этом часть его записей относится к вариациям lo-fi, и искать там запредельные звуковые характеристики дорожки становится своеобразным удовольствием для гурманов.
Если представить себе идеальный исходник, то только тренированный слух или прослушивание на качественном аудиооборудовании позволит найти сжатый файл. И уже опираясь на это (и не забывая про восприятие), стоит сделать следующий вывод:
Необходимым и достаточным для среднеценового оборудования является AAC, в отсутствие которого (и при отсутствии исходников, которые можно кодировать в AAC) — MP3 с постоянным битрейтом 320 кбит/с, созданный при помощи кодека Lame 3.93 (рекомендуемые ключи при декодировании: —cbr -b320 -q0 -k -m s).
Исключение составляют записи, изначально полученные в высоком качестве, скажем, записанные на DVD-Audio, SACD, или записи, изначально собранные в DSD (или аналогичном формате) с высоким битрейтом.
Хотя кое-какие особенности у lossless есть. И о них мы расскажем в следующий раз.
Автор не любит Apple. Автор очень ценит достижения «фраунгоферов» и был предельно удивлён, узнав, что AAC — их работа. )
Какой формат лучше — mp3,aac или wma?
я думаю что mp3 лучше
ваня бровчук Профи (548) 6 лет назад
я советую мп3 качество лучше чем в остальных да и все медиаплееры все этот формат воспроизводят
Владимир Александрович Мастер (1934) 6 лет назад
лично я не доверяю AAC. В нём звук какой-то искажённый.
wma тоже не люблю. Винамп подглючивает изза него, чтобы записат песню wma в айпод, нужно сначала переконвертить в другой формат. Вобщем, неудобный он.
Остаётся mp3. Качество звука и совместимость (за счёт популярности 🙂 ) — на высоте. Да и не думаю, что плохой формат мог бы стать столь популярным. -)
Ирина Оракул (81929) 6 лет назад
Сейчас без преувеличения можно сказать, что разработанный почти два десятилетия назад MP3 является наиболее популярным форматом хранения музыки на компьютере. Сегодня MP3 файлы можно прослушать не только при помощи персонального компьютера. С их воспроизведением отлично справляются современные музыкальные центры, DVD плееры, walkman’ы и даже КПК и мобильные телефоны.
Ведь для большинства пользователей необходимость создания файлов формата 5.1 или кодирование саундтреков с высокими частотами дискретизации мало актуальны, а качество получаемых файлов их вполне устраивает.
Наиболее популярными параметрами для кодирования MP3 файлов являются CBR ( constant bitrate, постоянный битрейт) 128 кбит/с, стерео. Качество при этом может быть самым разным: от совершенно неприемлемого до хорошего. Многое зависит от того, каким был исходный материал и кодировщика/его параметров. Современные MP3 кодеки позволяют добиваться звучания, в большинстве случаев не отличимого от оригинала при использовании битрейтов от 192 кбит/с.
Разумеется, с повышением битрейта качество файла обычно повышается, что, однако, вовсе не обозначает, необходимость всегда использовать битрейт 320 кбит/с, — это будет лишней тратой места. Логичнее в этом случае применять кодирование с переменным битрейтом (VBR, variable bitrate), при котором кодек динамически изменяет битрейт в зависимости от сложности композиции.
Одним из серьезных недостатков MP3 является резкое падение качества при снижении битрейта со 128 кбит/с. Уже на 64 кбит/с звучание MP3 файлов вызывает раздражение большим количеством искажения и артефактов, а на меньших битрейтах разобрать что-либо просто нереально. Для того, чтобы как-то исправить ситуацию, Fraunhofer (разработчики формата ) и Coding Technologies предложили решение в виде MP3 pro, не стандартизированного расширения формата, при котором качество звучания MP3 файов удается сохранить на приемлемом уровне при значительном снижении битрейта. MP3 pro файл, состоящий из MP3 части и дополнительного потока данных, содержащих информацию о высоких частотах можно воспроизвести как при помощи специализированного MP3 pro проигрывателя, так и с помощью обычного MP3 плеера, хотя в последнем случае качество будет заметно ниже.
Так или иначе MP3 pro, в отличие от своего предшественника не получил должного распространения и сейчас практически не используется, уступив место более совершенным технологиям.
AAC (MPEG-2/4 advanced audio coding) / MP4
Формат AAC, стандартизированный около пяти лет назад, является преемником MP3, способным заменить его в будущем. По сравнению с MP3 в AAC заметно увеличена эффективность компрессии, а качество звучания AAC файла, созданного одним из современных кодеков, при битрейте 128 кбит/с сопоставимо с качеством 192 кбит/с MP3 файла. Кроме того, AAC позволяет создавать многоканальные файлы, что делает его пригодным для хранения саундтреков к фильмам. При кодировании на низких битрейтах есть возможность создания AAC HE ( h igh efficiency, высокая эффективнсть) файлов, используюя технологию SBR ( spectral band replication, спектральное восстановление частот). аналогичную той, что используется в MP3 pro. Однако в отличие от MP3 pro, создание файлов AAC HE ( или AAC plus) предусмотрено стандартом формата, что обозначает возможность воспроизвести подобный файл большинством AAC проигрывателей.
AAC имеет несколько режимов создания файлов (профилей). наиболее известным из которых является LC ( low complexity, низкая сложность). используемый Apple в своем сервисе iTunes. Кроме того, воспроизведение AAC LC файлов возможно при помощи аппаратных AAC плееров (напр. Apple iPod или телефонов Nokia).
Сейчас редко кто использует «голые» AAC файлы. В большинстве случаев их сразу упаковывают
MP3 vs AAC vs OGG Vorbis — чем лучше жать аудио рипы сегодня?
Прошу прощения за уже точно тысячи раз обсуждавшийся вопрос, но сегодня хочется поднять его снова в контексте современных реалий.
На сколько я пнимаю, единственным плюсом MP3 по сравнению с появившимися позже него конкурентами была широкая поддержка — только этот формат позволял быть уверенным, что файл не будет проблемой прослушать. Сейчас эта проблема практически отпала: любой современный смартфон, планшет, ТВ-приставка, браузер, приложения-аудиоплееры и т.п. могут без проблем воспроизводить M4A AAC и/или OGG Vorbis.
Соответственно интересно какие есть аргументы в пользу выбора AAC, какие в пользу OGG и какие, если ещё остались, в пользу MP3.
Правильно ли я понимаю, что главный плюс AAC играется на смартфонах аппаратно и, следовательно, требует меньше ресурсов? Правильно ли я понимаю, что единственный плюс OGG Vorbis по сравнению с AAC — юридический? Ещё я слышал, что MP3 в отличие от Vorbis (про AAC не слышал в этом ключе) не позволяет точно адресовать определённый момент времени и точно вырезать кусок от и до или типа того (не помню как это называется).
Вопрос интересует в контексте высоких битрейтов lossy кодирования — 96 kbps (для аудиокниг и саундтреков видео), 128 (для интернет-радио), 256-320 (для offline музыки).
А то вот скачал я сейчас один альбомчик во FLAC (другого не было, обычно меня устраивает MP3-320, всё-равно звук говно что в смартфоне что в ноутбуке), задумал конвертнуть во что попроще и загрузился.
- Вопрос задан 07 нояб. 3768 просмотров
Источники: http://nowa.cc/archive/index.php/t-140109.html, http://ergosolo.ru/reviews/hotkeys/lossy/, http://otvet.mail.ru/question/21658384, http://toster.ru/q/149599

Квк Нарисовать Знак Цитаты На Ноут Два
квк нарисовать знак цитаты на ноут дваСпециальные символы в WindowsПроблема использования в тексте спецсимволов состоит в том, что существующих символов .

Разбираться с технологической раскладкой цифрового аудиоформата, разновидностях, принципах работы электронных систем, предстоит специалистам радиотехники, инженерам IT технологий. Разработчики составляют сравнительные таблицы с множеством цифровых значений. Обычных пользователей плееров, смартфонов интересует, какой формат лучше AAC или MP3 без научных подробностей, а в обобщенном виде по данным известных исследователей из их опыта.
Принципы работы AAC
ААС представлен многоканальным алгоритмом в кодировании аудио с поддержкой потоковых передач. Технология разработана на основании параметров MP3, в них улучшены операции.

Функционал создан на принципах:
- Удалены сигналы, которые не воспринимает человек.
- Убрали избыток кодирования.
- Обработали импульс методом МДКП.
- Добавили код, корректирующий внутренние ошибки.
- Передали результат.
Для контейнера MPEG-4 не нужен единственный или малый набор компрессионных схем. В семействе алгоритмов кодируется речь низкого сегмента и аудио с высоким 64 кбит/с. AAC при частоте 96 кГц может охватить 48 каналов. Технология совершает динамическое переключение между блоками с длины по 2048 пункту до 256.
Пользователь сам решает, какая мера ему больше подходит. Когда в AAC вычищают шумы, убирают искажения, чтобы сократить объем файла, музыкальное произведение воспринимается лишенным живости. Слышится механический, железный оттенок. По утверждению технологов психоакустическая фильтрация MP3 и AAC происходит по разным алгоритмам, поэтому по-другому звучит музыка.
Знакомство с MP3
Функционал MP3 представляет собой закодированную на звуковых дорожках аудиоинформацию. Инженеры Германии создали и получили лицензию на такое хранение файлов, норматив приобрел популярность во всем мире.
По факту принцип работы обманывает слух. Исследования доказали, что человек сможет воспринимать новые импульсы, если превысить порог слышимости. Когда звуки накладываются друг на друга, одни поглощают другие. Создатели MP3 неслышимое звучание убрали из общего фона. Сигнал полученный в результате, кодируют методом Хофмана.

Сжатия оригинальных импульсов не подвергались стандартизации. Программисты разрабатывают по-своему схемы для файлов. Стандарту подчинены декодерные устройства, отчего степень звучания не зависит от аппаратуры. Реализаторы кодера устанавливают сжатие по пристрастиям, с ними наиболее четко справляется размер для слушателей:
Популярность технология получила благодаря:
- Малому объему.
- Терпимыми потерями.
- Повсеместной распространенностью.
- Поддержкой устройств.
- На частоте выше 18 кГц, даже при хороших наушниках слышимость ухудшается.
- Звучание по качеству уступает новым разработкам.
MP3 принадлежит к первым аудиоформатам. Они в свое время заполнили рынок большим количеством композиций, которые перевели на данный уровень.
Что общего между ними
Общий фактор между ACC и MP3 – это сжатие файлов для экономии производственных участков, отчего происходит ухудшение звуков.
Человек может слушать музыку с аналогово или цифрового носителя.
Если аналог характеризуется как продукт:
- Недолговечный.
- Неудобный.
- Ушедший в прошлое.
Для цифры характерна передача звукового сигнала в рамках:
- Не использующих сжатие.
- lossless – со сжатием файлов, сохраняющем качественный звук.
- lossy – качество теряется из-за экономии места на сжатом файле.
Первый способ перспективен, чтобы хранить записи мастеров, создающих аудио контент для легкого восстановления. Для любительских фонотек такое хранение не имеет смысла.
Пользователи цифровых инструментов должны обратить внимание на параметры:
- Оцифровку аналоговых сигналов по частоте – дискретизацию.
- Амплитуду или точность разрядности на громкость.
- Битрейт – сколько данных содержит файл в расчете на время прослушивания.
Ученые, инженеры, создавая сжатый звук в психоакустических моделях, рассматривали восприятие его слуховыми органами человека. В уши поступают акустические волны, но дальше сигнал переходит на обработку мозга. К примеру, субъект слышит в диапазоне 18 кГц., а сразу слушать и сознавать, поступающую информацию он не может. Разработчики исследовали человеческие возможности и создают аппаратуру с максимальным удобством по всем показателям.
В чем отличия
С течением времени, развитием технологических процессов, стандарту MP3 стало тесно в своих рамках, чтобы реализовать новые идеи кодирования. Создатели новинки переняли все необходимое из первоисточника, расширили возможности, убрали недостатки.
После разработки компрессии для аудио – AAC, отличительными параметрами от преемника зафиксированы:
- Широкий набор объемов.
- Увеличена частота сигналов.
- Преобразование фильтров в упрощенном банке.
- Улучшены переходные процессы между стационарными импульсными участками.
- Качество с гибким режимом кодирования.
- Добавлены технологические процессы, формирующие шумы, восстанавливающие высокие частоты.
С помощью AAC достигнут гибкая, эффективная, качественная тональность. Но его популярность пока не сравнима с MP3. Норматив AAC в основном применяют в IT-продукции для телефонов, плееров, игровых приставок. В распространении метода активное участи принимают брендовые фирмы Apple, Nokia.
Какой формат лучше
Перед решением любой задачи граждане определяются с поставленной целью.
Кодек тоже выбирают с определения важности по:
- Совместимости.
- Качеству.
- Поддержке конкретного мобильного устройства.
Оценивают процесс из личной практики на основании обособленных потребностей. Если пользователь не соприкасался с цифровой музыкой, формат имеет существенное значение, ему предстоит ответить на вопросы:
- Насколько подходит для плеера.
- Как с устройства читается информация.
- Что предстоит делать с файлом.
По совместимости MP3 самый приемлемый вариант, его «понимает» любая техника, при условии, что владелец не прислушивается к уровню качества.
Для любителей чистоты и натуральности в звучании приёмника, можно остановиться на любом новом методе. Недостатка в разработках не ожидается, создатели выводят их на торговые площадки с постоянной периодичностью. Нужно своевременно оценивать и осваивать новинки, чтобы слушать не только музыкальное произведение, а вникать в слова, оформление.







