Сохранить и прочитать потом —
Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.
Частота 192 кГц считается вредной
Музыкальные цифровые файлы с частотой 192 кГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.
И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.
График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33 кГц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.
Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.
Есть несколько способов избежать дополнительных искажений:
- Динамик, предназначенный только для воспроизведения ультразвука, усилитель и разделитель спектра сигнала, чтобы разделить и независимо воспроизводить ультразвук, который вы не можете слышать, чтобы он не влиял на другие звуки.
- Усилители и преобразователи, спроектированные для воспроизведения более широкого спектра частот так, чтобы ультразвук не вызывал слышимых нелинейных искажений. Из-за дополнительных затрат и сложности исполнения, дополнительный частотный диапазон будет уменьшать качество воспроизведения в слышимой части спектра.
- Качественно спроектированные динамики и усилители, которые совсем не воспроизводят ультразвук.
- Для начала можно не кодировать такой широкий диапазон частот. Вы не можете (и не должны) слышать ультразвуковые нелинейные искажения в слышимой полосе частот, если в ней нет ультразвуковой составляющей.
Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.
Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30 кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.
Тесты для измерения нелинейных искажений:
- Звук 30 кГц + звук 33 кГц (24 бит / 96 кГц) [5-секундный WAV] [30-секундный FLAC]
- Мелодии 26 кГц – 48 кГц (24 бит / 96 кГц) [10-секундный WAV]
- Мелодии 26 кГц – 96 кГц (24 бит / 192 кГц) [10-секундный WAV]
- Нарезка из песен, приведенных к 24 кГц (24 бит / 96 кГц WAV) [10-секундный WAV] (оригинальная версия нарезки) (16 бит / 44.1 кГц WAV)
Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц [6]. При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.
В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.
Недопонимание процесса дискретизации
Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.
Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).
Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.
По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.
Это только так выглядит. Эти убеждения неверны!
Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell, поэтому можете не верить мне на слово.
Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.
С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.
Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них [7].
Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.
На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).
Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.
Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.
ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.
16 бит против 24 бит
Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?
16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.
Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.
Примечания к Части 2
6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.
7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.
8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.
Частота дискретизации в два раза выше максимально записываемой. Т. е. при преобразовании в последовательность чисел из звуковой волны при записи требуется "делать отметки", считывать, вдвое чаще.
Материал в аудио-CD формате — 16-бит 44,1кГц. Это практически весь материал. Так что при воспроизведении разницы не будет.
Формат DVD-аудио поддерживает до 24 на 192.
Есть предположения, что человек может фиксировать более высокочастотные звуки, нежели 20кГц, однако вряд ли ушами.
Совершенно уверенно могу сказать что разница между простым 16,bit 44.1 khz звуком и hd аудио очень существенная и совершенно очевидная. При условии что вы нашли качественный HD аудио файл.
На простой встроенной звуковухе не тестил. И на совсем дешовых колонках тоже.
На наушниках косс порта про за 3 тыщи разница менее очевидна хотя наушники по качеству звука резко отличаются от основной массы ширпотреба.
Что хочу добавить. Часто аппаратура имеет встроенные вещи типа усиления баса ( та самая кнопка "субербас") что дает эффект сходный с 24 битным басом но во первых это обман потому что 16 битная запись не содержит такой амплитуды а аппаратура только "растягивает" амплитуду и соответственно все таки красота баса немного теряется и он становится почти одинаковым на всех записях.
Примерно такая же картина с высокими частотами — есть всякие примочки и фильтры и звуковые процессоры которые существенно улучшают на слух высокие частоты в 44.1 записи примешивая туда всякие дополнительные вещи, особенно в аппаратуре высокого уровня, но это все равно обман слуха хоть и очень качественный и изощренный.
В итоге получается ситуация ка с mpз звуком — вродебы всена месте все слышно но ощущение как будто тебя обокрали а ты не можешь понять в чем именно и соответсвенно удовольствия от прослушивания меньше и башка трещит.
Совершенно уверенно могу сказать что разница между простым 16,bit 44.1 khz звуком и hd аудио очень существенная и совершенно очевидная. При условии что вы нашли качественный HD аудио файл.
На простой встроенной звуковухе не тестил. И на совсем дешовых колонках тоже.
На наушниках косс порта про за 3 тыщи разница менее очевидна хотя наушники по качеству звука резко отличаются от основной массы ширпотреба.
Что хочу добавить. Часто аппаратура имеет встроенные вещи типа усиления баса ( та самая кнопка "субербас") что дает эффект сходный с 24 битным басом но во первых это обман потому что 16 битная запись не содержит такой амплитуды а аппаратура только "растягивает" амплитуду и соответственно все таки красота баса немного теряется и он становится почти одинаковым на всех записях.
Примерно такая же картина с высокими частотами — есть всякие примочки и фильтры и звуковые процессоры которые существенно улучшают на слух высокие частоты в 44.1 записи примешивая туда всякие дополнительные вещи, особенно в аппаратуре высокого уровня, но это все равно обман слуха хоть и очень качественный и изощренный.
В итоге получается ситуация ка с mpз звуком — вродебы всена месте все слышно но ощущение как будто тебя обокрали а ты не можешь понять в чем именно и соответсвенно удовольствия от прослушивания меньше и башка трещит.
Всем известные параметры цифрового аудиопотока 16 и 24 бит — всего лишь официально заявленные мундиры, под которыми может оказаться рубашка с прорехами. Ищем надежный инструмент для диагностики.
Пытливые люди, которым интересно узнать фонетическую подноготную музыкального релиза, более или менее приловчились. Теорему Котельникова-Найквиста знает каждый ребенок, не говоря уже о том, что любое дитя сможет уточнить протяженность спектра в аудиофайле. Про оценку динамического диапазона тоже было рассказано немало, даже целое сообщество имеется – пишет петиции и стыдит издателей, злоупотребляющих компрессией. А уверены ли вы, что в 24-битовом хайрезе честно задействованы все разряды? Как это узнать?
На первый взгляд ситуация совершенно герметичная и неподконтрольная. Как показывает статистика официальных продавцов HD-аудио вроде Qobuz или HD Tracks, наиболее распространенными в ассортименте являются релизы в 24 бит / 44.1 кГц. То есть мы имеем ту же частотку и пики уровней, что на компакт-диске, просто в более точном и подробном изложении. И не надо удивляться скромности технических параметров таких вот Studio Master Files. Работает принцип разумной достаточности. Doctor Dre, тот самый, который маячит на популярных наушниках, одно время возился с сессионными записями в 24 бит / 88 кГц, а потом плюнул и перешел на 24/44.1 – так, говорит, места больше остается для работы с мультитреком. Да-да, музрынок харчуется не с аудиофильской аудитории. Чтобы пополнять закрома айтюнса, вполне хватает и таких вот студийных исходников. А раз найдутся гусики, кому туманит голову от 24 бит, отчего бы не продать то, что осталось?
В числе HD-релизов после 24/44.1 распространены издания в 24 бит/48 кГц. На них также сложно убедиться в хорошей родословной — верхний предел (т.е. половина частоты дискретизации) составляет 24 кГц — совсем близко от обычного компакт-диска. И, повторюсь, нет никаких гарантий, что запись не велась по образцу и стандарту DAT-рекордеров — в 16 бит / 48 кГц, а потом с помощью несложной программной процедуры была поднадута до благопристойных 24 разрядов. Выявить эти и другие подозрительные случаи поможет опция Bit Meter в аудиоредакторе WaveLab.
Анализатор цифровой глубины аудиопотока представляет собой пронумерованную по битам вертикальную шкалу и работает следующим образом. Загрузите испытуемые WAV или AIFF образцы в WaveLab и включите воспроизведение. Шкала Bit Meter отобразит каждый разряд в 16 или 24-битовом слове, которые будут выстроены по строгой иерархии согласно уровню сигнала. Сначала идут старшие биты, и надо сказать, что на спокойных ненасыщенных композициях четыре младших разряда не всегда-то и задействованы. Таким образом, будьте уверены, что сидишки со сладостным камерным джазком, которым любят тешить покупателей в аудиосалоне, на деле имеют глубину от силы в 12-14 бит.
Интересно будет на Bit Meter проверить пресловутые издания HDCD. Сграбленный на компьютер «как есть» такой диск ничем не будет отличаться от классического Red Book. Но с помощью программного HDCD-эмулятора (они имеются и в Foobar, и в dBpoweramper) можно раскодировать спрятанную информацию и перевести все в 24-битовые wav-файлы, которые станут объектом исследования Bit Meter. Опыт показывает, что те записи, на этапе HDCD-производства которых применялась функция Peak Extension (расширение динамического диапазона), показывают реальное увеличение разрядности от 17 до 20 бит — как и было сказано в рекламных проспектах на заре HDCD-технологии.
Примером успешной реализации могут послужить, например, CD-издания первых трех альбомов The Beatles загадочной конторой Fabulus Sound Lab, которые на сегодняшний момент мне представляются наиболее предпочтительными из целого вороха разномастных «битловских» релизов раннего периода.
В то же время такие компакт-диски, как например, Beck “Mutations” или одноименный сольник Nancy Sinatra 2004 года зажгут HDCD-метку на индикаторе совместимого CD-проигрывателя, но даже переведенные в 24 бита, разрядность сохранят прежнюю — 16 бит. Почему? Хотя в студии и использовался тот самый АЦП Pacific Microsonics (очень хороший, к слову!), но все его HDCD-цепи были отключены, осталась лишь метка в цифровом коде, от которой CD-плеер дурак и обрадовался.
Bit Meter поможет раскрыть и посрамить не только ворох престарелых компакт-дисков, но и хитрые HD-аудио, которые упоминались в начале материала. Никакая частота дискретизации не скроет от Bit Meter реальное состояние ячеек в разряде. Например, на альбоме Tricky “Mixed Race” (официально 24/44.1) отсчет начинается только с 20-го бита. Если в 24-битовом потоке в восьми старших разрядах остаются нули, так и будет показано на шкале. И значит, перед нами обычный апконверт из 16-битовой записи.
К счастью, подобные случаи относительно редки, однако от накладок не избавлены даже уважаемые B&W Society of Sound, под сенью которых были выпущены HD-издания The Unthanks “A Retrospective” и одноименный альбом Portico Quartet – оба показали 16-бит при анализе. Впрочем, это не значит, что подобные записи ужасно играют – на свете множество компакт-дисков с прекрасным звуком. Можно забить все разряды и спектр громким перегруженным саундом — такой файл будет тяжелым не только по размеру, но и на слух.
Не забывайте, что равно как и прочие инструменты аудиоредакторов, Bit Meter — это лишь один из элементов технической экспертизы, которые пусть и не ответят на все вопросы, но дополнят и обогатят ваш филофонический опыт.