1. Главная страница » Компьютеры » 16 Бит и 24 бит звука разница

16 Бит и 24 бит звука разница

Автор: | 16.12.2019

Внимание: Ниже дан текст, упрощенный для понимания. В связи с этим, использовались не академически точные формулировки, а «бытовые». Например, «громкость» вместо «уровня», «частота» синуса вместо «период» синуса, «музыка» вместо «сигнал». Всё это сделано намеренно ! Приоритетная задача — донести смысл до читателя.

24 бита. Правды и неправды

Вокруг форматов аудио есть много споров, и в связи с этим, самый интересный вопрос: «Почему они возникают?». С одной стороны и ежу понятно, что 24 бита 96кГц это лучше, чем 16 бит и 44,1кГц. Но, тем не менее, споры не умолкают, а людям «поддерживающим» 44,1/16 как формат минимально достаточный, часто приходится бежать с поля боя(споров) за неимением аргументов против железной логики: 24 больше 16, а 44,1 меньше 96.
Я не буду доказывать, что 44,1/16 лучше 96/24. Я не буду писать, что 44,1/16 это само по себе круто. Я напишу, что именно эти цифры обозначают, и самое главное, как они проявляются не на бумаге, а в жизни. Что стоит за их рекламой.

Немного основ
Звуковой сигнал (или для простоты «музыка») в электронике представляет собой электрические колебания. Например, «синус» сигнал с уровнем 1dBV означает колебание напряжения от «плюс» 1,4142 вольта до «минус» 1,4142 вольта. То есть напряжение плавно изменяется от плюса к минусу по закону синуса. Чтобы этот сигнал «записать» в цифру, нужно сделать несколько замеров напряжения и «записать» их. И здесь два главных вопроса: 1) Когда сделать замеры; 2) Как записать.

Из теоремы Котельникова (Найквиста) следует, что замеры нужно делать как минимум вдвое чаще, чем частота самого синуса. То есть если у нас сигнал 50Гц (50 колебаний в секунду), то замеров нужно сделать 100 в секунду. Вот эти 100Гц и называются частотой дискретизации.
Теперь «Как записать».
Допустим у нас супер вольтметр, который измеряет вольты до десятой точки после запятой. Вот он нам выдаёт показание 1,0000000001 вольт, затем 0,0000000009 вольт. И так 100 раз в секунду он нам выдает значения. Если музыкальный диапазон равен ±1dBV, то есть громкость на максимуме в пиках даёт ± 1,4142135623 вольт, то чтобы записать наш сигнал с точностью до десятого знака, нам понадобится почти 28,3 млрд. значений. Это 35 бит! Динамический диапазон 204 децибела! Ну да ладно. Это абстракция. Глянем, что нам предлагают производители ЦАПов, и всё станет понятнее.

24 бита, как они есть
Большинство ЦАПов звуковых карт питаются от 5 вольт. На своём выходе, они могут обеспечить колебания напряжения равные 4,5 вольта*. То есть когда играет музыка, то самое максимальное значение которое сможет поймать вольтметр будет 4,5 вольта, а самое минимальное 0 вольт.

Вообще, ЦАП это такая вещь, которая на вход принимает «цифру», а на выходе выдаёт напряжение. Если в ЦАП постоянно посылать одну и ту же цифру, то на выходе у нас будет постоянное напряжение. Для наглядности возьмём 3-битный ЦАП. В него можно загружать 8 различных цифр (напомню, это 000, 111, 100, 101, 001, 010, 110 и 011). На выходе он нам также сможет выдавать 8 различных напряжений. То есть если загрузить цифру 000, то на выходе у нас будет 0 вольт. Если загрузить 111, то на выходе у нас будет 4,5 вольта. А все остальные «цифры» будут выдавать напряжения, лежащие между нулём и 4,5В.

Например:
000 – 0 вольт
001 – 0,6428 вольт
011 – 1,2856 вольт
010 – 1,9284 вольт
110 — 2,5712 вольт
101 – 3,214 вольт
100 – 3,8568 вольт
111 – 4,4996 вольт

Если ЦАП сделать 4-х битный, то таких напряжений на выходе будет уже не восемь, а 16. Ну, а если у нас 16 битный ЦАП, то таких напряжений будет 65,5 тысяч. Фактически это значит, что наш чудо-ЦАП может выдавать напряжения от 0 вольт до 4,5 вольт с шагом 68,66 микровольт (0,00006866 вольт)! А шаг 24-битного ЦАПа, при его 16,77 миллионах значениях, будет равен 0,26822 микровольт.

От теории к практике
Вот это всё на бумаге. В реальности мы должны учитывать такое неприятное явление как шум. Любая, повторяю — ЛЮБАЯ, электрическая схема шумит. Это значит, что на выходе ЦАПа будет не только напряжение, которое он генерировал, но ещё и напряжение шума.

Представим, что рядом с ЦАПом находится возбудитель помех, который наводит шум на выход ЦАПа. Громкость шума возьмём от 0 мкВ (микровольт) до 10 мкВ (кому интересно, это уровень шума (SNR) для нашего ЦАПа равный -113dB). То есть наш ЦАП выдаёт какое-то «музыкальное» значение согласно той «цифре», что в него поступила, и к этому значению прибавляется случайное напряжение шума. Например, ЦАПу надо выдать ноль вольт, самое первое значение. Он выдаёт ноль, а возбудитель наводит помеху, и вместо нуля у нас на выходе получится, например 5мкВ. А затем ЦАПу надо выдать 5мкВ, а плюс помеха, у нас получится 12мкВ или 15мкВ!

Таким образом, из-за шума у нас на выходе получаются значения, которые «залезают» на соседей. Опять же пример: для 24 битного ЦАПа самое первое значение – это ноль вольт. А если появится помеха, то на выходе вместо нуля будет 10мкВ, а это значение 37-е по счёту! Первое значение – ноль вольт, второе значение 0,26822 мкВ, третье значение 0,53644 мкВ. а 37 значение как раз 9,92414 мкВ. У нас из-за шума ЦАП перепрыгнул 36 значений! А когда ЦАПу надо будет сыграть это 37-е значение, то прибавится помеха и на выходе будет вместо 37 какое-нибудь 50-ое! Ну и так далее. Смысл понятен? Конечно, сам ЦАП нам честно выдаёт то, что от него и требуется (если ноль – то ноль, если 10мкВ — то 10мкВ), но из-за шума все «старания» перечёркиваются.

Давайте теперь разберемся, с каким шумом мы имеем дело.

Может ну его?
Конечно, я немного наврал, когда сказал, что сам ЦАП не шумит. Он тоже шумит! Потому что тепловой шум никто не отменял, это раз. И сам ЦАП питается далеко не от стабильного источника напряжения (который не шумит), и все референсные и опорные напряжения тоже идут с шумом. Откуда ему взять «чистое» напряжение? Это два. Величину шума самого ЦАПа можно увидеть в его спецификации. Залезаете на сайт производителя и ищете datasheet к ЦАПу. К примеру CS4396, который стоит на звуковых Lynx Two и Lynx L 22 имеет Dynamic Range = 120dB. Это значит, что от самого громкого до самого тихого звука у нас 120dB. Самый громкий звук – 4,5 вольта. Самый тихий звук – это отсутствие звука (ноль вольт), но из-за шума у нас будет не ноль, а 4,5 мкВ. То есть у нас шум идёт от 0 до 4,5мкВ. Но это на бумаге – а в реальности больше.

Читайте также:  Iface eth0 inet static

А мы ведь помним, что наш 24 битный ЦАП может выдавать напряжения с шагом 0,26822 мкВ. Получается, что только из-за собственного шума ЦАП может перепрыгивать через 15 значений!

Но и на этом не всё. После ЦАПа обязательно стоит «миниусилитель», и даже не один. И каждый шумит. Опять же возьмём «миниусилитель» из Lynx’ов. Он называется OP275. Смотрим в его спецификацию и видим шум 1,186 мкВ. А до того, как этот звук заиграет в мониторах, он ещё пройдёт через усилитель. Возьмём усилитель на микросхеме LM3886, т.к. считается, что это хай перфоманс микруха, и на её основе делают усилители для таких мониторов как Yamaha HS50M и HS80M, KRK Systems V4, V6 и V8, Roland DS-5 и многие Другие. Смотрим спецификацию, и видим шум — от 2мкВ до 10мкВ!

То есть все эти шумы сложатся, а затем в усилителе усилятся вместе с полезным сигналом.

Ну и давайте посмотрим как бы самый худший вариант:

На ЦАП поступает «цифра», которая требует от ЦАПа ноль вольт. Но из-за собственных шумов он выдаёт нам 4,5мкВ. Далее два «миниусилителя» — и шум у нас уже 6,872мкВ. Далее сигнал отправляется по симметричной линии в мониторы, и там обязательно будет сумматор для балансной линии. Потому что в усилитель звук поступает несимметричный. Вот здесь два пути – либо стоит специальная микросхемка, либо простой «миниусилитель», но поверьте, в обоих случаях этот дивайс будет хуже, чем в Lynx Two. Возьмём хороший ресивер балансной линии INA2134 – его шум 7мкВ. Итого 13,872мкВ. И плюс собственно усилитель мониторов. В сумме, повторюсь в наихудшем случае, у нас шум будет 23,872 мкВ. То есть для 24 битного ЦАПа это равносильно перескакиванию через 88 значений! А для 16 битного ЦАПа с его шагом 68,66 мкВ этого не хватит, чтобы дотянуться до соседнего значения. И у 16 битного ЦАПа есть ещё Dither, суть которого самому шуметь в случайном порядке в пределах 1 шага. То есть всем известный Dither сам, то прибавляет 68,66 мкВ, то вычитает из музыкального сигнала (хотя на деле он не «вычитает», а просто «не прибавляет»).

Кто все эти люди?
Ну и последнее — что всё это значит, и какой вывод напрашивается? Давайте для начала всё подытожим.

Хотим мы или не хотим, но в реальной жизни мы сталкиваемся с таким явлением как шум. В самом хорошем случае (а если быть честным, то 23,872 мкВ – это хороший случай, и ниже будет понятно почему) у нас всегда есть шум громкостью -106dB.

Для борьбы с шумом придумали Dither, суть которого прибавлять один шаг и отнимать (в случайном порядке). (прим. — На самом деле дитер не борется с шумом в смысле его подавления!)

А теперь смотрим, у нас есть шум 23,872 мкВ, который в случайном порядке то прибавляется к сигналу, то не прибавляется. То есть это как бы естественный Dither! И если создать ЦАП с шагом в 23,872 мкВ, то ЦАП будет «таким как надо». А это всего 18 бит!

Вывод 1: Из-за естественных шумов ограничивается динамический диапазон звука. 24 битные ЦАПы могут читать «цифру», но на выходе из-за шума у нас будет только 18 битный звук.

Вывод 2: Из-за того, что я не учёл: наводки (помехи), которые можно нахватать проводами, медными дорожками на плате, помехи пассивных компонентов (конденсаторов, резисторов), помехи в ключах и реле — картина получилась слегка приукрашенной. В реале немножко хуже.

Вывод 3: Из-за того, что я не включил в рассмотрение такие явления как гармонические искажения, интермодуляционные искажения, искажения при переходных процессах, то реальная картина будет ещё немножко хуже, чем в Выводе 2.

Вывод 4: Всё написаное относится только к случаю, когда звук выходит из звуковой карты. Сами «цифры» шуметь не могут**, во всяком случае, пока они находятся в программе. Таким образом, 24 бита для обработки сигнала – шаг вполне оправданный. Как и 32 бита с плавающей точкой.

Далее. Не торопитесь покупать фильтры питания, сетевые фильтры. Не торопитесь покупать внешние звуковые, дабы оградиться от помех. От этого толку будет мало. Потому что мы имеем дело с естественными шумами, которые возникают по причинам, которые Производителям преодолеть не удалось (влияние температуры, тепловой шум колебания молекул и пр.). Но имейте ввиду, что грамотная разводка аппаратуры всегда нужна! Гляньте в левый нижний угол на Lynx Two и L 22. Видите там стоят два чёрных бочонка с подписями L1 и L2, а также два алюминиевых бочонка с надписью Nichicon 1000uF – вот это и есть фильтр питания, который стоит от силы пару баксов. Именно он помогает карте получать отличные шумовые характеристики. Но, несмотря на его низкую стоимость, никто кроме Lynx Studio их не ставит. Хотя может и ставят, но я не видел.

Ну, вот собственно и всё, что я хотел написать. Почему я не стал рассматривать частоту дискретизации? Лень. Но по большому счёту там нечего писать. Лично моё мнение – 48кГц нормально. 96кГц – идеально и даже многовато. Но что касается звуковых карт – то в ЦАПах стоят передискретизаторы (oversampling). Они умножают раз в 8 имеющуюся частоту дискретизации, и только после этого переводят в непрерывный «аналоговый» сигнал. Эта операция «сглаживает» звучание. Но такие цифровые фильтры стоят не везде. Там, где они есть – 48кГц звука за глаза хватит, а там, где нет – и 192кГц будет мало 🙂 Его наличие можно увидеть в спецификации (datasheet) к ЦАПу. А сам datasheet ищите или на сайте производителя, или в инете вообще. Фича называется 8x Oversampling Digital Filter – или как-то так.

Надеюсь теперь картина для кого-то прояснится. Ну если остались вопросы – пишите. Текст могу (и может буду) дополнять.

Примечания:
* — есть ЦАПы, у которых выход токовый. Но сразу после такого ЦАПа ставят преобразователь тока в напряжение.
** — на самом деле «цифры» тоже могут «шуметь». Это называется jitter – когда цифра либо приходит раньше, либо позже.

Частота дискретизации в два раза выше максимально записываемой. Т. е. при преобразовании в последовательность чисел из звуковой волны при записи требуется "делать отметки", считывать, вдвое чаще.

Материал в аудио-CD формате — 16-бит 44,1кГц. Это практически весь материал. Так что при воспроизведении разницы не будет.

Формат DVD-аудио поддерживает до 24 на 192.

Есть предположения, что человек может фиксировать более высокочастотные звуки, нежели 20кГц, однако вряд ли ушами.

Совершенно уверенно могу сказать что разница между простым 16,bit 44.1 khz звуком и hd аудио очень существенная и совершенно очевидная. При условии что вы нашли качественный HD аудио файл.
На простой встроенной звуковухе не тестил. И на совсем дешовых колонках тоже.
На наушниках косс порта про за 3 тыщи разница менее очевидна хотя наушники по качеству звука резко отличаются от основной массы ширпотреба.

Читайте также:  Endless space 2 вики

Что хочу добавить. Часто аппаратура имеет встроенные вещи типа усиления баса ( та самая кнопка "субербас") что дает эффект сходный с 24 битным басом но во первых это обман потому что 16 битная запись не содержит такой амплитуды а аппаратура только "растягивает" амплитуду и соответственно все таки красота баса немного теряется и он становится почти одинаковым на всех записях.
Примерно такая же картина с высокими частотами — есть всякие примочки и фильтры и звуковые процессоры которые существенно улучшают на слух высокие частоты в 44.1 записи примешивая туда всякие дополнительные вещи, особенно в аппаратуре высокого уровня, но это все равно обман слуха хоть и очень качественный и изощренный.
В итоге получается ситуация ка с mpз звуком — вродебы всена месте все слышно но ощущение как будто тебя обокрали а ты не можешь понять в чем именно и соответсвенно удовольствия от прослушивания меньше и башка трещит.

Совершенно уверенно могу сказать что разница между простым 16,bit 44.1 khz звуком и hd аудио очень существенная и совершенно очевидная. При условии что вы нашли качественный HD аудио файл.
На простой встроенной звуковухе не тестил. И на совсем дешовых колонках тоже.
На наушниках косс порта про за 3 тыщи разница менее очевидна хотя наушники по качеству звука резко отличаются от основной массы ширпотреба.

Что хочу добавить. Часто аппаратура имеет встроенные вещи типа усиления баса ( та самая кнопка "субербас") что дает эффект сходный с 24 битным басом но во первых это обман потому что 16 битная запись не содержит такой амплитуды а аппаратура только "растягивает" амплитуду и соответственно все таки красота баса немного теряется и он становится почти одинаковым на всех записях.
Примерно такая же картина с высокими частотами — есть всякие примочки и фильтры и звуковые процессоры которые существенно улучшают на слух высокие частоты в 44.1 записи примешивая туда всякие дополнительные вещи, особенно в аппаратуре высокого уровня, но это все равно обман слуха хоть и очень качественный и изощренный.
В итоге получается ситуация ка с mpз звуком — вродебы всена месте все слышно но ощущение как будто тебя обокрали а ты не можешь понять в чем именно и соответсвенно удовольствия от прослушивания меньше и башка трещит.

Сохранить и прочитать потом —

Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.

Частота 192 кГц считается вредной

Музыкальные цифровые файлы с частотой 192 кГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.

И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.

График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33 кГц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.

Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.

Есть несколько способов избежать дополнительных искажений:

  1. Динамик, предназначенный только для воспроизведения ультразвука, усилитель и разделитель спектра сигнала, чтобы разделить и независимо воспроизводить ультразвук, который вы не можете слышать, чтобы он не влиял на другие звуки.
  2. Усилители и преобразователи, спроектированные для воспроизведения более широкого спектра частот так, чтобы ультразвук не вызывал слышимых нелинейных искажений. Из-за дополнительных затрат и сложности исполнения, дополнительный частотный диапазон будет уменьшать качество воспроизведения в слышимой части спектра.
  3. Качественно спроектированные динамики и усилители, которые совсем не воспроизводят ультразвук.
  4. Для начала можно не кодировать такой широкий диапазон частот. Вы не можете (и не должны) слышать ультразвуковые нелинейные искажения в слышимой полосе частот, если в ней нет ультразвуковой составляющей.

Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.

Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30 кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.

Тесты для измерения нелинейных искажений:

  • Звук 30 кГц + звук 33 кГц (24 бит / 96 кГц) [5-секундный WAV] [30-секундный FLAC]
  • Мелодии 26 кГц – 48 кГц (24 бит / 96 кГц) [10-секундный WAV]
  • Мелодии 26 кГц – 96 кГц (24 бит / 192 кГц) [10-секундный WAV]
  • Нарезка из песен, приведенных к 24 кГц (24 бит / 96 кГц WAV) [10-секундный WAV] (оригинальная версия нарезки) (16 бит / 44.1 кГц WAV)

Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц [6]. При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.

В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.

Читайте также:  Acer программа для аккумулятора

Недопонимание процесса дискретизации

Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.

Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).

Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.

По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.

Это только так выглядит. Эти убеждения неверны!

Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell, поэтому можете не верить мне на слово.

Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.

С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.

Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них [7].

Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.

На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).

Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.

Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.

ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.

16 бит против 24 бит

Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?

16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.

Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.

Примечания к Части 2

6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.

7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.

8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *