44100 или 48000 что лучше

44100 или 48000 что лучше

44100 или 48000 что лучше

Модификация и улучшение качества звука андройд | Modification and improvement of sound quality android

Данная тема создана с целью улучшения и повышения звуковых характеристик андройд устройств, где все подробно описано начиная от простых действий в build.prop, заканчивая внедрением сторонних аудио библиотек в свой смартфон.

Тему буду обновлять по ходу времени

Для всех действий понадобится наличе root прав

Список samplingRates 8000,16000,32000,44100,48000,88200,96000,176400,192000,384000
Список format по возрастанию в качестве
AUDIO_FORMAT_PCM_16_BIT
AUDIO_FORMAT_PCM_24_BIT_PACKED ( в основном используется для a2dp)
AUDIO_FORMAT_PCM_8_24_BIT
AUDIO_FORMAT_PCM_32_BIT

Флаг fast
Он же вывод звука с низкой задержкой до 40 мс

16 bit и 48Khz максимкльно и все что ниже. Нельзя выводить hires

Разгрузка offload
Список форматов:
AUDIO_OUTPUT_FLAG_DIRECT (прямой выход)
AUDIO_OUTPUT_FLAG_COMPRESS_OFFLOAD (сжатие аудио на выходе)
AUDIO_OUTPUT_FLAG_NON_BLOCKING (аудио выход не блокируется)

используется для вывода на bluetooth или устройства где это необходимо гарнитуру, современные устройства компрессиуют сигнал до mp3 под кодек SBC,если наушники (устройство) не поддерживают кодек ldac, aptx и hwa
если есть возможность выводить через hires кодек, то вывод идет через 24_BIT_PACKED, упрощенный формат 24bit

Прямой вывод звука, игнорирование всех эффектов системы и пост обработок, то есть вывод HIRES
Список форматов:
AUDIO_OUTPUT_FLAG_DIRECT (прямой выход)
AUDIO_OUTPUT_FLAG_DIRECT_PCM (прямой выход в PCM контейнере)
В чем разница незнаю, можете использовать 1 один из них

Флаги выхода аудио
AUDIO_OUTPUT_FLAG_PRIMARY (первичный аудио выход, используется по стандарту в большинстве устройств)
AUDIO_OUTPUT_FLAG_DEEP_BUFFER (Глубокий буффер)

Список форматов компрессии аудио от самого высокого до низкого качества (это не весь список, но самые нормальные) (не все будут поддерживаться)
AUDIO_FORMAT_FLAC
AUDIO_FORMAT_ALAC
AUDIO_FORMAT_APE
AUDIO_FORMAT_VORBIS
AUDIO_FORMAT_WMA
AUDIO_FORMAT_WMA_PRO
AUDIO_FORMAT_MP3 (по умолчанию)

Разложить все файлы по папкам из архива, и дать разрешения
Правка разрешений файлов
/bin/alsa_amixer 0755
/bin/alsa_aplay 0755
/bin/alsa_ctl 0755
/lib/libasound.so 0644
/usr/share/alsa //всем папкам 0755, всем файлам в папке alsa 0644
Драйвер для 32/64 битных процессоров: alsa_32bit.zip ( 405,16 КБ )
(ограничение андройд от 4 до 6 выше работать не будет)

Дополнение положить в /system/lib/hw с правами 0644 (может как положительно так и негативно сказаться на звуке): alsa.default.so.zip ( 12,96 КБ )

Готовый скрипт для запуска alsa: alsa.sh.zip ( 272 байт )

# Нестандартные
Имеет качествнный алгоритм обработки аудио
Ставить с заменой, если в /system/lib/libasound.so имеется данная библиотека, если ее нет бесполезно (возможно появистя эффект, но не уверен) В /system/bin не должно быть бинарников от alsa, иначе с замной библиотеки пропадет звук, сделайте копию оригинала для безопасности 🙂
Библиотека asound от Samsung GS8+: alsa_asound_sgs8+.zip ( 262,15 КБ )

bundle <
path /system/lib64/soundfx/libbundlewrapper.so
>
>
effects <

bassboost <
library bundle
uuid 8631f300-72e2-11df-b57e-0002a5d5c51b
>
>

Просто кладем с заменой в /system/lib/soundfx присвоив им права 0644
Для 64 битных, проверяйте оба, звук сильно отличается
Список библиотек:
/libbundlewrapper.so
/libldnhncr.so
/libreverbwrapper.so
/libdownmix.so
Работают как на 32 двух так и 64 битных процессорах: standard_32bit.zip ( 83,28 КБ )

Библиотеки класть в /system/lib64/soundfx с заменой
Для 64 битных процессоров: standard_64bit.zip ( 80,33 КБ )

Библиотеки брал от 6 андройд, но должны работать и на версиях ниже, так как они универсальные
ВАЖНО сделайте бекап системного раздела не гарантирую 100% работу библиотек (телефон может зависнуть на вечной анимации) , можете перебирать по одной и наблюдать как ведет себя смартфон
Установка: перенести все библиотеки с заменой в /system/lib и дать права 0644
Можно упростить процесс правки прав
su #получаем root
mount -o rw,remount /system #перевод системного раздела в запись
chmod 0644 /system/lib/*.so #смена прав

Список библиотек:
/libaudioflinger.so
/libaudioresampler.so
/libaudiospdif.so
/libaudioutils.so
/libeffects.so
/libinput.so
/libinputflinger.so
/libsonic.so
/libsonivox.so
/libsoundtrigger.so
/libspeexresampler.so
/libwebrtc_audio_coding.so
/libwebrtc_audio_preprocessing.so

В целом повышает общий уровень громкости, четкость, басс.
audio_engine.zip ( 1,24 МБ )

Сообщение отредактировал Roman_city — 10.09.19, 22:12

Подробная инструкция по настройке ALSA

На выходе получите высококачественнее звук

Смена звуковой карты, если имеется 2
Наличие и номер звуковых карт можно проверить командой в терминале
cat /proc/asound/modules
Если выдало к примеру, 0 стандартная карта, 1 адаптированная для музыки именно она должна поддерживать 32 или 24 битную обработку и 192000 дискритизацию, хотя бывает что и стандартная не плохо себя ведет на такой обработке.
0 mtkcard
1 hdcard
# по умолчанию 0, пишем 0 или 1 взависмости от наличия карт
defaults.ctl.card 0
defaults.pcm.card 0
defaults.pcm.device 0

Находим и меняем данные строки
сильно влияет на звук
defaults.pcm.dmix.rate 48000 #повышем до 96000 / 192000 , насколько система позволяет
defaults.pcm.dmix.format «U16_LE» #формат обработки рекомендую использовать U32_LE или U24_3LE U18_3LE

Значения выше, высокие и средние поднимаются, если в минус басса больше, менять default

Функция значительно преображает звук, по умолчание 16, если спустить на 0 и ниже звук будет бассистым, наоборот ввысьвысокие и средние выражаются, более четкий
менять default

Сообщение отредактировал Roman_city — 28.09.17, 16:54

Библиотеки Beats
Оригинал, но тут расширенная версия
Данные операции над устройством безопасны, то есть они не приведут к крашам и вечным загрузкам устройства!
Работают на arm/arm64/x86
Не пихайте сразу все, они очень сильно влияют звук даже при малейшем изменении, можно испортить так и повысить звучание

Установка: всем файлам права 0644, папкам 0755, исключение /bin/все файлы, права 0755
Внутри лежит файл для добавления эффектов в audio_effects.conf

Внутри архива папка beats_expansion, в ней находятся все остальные конфигурации звука
Файлы с расширением /etc/*.bin бросайте в /system/etc с правами 0644, рекомендую использовать по 1 из каждого подраздела bas,dyn,img,peq (может одного хватит)

Список основных либов к которым поодключаются все остальные настройки и либы /system/lib:
/system/lib/soundfx/libbeatsbass.so
/system/lib/soundfx/libsrsfx.so
/system/lib/soundfx/libsrstb.so

Описание эффектов:
/etc/*.bin конфигурация выходного звука,
В папке /etc/soundimage лежат основные настройки для SRS, эквализируют звук, бассбусты, усилетели голоса и высоких и т.д., копируйте в /system/etc/soundimage с правами 0644
Из названия разберетесь
В папке /etc/audio, файлы, которые копрессируют, лимитируют и выравнивают АЧХ выходного сигнала.

/system/bin/sound лимитер
/system/lib/soundfx/libbeatsbass.so усилитель басса
/system/lib/soundfx/libsrsfx.so накладвает эффекты расширение стерео образа, реверб, дисторшен и т.д.
/system/lib/soundfx/libsrstb.so Что то вроде компрессора
/system/lib/soundfx/libsrscore.so помогает libsrsfx.so, компрессирует звук
/system/lib/soundfx/libbeatscorehtc.so помогает libbeatsbass.so
/system/lib/soundfx/libharmancorehtc.so возбуждает высокий спектр частот, голоса чище звучат

libraries_beats_audio.zip ( 1,89 МБ )

Сообщение отредактировал Roman_city — 14.10.17, 14:41

Выставил дискретизацию 384000, звук не пропал, смарт redmi 3s, проц снап 430.

Сообщение отредактировал ne navizu LG — 12.10.17, 07:33

Настройка и эквализация звука в SRS Processing

Ставится в основном на бюджетных моделях, может ошибаюсь (как пример взял от Leagoo M8)
Возможно у кого то она заработает без наличия данной библиотеки
Наличие проверяется, нахождением файлов: в /system/lib/libsrsprocessing.so ../system/data/srs_processing.cfg (иногда он находисят в etc)

Версия самой программы, включение программы или нет и уровень усиления выходного сигнала
// BLOCK: srs_cfg
// Config — Non-IP Configuration
:srs_skip = 1 #Пропускает любую обработку SRS 0 -нет, 1 — да
:trumedia_enable = 0 #включен или нет
:trumedia_preset = 0 #какую использует предустановку, 0 — music ,1 — movie, 2 — podcast
:trumedia_igain_int = 1.000
:trumedia_igain_ext = 1.000
:vol_int_enable = 0 #регулирования объема
:trumedia_skip = 0

Tru Bass — строка эмулирует вертикальный басовый звук

srs_mus_int:
:wowhd_igain = 0.600 #усиление звука на входе
:wowhd_ogain = 1.000 #усиление звука на выходе
:wowhd_trubass_enable = 0 #включение отключение 0-1
:wowhd_trubass_min = 0.000 #минимальная частота воздействия в герцах
:wowhd_trubass_window = 1.000 #размер
:wowhd_trubass_slide = 0.000 #насколько будет сглажен
:wowhd_trubass_slide_udef = 0.000 #практически делает то же самое, что и slide
:wowhd_trubass_compressor = 0.000 #компрессор, срезает лишние частоты, возвышающие выше 0дб
// ALIAS :wowhd_trubass_size // TruBass Speaker Size
:wowhd_trubass_freq = 500 #основная частота на которую воздействует — частота
:wowhd_trubass_analysis = 300 #размер анализа — частота
:wowhd_trubass_sa_enable = 1 #включение отключение сплит анализа
:wowhd_trubass_mode = 0 #Тру басс мод (0 — моно, 1 — стерео)
:wowhd_xover_enable = 1 #частота среза фильтра для динамика
:wowhd_xover_order = 4 # степень воздействия (максимум — 6)
:wowhd_xover_freq = 750 #частота (рекомендую 250)
:wowhd_hpf_enable = 1 #Hi pass Фильтр — обрезает частоты ниже установленной фильтра
:wowhd_hpf_order = 4 #степень воздействия (максимум — 6)
:wowhd_hpf_freq = 250 #частота
:wowhd_srs_enable = 0 #SRS3D — создает ощущение 3D
:wowhd_srs_space = 0.700 #воздействие на правый и левый канал
:wowhd_srs_center = 0.500 #воздействие по центру
:wowhd_srs_mode = 1 #(0-моно, 1-один динамик, 2-стерео, 3-экстрим
:wowhd_srs_speaker = 0 #тип звука (0 — динамик, 1 — наушники)
:wowhd_focus_enable = 0 #включение отключение фокуса
:wowhd_focus = 0.170 #Степень воздействие фокуса
:wowhd_definition_enable = 0 #четкость звука 0-1
:wowhd_definition_min = 0.000 #минимальная степень воздействия
:wowhd_definition_window = 0.500 #размер
:wowhd_definition_slide = 0.000 #
:wowhd_definition_slide_udef = 0.100 #
:wowhd_widesur_enable = 0 #сключает расширение стерео образа
:wowhd_widesur_igain = 1.000 #усиление
:wowhd_widesur_centerboost = 0.500 #усиление по центру
:wowhd_widesur_separation = 0.500 #степень смешивания звука
:wowhd_skip = 0 #пропуск эффектов или нет 0 нет, 1 да

Videoediting.ru Forum

Конверсия 44100 -> 48000

Teodor 19 12 2004

Arty 19 12 2004

Aleksandr_Oleynik 19 12 2004

Konrad 19 12 2004

Gradov_Georg 19 12 2004

Тихие, не выше -90дБ.

на 16 битах это +- 1. Про дитер и нойсшейпинг в курсе?

Teodor 19 12 2004

Тихие, не выше -90дБ.

на 16 битах это +- 1. Про дитер и нойсшейпинг в курсе?

А ты слышишь -90? При каком усилении?
Если учесть, что у многих аудиотрактов SNR лежит в этих же пределах, то это очень тихо.
Все настройки (согласно хелпа) были настроены на макс. качество. Вопрос не в том, много это или мало, вопрос, почему вылазит и как избежать. Могу, конечно, настроить, чтоб давился до нуля сигнал ниже определенной амплитуды, но зачем, если там была тишина. Почему она перестала быть таковой?

Gradov_Georg 19 12 2004

Teodor, ты не правильно понял меня.

+-1 (на самом деле вплоть до +-3младших бит) — это и есть работа алгоритма дитера + нойсшейпинга предназначеных, для устранения цифровых артефактов пересчетных алгоритмов. Есть собирательное название эти артефактов ТРАНКЕЙТ или неравнораспределенное цифровое округление до целых значений.

Ты смог их заметить эффект от дитера+нойсшейпинга там, где этим алгоритмом прошлись по цифровой тишине в исходнике.

То что этот «привнесенный» шум относится к НЕСЛЫШИМОМУ в чистом виде я в курсе 8-).
Сообщение отредактировано Gradov_Georg: 19 Dec 2004 — 15:41

Teodor 19 12 2004

Только что заставил сделать эту процедуру Canopus Procoder 1.5. Просто закодировал видео, а аудио параллельно конвертнулось. Цифровая тишина ею и осталась. Доберусь домой — посмотрю спектр и АЧХ. На слух вроде нормально. Видимо округляет сильнее, или нойс-гейт какой-то встроеный срабатывает.

2 Gradov_Georg
Меня смутило большое количество восклицательных знаков.

Anatoliy A. Vorobey (sparrow) 19 12 2004

Teodor:-«Вопрос не в том, много это или мало, вопрос, почему вылазит и как избежать.»

Относительно всех этих проблем можно почитать вот здесь
h__p://subbotin.inion.ru/Saturday_Mastering_Studio.htm&text=Saturday&reqtext=Saturday::96773&

Да, адресок надо поправить http://subbotin.inion.ru/Article2.htm, верхний не правильный.
Спасибо, Георгий!
Сообщение отредактировано sparrow: 19 Dec 2004 — 19:40

Gradov_Georg 19 12 2004

как раз отсуствие таких вещей и говорит о «математически механичном» пересчете с большой вероятностью транкейта 8-).

«КОГДА ИСПОЛЬЗОВАТЬ ДИТЕР:
Техника студийного использования алгоритмов дитера высокого порядка»

Gradov_Georg 20 12 2004

Счас нас всех троих побьют.

Причем на этот раз я не на твоей стороне.

Секвоя, Куул. у меня уже давно на ресемплинг звука звукорежиссеры не жалуются. Я бы сказал очень давно причем на питчшифт таймстреч тоже.

Anatoliy A. Vorobey (sparrow) 20 12 2004

Gradov_Georg 20 12 2004

Ну вот. аналоговый ламповый, ли магнитофонный ресемплинг вообще хорошо, если считать еще и облагораживание звука в комплекте, только для домашних видео работ перебор наверно 8-).

Хотя квантум тоже не плохо делает с поджатием на лету «металл4» если правильно помню, даже диспут был у звукорежей — морально ли его использовать на классике.

Ну вот. аналоговый ламповый, ли магнитофонный ресемплинг вообще хорошо, если считать еще и облагораживание звука в комплекте, только для домашних видео работ перебор наверно 8-).

Хотя дбх квантум (железный) тоже не плохо делает с поджатием на лету «металл4» если правильно помню, даже диспут был у звукорежей — морально ли его использовать на классике.

Anatoliy A. Vorobey (sparrow) 20 12 2004

Ну, судя по тому, что ты дважды написал об одном и том же- то мы на правильном пути!

Если серьёзно, то сейчас народу понятно- как быстро, но не совсем правильно и дёшево, а как дорого и правильно.

crio 21 12 2004

Видимо, как и в случае с конвертированием DTS>WAV, только я знаком со специальной утилитой конвертации сэмплрэйта.

This program converts sampling rate of PCM wav file. Also, this program has
a function to apply dither to its output and extend perceived dynamic range.
Sampling rates of 44.1kHz and 48kHz are populary used, but ratio of these
two frequency is 147:160, and it’s not a small numbers. Therefore, sampling
rate conversion without degradation of sound quality requires filter with very
large order, and it’s difficult to achive both quality and speed. This program
achived relatively fast and high quality with two different kinds of filters
combined skillfully.

Это command line утилита, использовать надо файл ssrc_hp.exe (hp означает high precision, не знаю, как перевести, но уж больно красиво звучит).

Я, правда, не утверждаю, что она лучше железячных преобразователей, но чисто интуитивно предпочитаю встроенным средствам аудиоредакторов именно её. Тем не менее, мне будет интересно услышать мнение о качестве данного продукта из уст владельцев профессиональных студий. Заранее спасибо.

Вот тут есть для неё фронтъэнд, графическая оболочка:

—————
***crio’s foobar is playing: Yo-Yo Ma — 2003 — Obrigado Brazil — 12 — Alma Brasileira @ 190kbps [3:13/5:05]

Iron 21 12 2004

(hp означает high precision, не знаю, как перевести, но уж больно красиво звучит).

Читать еще:  От чего зависит разрядность операционной системы

high precision — высокая точность.
crio, спасибо. Будем пробовать, надеюсь high precision оправдается

Anatoliy A. Vorobey (sparrow) 21 12 2004

crio 22 12 2004

М-да. Похоже, данная версия заточена исключительно на 16 бит. На самом деле я слукавил: я не пользуюсь именно этой утилитой, я использую её реализацию, выполненную в виде плагина к проигрывателю Foobar2000. Просто мне лень было объяснять, как это сделать в Фубаре. Только что проверил, 24-битные файлы конвертируются нормально.
Итак, забираем Фубар здесь. Устанавливаем в системе. Особо надо обратить внимание на то, чтобы установились плагины Diskwriter, Resampler (SSRC), Kernel streaming output, Standard input, ABX comparator. Остальное по вкусу. Файлы ассоциировать по желанию.
Запускаем проигрыватель. CTRL+P. Output > Output method > Kernel streaming. Жмём на кнопку «go to settings. » и выбираем Device, к которому подключён усилитель с мониторами. Нажимаем кнопку ‘Close». Загружаем в проигрыватель какой-нибудь файл и пробуем его услышать. Возможно, при первом запуске выскочит окно с грозными предупреждениями о невозможности работы через Kernel streaming на некоторых звуковых картах. Просто закроем его и запустим файл повторно. Если звука нет, значит придётся выбрать другой метод вывода, например, Output > Output method > waveOut. Однако, я настоятельно рекомендую использовать Kernel streaming, поскольку этот метод работает напрямую с железом, минуя микшер Windows. Как правило, качество звучания через Kernel streaming несколько выше. Всё, можно пользоваться Фубаром для прослушивания музыки. Однако мы хотим что-то конвертировать?
Опять жмём CTRL+P. Playback > DSP Manager — из правого окна неактивных плагинов добавляем в левое окно активных Resampler (SSRC). Затем в Playback > DSP Manager > Resampler устанавливаем Target sample rate и отмечаем галочкой Slow mode. Ресемплер взведён для воспроизведения, но не для конвертации, то есть слушать уже можно, а сбросить на диск — нет. Идём в Components > Diskwriter и отмечаем галочкой опцию Use DSP в секции Processing. Секция Output bit depth — по вкусу. Нажимаем кнопку ‘Close».
Загружаем в Фубар файл AAA.WAV 44.1 кГц, кликаем на его имени в плейлисте правой кнопкой мыши, выбираем Convert > Run conversion. В появившемся диалоге выбираем WAV (PCM, fixed-point) и нажимаем кнопку ОК. Файл конвертируется в указанную директорию под именем 001 AAA.WAV, уже ресемплированный в 48 кГц, если, конечно, именно эта частота была выбрана в качестве желаемой. Опять жмём CTRL+P. Playback > DSP Manager — убираем Resampler из активных плагинов.
Теперь начинается самое интересное. Файл AAA.WAV у нас уже загружен. Дополнительно подгрузим 001 AAA.WAV через меню Фубара Playlist > Add files. Наш плейлист теперь состоит из двух треков: AAA.WAV и 001 AAA.WAV. Теперь неплохо бы их сравнить на идентичность звучания на слух. Делаем. Выделяем оба трека через клавишу SHIFT или CTRL. Кликаем на любом треке правой кнопкой мыши и выбираем ABX two tracks. Появится новый диалог слепого тестирования файлов. В секции Playback жмём на все кнопки Play и внимательно вслушиваемся. A и B — это наши файлы, нужно им сопоставить X и Y. В секции Choice делаем выбор: если есть уверенность, что файл A — это X, то жмём верхнюю кнопку, в противном случае — нижнюю. Жмём на кнопку Next trial и повторяем процедуру ещё раз 10-20. В секции Status смотрим Score. Например, 2/15 означает, мы правильно сопоставили файлы только в двух случаях из пятнадцати. Чем выше процент в Probability that you were guessing, тем больше вероятность того, что мы не слышим разницы между этими файлами, то есть качество конвертации весьма высоко. И наоборот.
Надеюсь, что теперь всё получится. С нетерпением жду результатов тестирования.

P.S. Dear sparrow, не хочу показаться навязчивым, но Вы мне как-то намекали на возможность ознакомительной экскурсии по озвучке. Мне просто хотелось бы знать, Ваше предложение всё ещё в силе?

—————
***crio’s foobar is playing: Itzhak Perlman & John Williams — 1997 — Cinema Serenade — 02 — Tango (Por Una Cabeza) from «Scent Of A Woman» @ 222kbps [1:53/3:51]
Сообщение отредактировано crio: 22 Dec 2004 — 03:04

Anatoliy A. Vorobey (sparrow) 22 12 2004

А чего ж нет?
Только теперь уж в след. году
А Вы хотите просто аппаратную посмотреть или сам процесс?

to crio
Сдаётся мне, что Foobar2000 может и dts декодировать в wav-ы!?
Не трудно будет «мысли ход короткий» описАть?!
Сенкс и при встрече.

Бит против килогерца: что важнее?

Размышления об успехе 12-битной драм-машины E-Mu SP-1200 и довольно узкая динамика поп/рок-репертуара зародил еретические мысли. Оптимальны ли характеристики наших цифровых протоколов?

Любители студийного мастер-звука могут сердиться сколько угодно, но факт остается фактом. Формат Red Book при немыслимом для цифровых технологий возрасте 35 лет все еще остается основным контейнером для коммерческих фонограмм. Даже если вы слушаете ощипанный трек в MP3 или iTunes, его пропорции описаны в тех же 16 битах на опорные 44,1 кГц дискретизации. Много это или мало? Смотря что мерить.

Компакт-диск или файл в аналогичном формате в состоянии обеспечить 16 х 6 = 96 дБ между самым тихим и громким пассажем. Это очень даже немало. Техническим сигналом для лабораторных испытаний можно заставить ЦАП выдать такой показатель, но я не знаю реальных музыкальных событий с подобным размахом. Даже тот самый «1812» с пушечкой — там 60 дБ в самых пиковых моментах и чуть больше 20 дБ в среднем. В современной фонограмме показатели динамического диапазона сужены обычно раза в три.

По преданиям, Philips сначала хотела остановиться на 14-битном разрешении; умножаем 14 на 6 = 84 дБ, это по-прежнему выше уровня рокота самых дорогих виниловых трактов. Первое поколение ЦАПов Philips TDA1540 оперировало именно с 14 бит и ничего, многие винтажисты очень довольны этим чипом по сей день.

Первое поколение CD-плееров использовало 14-битный ЦАП Philips TDA1540

В общем, CD-качества вроде бы хватает с головой для самых смелых аудиозадач. И все-таки, когда сравниваешь мастер в Hi-Res и полученный из него стандартный Red Book CD, кажется, что-то утеряно. Где-то больше, где-то не очень — зависит от контента. Но и не забывайте, что ресемплинг и понижение битности понижается различными алгоритмами, так что итоговое качество для CD-печати получается гадательным.

Мой личный опыт возни с записью, редактированием и воспроизведением цифрового аудио по большому счету имеет две точки мнительности. Первая выглядит вполне технически обоснованной.

Мне категорически не нравится, что на аудиопотоке с дискретностью 44,1 кГц граничная частота лежит слишком низко, в области 20 кГц. Вроде бы там особо и не должно быть слышно, но как показывают графики работы цифровой фильтрации ЦАПа, в окрестностях творится черт знает что. Жесткий срез спектра записи, хотя в жизни имеет место пологое падение. Или наоборот, ранний завал из-за специфики фильтра. А еще какие-то паразитные гармоники на высоких частотах. Удельный вес относительно общего сигнала у них не очень большой, но все равно картинка получается неприглядная. Все вот эти оверсемплинги требуются из-за невозможности установить на 22,05 кГц нормальный аналоговый фильтр.

Было бы прекрасно, если бы в начале 80-х стандартом оставили дискретизацию 50 кГц первых цифровых рекордеров Soundstream. А еще лучше, если бы она составила примерно 60 кГц. Таким образом, мы бы получили достаточно протяженную АЧХ, обеспечивающую плавный спад всех музыкальных штрихов и нюансов до 30 кГц, как в хорошем магнитофоне или SACD. Вот выше уже действительно ничего нет. Но в итоге получилось по-другому.

До анонса компакт-диска цифровые рекордеры Soundstream записывали звук с параметрами 16 бит / 50 кГц

Sony выбрала значение 44,1 кГц из-за совместимости со стандартом PAL. Профессиональные видеомагнитофоны Betacam и VHS позволяли делать запись PCM-кода аудио. Три значения укладывались в каждую из 588 строк видеосигнала PAL, передаваемого с частотой 25 кадров в секунду: 3 х 588 х 25 = 44100. Вот такая арифметика.

Видеомагнитофон Sony с помощью процессора PCM-F1 мог записывать цифровой аудиокод

Дальнейшее развитие цифровых технологий записи и воспроизведения использовало кратное умножение базовых форматов CD и DAT — 44,1 и 48 кГц: т.е. 88,2, 96 кГц и так далее. Конечно, появилась возможность отодвинуть помехи квантования подальше в ультразвук, но ведь и кратно росли размеры аудиофайлов. А еще прибавка в полтора раза при переходе с 16 на 24 бит. А если это будет 32 бит? И при попытке сделать этот огромный аудиомассив чуть меньше меня добивает вторая мнительность.

Казалось бы, разрешение 24 бит и выше подразумевает выборку далеко за пределами человеческого слуха. Шутка ли, 24 х 6: нет такой ни техники, ни фонограмм, чтобы они плясали в диапазоне 144 дБ. Для того 24 бит и затевались в студиях — вынести любые ошибки наложения при редактуре куда подальше. Но стоит подвергнуть такой файл децимации, даже просто ресемплингу из 192 в 96 кГц, и что-то неуловимо меняется. Чуть другие уровни, чуть более плоский и тупой саунд, который мне не очень нравится в сравнении. Поэтому я выбираю оригинальные хайрезы не за абстрактную частотку, а лишь за отсутствие шрамов, которыми обрастает мастер-файл по пути вниз. Попытаемся оценить эти увечья.

Для экспериментов был выбран питомец лейбла 2L, который предлагает некоторые свои DXD-записи для свободного скачивания. Надо сказать, репертуар, как это бывает у аудиофильских контор, довольно тягостный и медлительный. Но, к счастью, там нашлась и выручила «Детская увертюра» Эжена Бозза. Эта фонограмма довольно энергично брякает, чтобы судить об изменении саунда при трансформации мастер-файла.

Изначально 5 с половиной минут DXD-оригинала «Детской увертюры» с характеристиками 24 бит / 352,8 кГц занимает целых 437 мегабайт. И это еще сжатое во FLAC, практически размер целого CD! На чем будем экономить?

На заре цифрового звука еще не существовало эффективных моделей борьбы с ошибками квантования. Да и вычислительным мощностям процессоров было многое не под силу. Шкворчание 8-битного саунда первых компьютерных игр стало стереотипом на долгие поколения вперед, но сейчас вы сами убедитесь, что 8 бит сегодня может играть вполне прилично. Чудодейственной панацеей стал так называемый дизеринг (dither), а если еще точнее — его разновидность, нойз-шейпинг (noise shaping).

В весьма толковой статье разработчика iZotope Алексея Лукина дается наглядный пример, как подмешивание горстки шума выручает картинку при снижении разрешения до 4 бит с 16-ю градациями яркости. Просто чудо, когда видишь, как ошибки квантования (так называемая постеризация изображения) практически сходят на нет. То же самое происходит и со звуком.

В отличие от общего случая дизеринга, нойз-шейпинг генерируется не во всей полосе полос, а лишь на высокочастотной области, что менее заметно на слух. Рассуждения о заметности схожи с помыслами разработчиков MP3-алгоритма, с той лишь разницей, что эти в частотный диапазон добавляют, а не режут. Нойз-шейпинг позволяет увеличить динамический диапазон фонограммы, от души его применяют в DSD кодировании и также видны следы его работы при записи «Детской увертюры».

Итак, с помощью ресемплера и фирменного нойз-шейпинга iZotope MBIT+ был сгенерирован целый ворох «Детских увертюр». Получилась стопочка FLAC-ов с разрядностью 8, 12, 16, 20 и 24 бит на кратной дискретизации 44,1 или 88,2 кГц. Также не обошлось без пары образцов МР3 битрейтом 320 кб/с. Один был опрокинут из файла 24 бит / 88,2 кГц, другой из 16 бит / 44,1 кГц, которые также представлены в этом списке. Архив можно скачать и самостоятельно решить, кому что нравится.

Понятное дело, четче и лучше всех отыграла самая полная версия 24/88, практически неотличимо от оригинала. Я надеялся, что понижение до 20 бит не скажется на качестве, но не тут-то было. Значит, начнем двигаться с другой стороны списка.

Сортировка в папке по размеру показала, что самым маленьким оказался образец 8 бит / 44,1 кГц. Менее 12 мегабайт после 400! Несмотря на слышимый шумок, звучит он весьма задорно и это не иллюзия — после всей математики уровень фонограммы немного подрос. Следующими по объему ожидаемо шли МР3. Не знаю как вам, но мне из всего набора проверять их было скучнее всего. И это при том, что в паузе у таких файлов было все чисто и аккуратно. Ну не мое, и все тут. Скомканный серый звук без огонька. Приятнее слушать пусть шумноватый, но лосслесс с низкой битностью, напоминает кассету. Вот на них и выруливаем дальше.

В полтора раза больше чем МР3 оказалась пара образцов на 12 бит / 44,1 кГц и 8 бит / 88,2 кГц. Размер — 19,7 и 23,5 Мб соответственно. По сравнению с базовым CD-разрешением (28,5 Мб) дополнительный шум заметен разве что в 8-битном треке, да и то в наушниках. Я не смог отдать однозначное предпочтение какой-то одной версии.

Субъективно файл более высокой битности играет быстрее, напористей, особенно это касается 24 бит / 44,1 кГц. Но и у 8- и 12-битного аудио на более высокой частоте дискретизации 88,2 кГц имеются несомненные плюсы. Более «гибкие» послезвучия, глубже строится сцена в отсутствие цифрового фильтра в слышимой области. Вы также можете сгруппировать треки по размерам и сравнить их самостоятельно.

По коэффициенту качество/размер я бы выделил следующую тройку, и вся она, увы, опирается на повышенную частоту дискретизации 88,2 кГц:

Читать еще:  D2D recovery в биосе что это

• 12 бит / 88,2 кГц (13-кратное уменьшение оригинала)

• 8 бит / 88,2 кГц (18,5-кратное уменьшение оригинала)

• 16 бит / 88,2 кГц (10-кратное уменьшение оригинала)

Подытоживая этот обзор, если можно было перезапустить всю цифровую индустрию заново, я бы предпочел использовать следующую градацию PCM-протоколов:

• Частота дискретизации 60 кГц в качестве индустриального стандарта

• Частота дискретизации 120 кГц для ответственных High-End задач

• Длина разряда в 10 бит для потокового аудио (10 бит / 60 кГц)

• Длина разряда в 14 бит для стандартной дистрибуции музыки (14 бит / 60 кГц)

• 22 бит для студийной работы и аудиофильских изданий музыки (22 бит / 60 кГц или 22 бит / 120 кГц)

Цифровой аудиоформат 24/192, и почему в нем нет смысла. Часть 2 [Перевод]

Что является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов?

Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.

Частота 192 кГц считается вредной

Музыкальные цифровые файлы с частотой 192 кГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.

И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.

График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33 кГц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.

Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.

Есть несколько способов избежать дополнительных искажений:

  1. Динамик, предназначенный только для воспроизведения ультразвука, усилитель и разделитель спектра сигнала, чтобы разделить и независимо воспроизводить ультразвук, который вы не можете слышать, чтобы он не влиял на другие звуки.
  2. Усилители и преобразователи, спроектированные для воспроизведения более широкого спектра частот так, чтобы ультразвук не вызывал слышимых нелинейных искажений. Из-за дополнительных затрат и сложности исполнения, дополнительный частотный диапазон будет уменьшать качество воспроизведения в слышимой части спектра.
  3. Качественно спроектированные динамики и усилители, которые совсем не воспроизводят ультразвук.
  4. Для начала можно не кодировать такой широкий диапазон частот. Вы не можете (и не должны) слышать ультразвуковые нелинейные искажения в слышимой полосе частот, если в ней нет ультразвуковой составляющей.

Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.

Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30 кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.

Тесты для измерения нелинейных искажений:

  • Звук 30 кГц + звук 33 кГц (24 бит / 96 кГц) [5-секундный WAV] [30-секундный FLAC]
  • Мелодии 26 кГц – 48 кГц (24 бит / 96 кГц) [10-секундный WAV]
  • Мелодии 26 кГц – 96 кГц (24 бит / 192 кГц) [10-секундный WAV]
  • Нарезка из песен, приведенных к 24 кГц (24 бит / 96 кГц WAV) [10-секундный WAV] (оригинальная версия нарезки) (16 бит / 44.1 кГц WAV)

Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц [6]. При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.

В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.

Недопонимание процесса дискретизации

Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.

Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).

Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.

По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.

Это только так выглядит. Эти убеждения неверны!

Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell, поэтому можете не верить мне на слово.

Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.

С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.

Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них [7].

Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.

На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).

Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.

Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.

ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.

16 бит против 24 бит

Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?

16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.

Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.

Примечания к Части 2

6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.

7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.

8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.

44100 или 48000 что лучше

Когда сигнал поступает на АЦП с предусилителя, компрессора, выхода пульта, синтезатора, — он представляет собой электромагнитные колебания. То есть на вход АЦП приходит некая волна с изменяющимся напряжением (очень маленьких величин). Для сохранения сигнала в файл его нужно «оцифровать», то есть закодировать с помощью единиц и нулей. В результате получается график волны на экране компьютера.

Даже самый лучший преобразователь имеет погрешность, ведь между нулем и единицей нет промежуточных значений, и график волны будет состоять только из вертикальных и горизонтальных отрезков, без наклонных линий. На графическую прорисовку волны будут влиять высота звука (частота колебаний), его тембр (форма волны) и громкость (амплитуда). Качественный АЦП должен корректно передать системе записи все эти параметры.

Итак, звук поступает в систему дискретно, то есть разделенным мелкие отрезки. От величины этих отрезков зависит точность кодирования аналогового сигнала в цифровой среде. Чем мельче горизонтальная и вертикальная дискретные единицы, тем точнее оцифровка.

Частота дискретизации

Горизонтальное дробление волны дает нам представление о частоте дискретизации, или частоте семплирования. Чем чаще АЦП фиксирует изменения значений графика волны, тем выше частота семплирования. Собственно, один семпл — это дискретный единичный отрезок, минимальная единица звука. Чем он короче, тем выше частота дискретизации.

К примеру, значение частоты дискретизации в 44.1 кГц показывает, что в одной секунде записи содержится 44100 семплов. Мы можем редактировать волну, принимая за минимальный элемент редактирования отрезок длительностью 1/44100 секунды. При увеличении частоты семплирования до 48 кГц этот отрезок уменьшается до 1/48000 доли секунды, давая возможность более точного воздействия.

Читать еще:  Ctrl w что делает

Согласование частот дискретизации

АКАДЕМИЯ МЮЗИКМЕЙКЕРА

Книга А. Данилова о создании музыки
  • Подготовка помещения
  • Подбор оборудования
  • Музыкальное производство
  • Современная гармония
  • Музыкальная форма
  • Развитие слуха

Каждый семпл по продолжительности равен предыдущему. Для корректного воспроизведения звука частоты дискретизации файла и системы должны быть идентичны. При добавлении в проект звуковой дорожки с частотой дискретизации, отличной от дискретизации хоста (программы), она должна быть сконвертирована.

Если воспроизводить файл более высокой частоты в системе с более низкой, он будет звучать медленнее, чем должен, и наоборот. Конвертирование сигнала из одной частоты в другую всегда приводит к появлению искажений. Чтобы «перекроить» звук под новую частоту дискретизации, система должна разбить семплы на более мелкие куски и снова собрать их в единую волну. Такой процесс может привести в лучшем случае просто к замыливанию звука, в худшем — к появлению щелчков.

Конечно, на встроенных колонках домашнего ноутбука разница будет незаметна. Но если речь идет о работе со звуком на профессиональном уровне, согласование частот дискретизации необходимо.

Не рекомендуется изменять частоту дискретизации в рамках одного проекта. Оправданием повышению дискретизации может быть, например, необходимость обработки файла алгоритмами или плагинами, лучше работающими на высоких частотах. Поскольку более высокая дискретность предполагает разбиение на более мелкие семплы, точность обработки будет выше, а качество в результате лучше. Но гарантировать эффективность этого метода тоже невозможно: в каждом случае результат будет индивидуальным. Необходимо каждый раз оценивать, что важнее — эффект от обработки на более высокой дискретности или негативное влияние конвертации.

Если по какой-то причине после завершения работы на частоте 48 кГц вам потребовалось конвертировать сигнал в 44.1 кГц, сохраните исходный файл на тот случай, если придется повторно вмешиваться в материал (например, для альтернативного мастеринга). Обработка на более высокой частоте дискретизации даст лучший эффект, чем на низкой.

Разрядность звука

Если горизонтальное дробление волны дает нам представление о частоте дискретизации, то вертикальная дискретизация – это разрядность, отвечающая за достоверную передачу динамических элементов записи. Чем большее количество «ступенек» может зафиксировать преобразователь, тем выше разрядность записанного звукового файла.

Например, волна за отрезок времени может совершить движение одной ступенькой от 0 до 16, а может четырьмя — по 4 единицы за шаг. Более точным представлением будет 16 шагов по единице. Количество ступенек, на которые волна дробится по вертикали, — это и есть разрядность.

Чем выше разрядность конвертора, тем достовернее он передаст сигналы разного уровня громкости. Если мы движемся большими шагами, каждый из которых равен 16 единицам (низкая разрядность), то при громкости входящей волны на уровне 4 график ее будет округлять до нуля. А если каждая ступенька разрядности равна 4 единицам (средняя разрядность), значение 4 будет зафиксировано на своем уровне, а значения 3 и 5 округлятся до 4. При единичном шаге все эти значения будут находиться на своих ступеньках — 3, 4, 5 (высокая разрядность).

Таким образом, более высокая разрядность АЦП дает возможность детальнее интерпретировать различные значения громкости звука и максимально приблизиться к форме реальной волны.

Разбиение волны на «ступеньки» по вертикали и горизонтали называется квантованием. Иногда частоту дискретизации называют частотой квантования, а разрядность динамическим квантованием, то есть разделением по уровням громкости (динамика).

Естественно, пример с 16 единицами — условность. Конверторы работают на гораздо более высоких значениях. Например, при разрядности 16 бит система может передать 65536 уровней громкости (2 в степени 16). А при 24 битах — 16777216 уровней (2 в степени 24).

Казалось бы, зачем столько? Неужели наше ухо способно различить хотя бы десять тысяч уровней громкости? Напрямую — не может. Скажем, два сигнала с «соседними» значениями даже при разрядности 16 бит мы различить не в состоянии. Но работа в студии ведется с разнообразными звуками, и некоторые из них имеют значительные перепады по громкости (к примеру, реверберация). Многие процессы требуют тонкой работы с громкостями (например, едва заметное воздействие эквалайзером на спектр). Для корректной работы нужна система с хорошей разрешающей способностью и по горизонтали, и по вертикали.

Но есть и обратная сторона медали. Высокие значения дискретизации и разрядности делают файлы более объемными, и для их обработки системе требуется больше ресурсов. Здесь самое время вспомнить про различия между ресурсонезависимыми и нативными системами. Чем выше квантование, тем сильнее загружается компьютер. Этот фактор более критичен для нативной системы, обремененной обслуживанием операционки и фоновых процессов.

Всегда нужно искать баланс между значениями дискретизации и разрядности и реальными возможностями системы. Не заставляйте ее работать на пределе, оставляйте резерв мощности.

Мы приближаемся к очень важной и мало кому понятной теме, связанной с музыкальным производством. Речь о так называемых шумах квантования. В ближайшее время этому явлению будет посвящен отдельный материал. Понимание природы шумов квантования дает возможность музыканту и звукорежиссеру разобраться в некоторых непростых вопросах, связанных с записью музыки в цифровой среде. Поскольку ввиду дороговизны и сложности в обслуживании аналогового оборудования подавляющее большинство музыкантов работает прежде всего именно в цифровых системах записи, эта тема так или иначе затрагивает всех.

Следите за обновлениями блога, подписывайтесь на новые статьи, чтобы совершенно бесплатно получать их на электронную почту. Также хочу напомнить, что очень много познавательной практической и теоретической информации содержится в моей книге «Академия Мюзикмейкера», которую без посредников можно приобрести на сайте MusicMaker.Pro.

Остались вопросы? Не стесняйтесь задавать их в комментариях под статьей или присоединяйтесь к обсуждениям в этой группе ВКонтакте, посвященной синтезаторам, музыкальному оборудованию и звукозаписи.

© Алексей Данилов Иллюстрации: А. Рублевский При перепечатывании ссылка на источник обязательна

Хотите получать новые статьи
прямо на почту?

Подпишитесь на обновления блога А. Данилова

Музыка в цифре, или чем отличается тёплый ламповый звук от скупого цифрового звука

Вероятно, среди читателей этой страницы нет ни одного, кто бы не слышал музыку восстановленную из оцифровки (MP3, WAV, WMA, MP4, AVI, AI). Скорее всего, многие читатели встречали, хотя бы на картинках, и аппаратуру Hi-END класса — высококачественные усилители, CD проигрыватели с заявкой на «высший класс».
Большинство, так или иначе сталкивалось и с такими фразами, как «тёплый ламповый звук» и «сухое цифровое звучание», некоторые скорее всего даже смеялись над фразой «при воспроизведении с этого CD флейта гуляет по сцене».

Сегодня я открою вам, господа заседатели глаза на суровую правду оцифрованного звука, вернее я просто покажу, что нет никакого качественного и тем более высококачественного звука в цифре и быть не может.
Вы воочию увидите, что не важно на какой частоте оцифровывать: 48000 или 44100, совершенно не важно 8, 12 или 16 бит.

Принцип оцифровки звука

При оцифровке звука электроника делает N выборок уровня сигнала в секунду и каждая выборка представляет M бит значения уровня напряжения на сигнальном входе в момент когда делается выборка.
Для 8 бит, это 256 уровней сигнала;
Для 12 бит, это 4095 уровней;
Для 16 бит это 65536 уровней напряжения входного сигнала.
То есть всё работает так — если система обладает частотой дискретизации 44100 и имеет дискретность 16 бит, то это значит она 44100 раз в секунду измеряет напряжение на входе по шкале из 65536 значений.
При воспроизведении весь процесс происходит в обратном порядке, система 44100 раз в секунду изменяет уровень напряжения на своём выходе устанавливая его в одно из 65536 возможных значений.
Для лучшего понимания, пара иллюстраций (красные точки отмечают где во времени мы запоминали значение напряжения на входе).
Так мы оцифровываем звук:

Так мы воспроизводим оцифрованный звук:

Очевидно, что чем больше число бит (больше градаций уровня), тем точнее мы сможем записать и воспроизвести звук, в частности на иллюстрациях видны погрешности воспроизведения, которые возникли из за того, что при записи было слишком мало градаций возможных значений и системе приходилось записывать ближайшие значения, а не точно те, которым напряжение соответствовало на входе.

Действительно важная информация применительно к качеству оцифрованного звука

Обычно очень мало внимания уделяется частоте дискретизации, а это чертовски важный параметр!
По теореме Котельникова, она же теорема Найквиста — Шеннона выходит, что для записи сигнала на частоте F минимум надо сделать F*2 выборок сигнала, вот только мало кто думает головой и продолжает мысль того же Котельникова, а если бы продолжили, то поняли, что утверждение F*2 справедливо для однобитной записи!

Проиллюстрирую это, в данном примере, предположим что частота сигнала аккурат равна Fдискретизации / 2, то есть если 44100 частота дискретизации то на рисунке сигнал частотой 22050Гц.
Вот здесь мы записывали:

А вот здесь воспроизводили:

Совершенно очевидно, что не особо важно, сколько по вертикали было уровней, сигнал испортило то, сколько выборок было по горизонтали!

Теперь продолжим мысль товарища Котельникова, господина Найквиста и господина Шеннона:
для записи сигнала на частоте F с числом градаций уровня M нужна частота дискретизации:
F * 2 * M
То есть для записи звука частотой 22050Гц с разрядностью 8 бит (256 уровней) нам потребуется частота дискретизации:
22050 * 2 * 256 = 11 289 600 Гц
А для записи полноценного 16-ти битного звука уже:
22050 * 2 * 65536 = 2 890 137 600 Гц
или 2.8 гигагерца!
Для сравнения — сигнал телепередачи 1 канала телевизора излучается в эфир на частоте 229 мегагерц, сотовые телефоны передают сигналы в эфир на частоте 1900 мегагерц или 1.9 гигагерца, а микроволновые печи разогревают еду сигналом частотой порядка 2458 мегагерца или 2.458 гигагерца.
Получается что для поистине качественной записи всего на 8 бит нам уже нужна частота дискретизации уже в области радиочастот, частот, на которых радиоволны передаются!

Скажу несколько слов об усилителях класса D, то есть о тех, которые сначала преобразуют сигнал в цифру, обычно в последовательность ШИМ (PWM) а затем обратно путём интеграции преобразуют ШИМ в звук.
Этим усилителям, для качественного воспроизведения потребуется генерировать ШИМ с длительностью импульсов 1/11289600 секунды, то есть средняя частота, которую создаёт их ШИМ генератор, в то время когда напряжение на его входе равно нулю, должна быть точно те самые 11 мегагерц или выше.

Любой человек знакомый с электроникой понимает, что на 2 гигагерца работать с цифрой сложно, не говоря уже про то, какой ценой и сложностью можно будет сгенерировать сигналы достаточной мощности на этой частоте (хотя бы 1 . 10 ватт).

Кстати, теперь, надеюсь вы понимаете, почему в начале я сказал, что совершенно не важно 44100 или 48000 частота дискретизации вашей звуковой карты, CD плеера или иного устройства, эта разница просто блекнет рядом с числом 2890137600.

Да и к слову, объёмы записи для таких систем были бы огромны, например если бы мы пожелали создать систему поистине качественной цифровой записи 16-ти битного звука, то на каждую секунду записи потребовалось бы расходовать 5.7 гигабайта места.

Наверно тебе, уважаемый читатель, интересно, как же мы спокойно слушаем записи на 44100 х 16 бит и слышим не хрипение и шипение, а вполне качественный звук?
Всё очень просто — наши уши не идеальный инструмент и мозг знает об этом, он выработал способы расшифровки сигналов, которые ему выдаёт ухо, вот нам и кажется что всё в порядке хотя даже звуки на частоте 5000 герц пройдя через оцифровку лучшего CD диска и проигрывателя превратились в ужасные искажения их оригинальной формы.

Любой желающий может взять любой звуковой редактор, записать звук, скажем синусоидальной формы частотой 5000гц, на тех же 44100х16бит и посмотреть, что каждое колебание представлено в горизонтальной оси (оси времени) всего лишь 9-ю точками, в то время как по вертикальной оси оно будет представлено одним из 65536 значений.

Где спрятан тёплый ламповый звук?

В начале текста я говорил о «тёплом ламповом звуке» и других призвуках усилителей, вернусь к этому и обращу внимание на то, что и без всякой оцифровки потребовались бы очень широкополосные усилители для воспроизведения оригинальной, истиной формы звука. По крайней мере, они должны были бы без малейших искажений усиливать частоты от 20 Гц до примерно 10 000 000 Гц.
Ещё нам бы потребовались и излучатели звука с таким же диапазоном и звукосниматели и микрофоны.
В связи с ужасающей сложностью создания таких систем, их нет и не будет никогда.

Так вот, все призвуки и окраски звука, спрятаны как раз там, где усилителю приходится сталкиваться с изменениями напряжения на входе, такими быстрыми, что если бы они происходили непрерывно, то их частота была бы гораздо выше 22050 Гц или 44100 Гц и даже 1 000 000 Гц.

Собственно так как у одних людей уши более качественный инструмент а у других менее качественный, у одних мозг выработал более простые алгоритмы коррекции не идеальности ушей а у других сложнее, одни могут услышать разницу между ламповым звуком воспроизводимым с грампластинки, другие не слышат этой разницы, считая что 48кГц при 24 битном звуке это уже высшее качество.

Лично я не слышу никакой разницы между двумя достаточно качественными усилителями одной ценовой группы, но благодаря арифметике, товарищу Котельникову, господам Найквисту, Шеннону и личному здравому смыслу я знаю — она, разница, есть.

Ссылка на основную публикацию
Adblock
detector