Компьютеры        27.11.2020   

Что значит поднять громкость по пикам. Нормализация звуковых файлов

Требования к телекомпаниям по нормализации громкости выдвигаются давно, а после принятия новых поправок к Федеральному закону "О рекламе" задача нормализации громкости стала особенно актуальна.

Поправки вводят требования к соотношению уровня громкости рекламы и среднего уровня громкости прерываемой рекламой теле- или радиопрограммы. Отклонение от требуемых норм грозит телекомпаниям ощутимыми штрафами.

К настоящему моменту реализованы два независимых программных способа нормализации громкости и добавлены средства контроля за соответствием уровня громкости нормативным требованиям.

Нормализация громкости в реальном времени

Специально разработанный программный плагин "APTO обработка звука" предназначен для автоматической нормализации выходного звукового сигнала "на лету" (в режиме реального времени, без предварительной обработки) во время трансляции. Ниже показа диалог настроек плагина "APTO обработка звука" .

Является дополнительной платной программной опцией.

Основные характеристики:

  • используются адаптивные алгоритмы APTO компании Linear Acoustic;
  • для соответствия новым требованиям закона есть специальный режим (EBU_R128);
  • минимальный набор настроек:
    • "целевой уровень" – требуемое значение выходного уровня громкости в LUFS;
    • "агрессивность" – скорость реакции на изменение уровня звука: чем выше значение, тем быстрее выполняется подстройка к целевому уровню (но и сильнее искажение звука);
    • "время анализа" – интервал времени непрерывного анализа статистики параметров звука.
  • различные типы сигнала: аналоговый (CVBS, YUV, Y/C, RGB), SDI, программы в транспортном потоке MPEG-TS.

Предварительная обработка звука в файлах

Используется программа SLAudioNormalizer из стандартного набора ПО. В настройках указывается набор папок, в которых нужно обрабатывать файлы и режим. Программа в автоматическом режиме производит анализ звуковой дорожки видеофайлов. Звук в самом файле не меняется, а формируется вспомогательный файл метаданных с информацией о требуемом изменении громкости звука. Ниже показан диалог настройки нормализации уровня громкости программы SLAudioNormalizer .

Основные возможности программы:

  • несколько режимов нормализации громкости, один из которых соответствует текущим нормативным требованиям;
  • запуск обработки файлов при старте операционной системы;
  • отслеживание появления необработанных файлов;
  • нормализация многоязыкового звукового сопровождения;
  • протоколирование работы программы;
  • обработка файлов во вложенных папках;
  • гибкие настройки режима обработки файлов.

Средства контроля уровня громкости

В стандартный набор ПО наших продуктов входит программа SLLoudnessMMeter – программный измеритель громкости в режиме EBU (ITU-R BS-1771 и EBU Tech3341).

Основные характеристики:

  • несколько индикаторов и временных шкал: "мгновенная", "кратковременная", "интегральная";
  • шкала отображения максимально допустимого уровня истинных пиков;
  • различные способы отображения индикаторов;
  • выбор способа показа шкалы;
  • выбор режима измерения интегральной громкости;
  • возможность ручного сброса статистики;
  • запись в файл протокола измерений.

Функции, реализованные в программах SLAudioNormalizer и SLLoudnessMMeter , встроены и в программу – редактор для просмотра видеофайлов и настройки параметров воспроизведения. Открыв видеофайл в этой программе, можно выполнить и все необходимые измерения громкости, и подбор регулирующего значения для звука из этого файла. Входит в стандартный набор ПО

Ниже показан блок измерения уровня громкости в соответствии с новыми требованиями закона в программе SLTrimEditor

Чтобы обеспечить соблюдение норм, предъявляемых контролирующими органами к громкости звука в телепередачах, нашим клиентам мы рекомендуем использовать все перечисленные инструменты для нормализации звука и контрольных измерений в комплексе:

  1. Задействовать на разных этапах телепроизводства программу SLLoudnessMMeter. Это позволит вещающей компании проводить контрольные измерения в полном соответствии с методикой измерения, предлагаемой ФАС РФ.
  2. По результататам измерений интегральной громкости видеофайлов, приводить громкость звука в файлах к требуемому уровню, используя программу SLAudioNormalizer .
  3. Включить постоянное выравнивание громкости телепередач на выходе сервера, используя средства плагина "APTO обработка звука" .

Нормализация только с помощью программы SLAudioNormalizer дает требуемый результат в случае относительно коротких и "равномерных по звуку" рекламных роликов. Если интегральная громкость каждого рекламного ролика равна целевому уровню, то и интегральная громкость всех роликов будет близка к этому уровню. А вот в случае передач или фильмов этого инструмента недостаточно, т. к. громкость разных фрагментов передачи, фильма может сильно различаться (то же и при выдаче в эфир местных передач, например, новостей, сразу после которых идет рекламный блок). И здесь требуется помощь плагина "APTO обработка звука" , который выполняет обработку звука в реальном времени, "на лету" реагируя на изменения уровня звука и учитывая накопленную статистику измерений.

Совместное использование предложенных способов нормализации приводит к качественному результату – автоматическое выравнивание громкости с наименьшими искажениями звука на протяжении всего времени трансляции и, самое главное, при врезке рекламных блоков в передачи и фильмы.

Совсем недавно я набрёл на замечательный ресурс независимого звукоинженера Des McKinney . Это просто кладезь полезных статей по современной звукозаписи и сведению! И вот одна из них (вольный перевод by ):

Процесс нормализации часто смущает новичков в цифровой звукозаписи. Откровенно говоря, “нормализация” имеет различные значения, что, естественно, сбивает с толку. Однако новички и специалисты могут быть сбиты с толку мифами и дезинформацией, которых достаточно на эту тему.
Я расскажу о 10 распространённых заблуждений и том, что же происходит на самом деле.

Пиковая Нормализация

Для начала, некоторые пояснения: Так как “нормализация”, может означать несколько вещей (см. ниже), мифы ниже прежде всего относятся к пиковой нормализации.

Пиковая нормализация - это автоматизированный процесс, который изменяет уровень каждого сэмпла в сигнале цифровой звукозаписи равным количеством, таким образом, что самый громкий сэмпл достигает указанного уровня. Обычно, процесс используется для того чтобы сигнал достигал максимума в 0dB - самого громкого уровня, допустимого в цифровом звуке.
Процесс нормализации похож на перемещение ручки громкости или фейдера: весь сигнал изменяется тем же самым «неподвижным» количеством, вверх или вниз. При нормализации, система находит самый громкий пик и по нему уже выстраивает общий уровень.

Некоторые из мифов ниже отражают не что иное, как недопонимание этого процесса, как бывает с распространенными заблуждениями, но тем не менее, некоторые из мифов происходят от более фундаментального недопонимания - в данном случае в звуке, микшировании и цифровой звукозаписи.

Мифы и дезинформация.

Миф #1: После нормализации нескольких треков, они звучат с одинаковой громкостью.

Нормализация нескольких треков к общему уровню гарантирована только при условии, что треки идентичны. Однако, наше восприятие громкости зависит от многих факторов, включая интенсивность звука, длительность и частоту. Пиковый уровень сигнала важен, но он не имеет прямого отношения к полной громкости трека.

Миф #2: Нормализация делает трек настолько громким, насколько это возможно.

Послушайте эти два mp3 файла, каждый нормализован к уровню -3dB:

Когда уровень трека настолько низок, что вы уже не можете использовать регуляторы гейна (Gain) и громкости, чтобы сделать трек достаточно громким. Это указывает на проблему с записью, в идеале вы можете переписать трек с необходимым уровнем… Но когда это не возможно, нормализация может спасти неудачный дубль.

Когда нужно установить пиковый уровень трека без изменения его воспринимаемой громкости. Например, работая с испытательным сигналом, белым шумом и другим немузыкальным контентом. Конечно же, вы можете установить пиковый уровень вручную – прослушивая трек и отмечая пики… но эту работу за вас может сделать функция нормализации.

Миф #9: Нормализация гарантирует, что трек не будет перегружен (clipping).

Одиночный трек, нормализованный к 0dB, не будет перегружаться. Однако, если трек будет обработан или фильтрован с повышением громкости (например, при эквализации) появятся искажения. И если трек - часть микса, который включает другие треки, нормализованные к 0dB, есть гарантия, что сумма всех треков превысит самый громкий пик любого из одиночных. Другими словами, нормализация защищает вас от перегрузки только в самом простом случае.

Миф #10: Нормализация требует дополнительную операцию дизеринга (dither).

Этот последний миф является слегка эзотерическим, но он изредка появляется в сетевых обсуждениях записи. Обычно, в форме заявления: “это хорошо нормализовать в 24 битах, но не в 16 битах, потому что …”, сопровождаемый объяснением, которое передает неправильное понимание цифровой звукозаписи.

Просто скажу: дизеринг применяется при изменении разрядности. (например, преобразование с 24 бит до 16 бит). Нормализация же, работает независимо от битовой глубины, изменяя только уровень каждого сэмпла. Поскольку, никакого изменения разрядности не происходит, дизеринг не требуется.

Другие Определения.

Нормализация может означать несколько других вещей. В контексте мастеринга альбома инженеры часто нормализуют треки альбома одному уровню. Это относится к воспринимаемой громкости и не имеет отношения к пиковому уровню каждого трека.

Некоторые системы (например SoundForge) предлагают «Нормализацию по RMS», действие которой основано на вычислении среднеквадратического уровня громкости. Это приблизительно соответствует воспринимаемой громкости и также не зависит от пикового уровня. Однако, как и с пиковой нормализацией, его применение также требует осмысленного подхода.

Компьютерная программа позволяет выравнивать громкость музыкальных MP3-файлов. Первая версия данной утилиты существует ещё с 2002 года. Программа хороша тем, что совершенно не требует перекодирования файлов — это позволяет сохранить изначальное качество звучания. MP3Gain выравнивает уровень громкости как отдельно взятого файла, так и целой группы файлов (пакетное преобразование).
Не будем сильно погружаться во все тонкости настроек и возможностей программы — просто научимся как просто без лишних заморочек нормализовать уровень громкости в mp3-файлах.
Находим и .

Все достоинства программы
Программа полностью бесплатна.
Инсталлируется на любую версию ОС Windows.
Можно использовать и работать в режиме командной строки и графической оболочки для Windows.
Возможность пакетного анализа и обработки файлов.
Нормализация происходит без перекодировки файлов.
Можно преобразовывать один и тот же mp3-файл множество раз без риска его испортить.
Существует режим применения нормализации только к выделенным в рабочем окне трекам.
Программа полностью сохраняет ID3 теги и даты создания файлов.
Многоязычный интерфейс, в том числе присутствует русская локализация.
Локализованное справочное руководство на официальном сайте.

Установка MP3Gain
Забираем программу с SourceForge в виде инсталлятора. Установка предельно проста, единственный важный момент — необходимо включить чекбокс «Language Files», при этом будут установлены все языковые локализации программы, в том числе и русский. Если выбрать «Custom» установку, то можно самостоятельно выбрать директорию парковки программы.

Настройка MP3Gain
После установки программы запускаем её и первым делом выбираем русскую локализацию MP3Gain. Далее открываем подопытные mp3-файлы. В настройках программы ищем очень важный пункт «Изменение уровня без клиппинга» и на нём ставим галку. Для краткости, «клиппинг» — это превышение уровня сигнала, при этом происходит обрезание уровня и перекодирование mp3-файлов, но нам это не нужно. И ещё следует разобрать вопрос по настройке уровня громкости. По умолчанию «Норма» громкости установлена 89 децибел (лучше эту цифру не менять). По мнению специалистов 89,0 dB дают наиболее качественные результаты в плане нормализации и устранения клиппинга. Остальные пункты настроек предельно понятны и выставляются по личным предпочтениям или просто сделать всё как показано на картинке. Таких настроек вполне достаточно для простой нормализации уровня громкости в mp3-файлах.

Совет! На всякий случай надо сделать копии аудио файлов. В MP3Gain нет функции сохранения обработанных файлов под другим именем, программа переписывает исходные.

Использование MP3Gain
Чтобы понять, что делать с двумя рабочими кнопками «Анализ» и «Тип» надо вкратце разобраться с их доступными режимами.
Рассмотрим режимы «Трек», «Альбом» и «Константа».
Трек - программа рассчитывает уровень громкости, индивидуально для каждого трека. Затем корректирует громкость каждого трека в соответствии с требуемым уровнем. Например, имеется три песни с уровнем громкости 87, 95 и 91 dB. При применении «Тип Трек» для приведения их к требуемому уровню 89 dB, на выходе у всех этих песен будет уровень около 89 dB.
Альбом - общая громкость альбома будет отрегулирована в соответствии с требуемым уровнем, но разница в громкости между треками в альбоме будет сохранена. Например, имеется три песни с уровнем громкости 87, 91 и 89 dB, общая громкость этого альбома будет около 89 dB. При применении «Тип Альбом» для приведения их к требуемому уровню 92 dB, программа увеличит громкость каждой из этих песен на 3 dB.
Константа - этот режим похож на режим Альбом. При нём громкость всех треков просто увеличивается или уменьшается на заданное количество децибел без какой-либо нормализации относительно друг друга.

Итак, проведём эксперимент над открытыми ранее mp3-файлами на режиме «Трек». Первым делом запускаем анализ файлов кнопкой «Анализ Трек». Смотрим результат анализа исходных файлов. На картинке ниже видно, что в файлах «3.mp3» и «5.mp3» есть превышение уровня громкости, иначе говоря присутствует «клиппинг», в этих колонках появилась буква «Y» и все строки стали красными. Напротив, в файле «6.mp3» видно что он имеет пониженный уровень громкости.
И вот далее, по итогу проведённого анализа, вторым действием исправляем (нормализуем) эту разницу уровней нажатием на кнопку «Тип Трек». После благополучной нормализации, занявшей некоторое время (всё зависит от мощности компьютера), смотрим получившийся результат. На последней картинке видно, что уровень всех обработанных mp3-файлов очень близок к заданному значению в 89 dB. Т.е. треки «3.mp3» и «5.mp3» понизили свой уровень громкости, а трек «6.mp3» наоборот увеличил. Что и требовалось сделать!

Нормализация аудиосигналов по пикам приводила к значительным различиям в громкости между каналами вещания;

Показания стандартизованного в европейских странах документом EBU Tech Doc 3205-E и обычно использующегося измерителя квазипиковых значений уровня QPPM не отражает громкость сигнала, т.к. это прибор изначально не предназначался для регистрации среднего значения сигнала;

При быстром росте цифрового производства фонограмм и цифровой дистрибуции аудиоконтента нормирование разрешённого максимального уровня аудиосигнала, определённое документом ITU-R BS. 645, не соответствует современным требованиям и изжило себя;

Документом ITU-R BS. 1770 определён международный стандарт измерения громкости аудиопрограмм, вводящий новый параметр аудиосигнала – единицу громкости.

В соответствии с вышеизложенным, Европейский вещательный союз рекомендует при измерениях аудиосигнала пользоваться новой единицей уровня LU (Loudness Unit) и LUFS (единицей громкости относительно полной шкалы). (Наименование “LUFS”, соответствует международной конвенции по терминологии и эквивалентно наименованию LKFS, которое используется ITU-R BS.1770-2).
Рекомендуется для полной характеристики передачи производить измерения по трём основным параметрам:

- Громкости программы (Program Loudness);
- Диапазону громкости (Loudness Range);
- Максимальному мгновенному уровню (Maximum True Peak Level).

Основные правила измерений этих параметров сводятся к следующим пунктам:

За номинальное значение громкости программы документом EBU R 128 рекомендуется принимать уровень равный -23 LUFS, а в случаях, когда точное поддержание номинального уровня недостижимо (например, при живой трансляции), допустимое отклонение от номинального уровня не должно превышать ± 1,0 LU.

Аудиосигнал передачи должен быть, как правило, измерен как единое целое без выделения отдельных специфических фрагментов, таких, как речь, музыка или звуковые эффекты.

Максимально допустимый мгновенный уровень передачи должен быть равен -1 dBTP (децибелы истинного пика).

Все измерения должны производиться измерителями, специфицированными соответствующими документами: ITU-R BS.1770, EBU Tech Doc 3341 и EBU Tech Doc 3342.

*EBU - European Broadcasting Union (Европейский вещательный союз)

Для справки, членами EBU (EBC) в России являются только "Первый канал", "ВГТРК", "Радио Маяк", "Орфей", "Голос России". Какими стандартами пользуются остальные вещательные компании остается только гадать.

Во вложении архив с документами EBU на русском языке, а именно:

EBU Tech 3341 ;
EBU Tech 3342 ;
EBU Tech 3343 ;
EBU Tech 3344 ;
Эссе_625в2 - эссе Анатолия Соколина: "Революция, которая потрясла мир аудио";
R68_2000_EBU - техническая рекомендация EBU R68-2000. Установочный уровень в оборудовании производства цифрового аудио и цифровых аудиорекордерах;
EBU R1771 - требования к приборам, измеряющим громкость и истинный пиковый уровень;
EBU R1770-1 - рекомендация МСЭ-R BS.1770-1. Алгоритмы измерения громкости звуковых программ и истинного пикового уровня звукового сигнала;

Здесь всегда можно получить актуальные оригиналы документов.

Нормализация звука в Sound Forge Pro 10

Поднять уровень звукового сигнала без риска потерять качество, позволяет функция «Normalize» . Алгоритм её работы заключается в следующем: программа вычитает уровень самого высокого сигнала из уровня максимально возможного сигнала, поднимая общий уровень громкости файла на получившуюся разность. Чтобы воспользоваться функцией «Normalize» откроем одноименное диалоговое окно, находящееся в пункте меню «Process». Основным параметром является «Normalize to» , указывающий максимально возможный уровень сигнала, который будет учитываться при нормализации звука в Sound Forge .

Существует возможность нормализировать сигналы нескольких файлов, что бывает полезно при записи компакт диска. Для этого, нажав кнопку «Scan levels» , просканируем аудио файл, на громкость которого будут ровняться остальные. Затем откроем следующий аудио файл и в диалоговом окне «Normalize» поставим флажок около переключателя «Use current scan level (do not scan selection)» . Нажимаем кнопку «OK» в диалоговом окне «Normalize to» . Программа произведет нормализацию громкости в аудио файле.

Функция «Normalize» также может выполнять более сложную обработку, вычисляя среднюю «воспринимаемую громкость» . Иногда возникает ситуация когда какой-либо звук в аудио файле, находясь на одном уровне громкости с остальными, звучит громче. Причина этому – свойства человеческого слуха. Sound Forge имеет возможность измерить данные файла с точки зрения человеческого восприятия. Для этого в диалоговом окне «Normalize to» нужно активировать переключатель . При этом будут доступны еще несколько параметров: «Ignore below» - значение этого параметра определяет порог допустимого уровня звука. Все значения ниже указанного порога, при сканировании «средней воспринимаемой громкости», будут проигнорированы. В большинстве случаев значение данного параметра приблизительно «-45 Db».

Параметр «Attack time» указывает программе, насколько быстро следует открывать цифровой шлюз сигнала, чтобы учесть допустимые уровни звука при сканировании данных. Поэтому если в аудио файле содержаться часто сменяющие друг друга звуки, например барабанные палочки, следует установить данное значение как можно ниже, в противном случае частые звуки учитываться не будут. В большинстве случаев значение равное 200 миллисекундам вполне справляется с постановленной задачей.

Параметр «Release time» указывает программе, насколько быстро следует закрывать цифровой шлюз. Если при сканировании данных нужно чтобы было учтено как можно больше материала, следует установить более высокое значение этого параметра.

Вследствие некоторой ограниченности человеческого слуха, очень высокие и очень низкие частоты услышать труднее, чем средние. Это положение можно исправить, установив флажок «Use equal loudness contour». Данная функция усиливает неслышимые спектры в частотах, поэтому в большинстве случаев её целесообразно установить.

После установки всех характеристик нажимаем кнопку «Scan levels» , чтобы запустить процесс сканирования «воспринимаемой громкости» .

При работе с функцией «Average RMS level (loudness)» , следует быть осторожными, настраивая параметр «Normalize to», так как выбор очень высокого значения может привести к деформации звука или отсечению данных. Если не превышать значение «-6 Db», искажения исключаются.

Для лучшей защиты от отсечения данных можно выбрать пункт «Apply dynamic compression» , находящийся в закладке «if clipping occurs» .

Нажимаем кнопку «OK». Программа нормализует громкость аудиоданных, учитывая значения текущих параметров.

(0)
Знакомство с программой Sound Forge Pro 10
1. Интерфейс 3:13 4 25906
2. Навигация в Sound Forge Pro 10 2:00 0 8937
3. Маркеры 1:50 0 6369
4. Области 4:23 0 5093
5. Поиск 4:01 0 4476
Основы редактирования в Sound Forge Pro 10
6. Инструмент «Magnify» 1:21 0 7006
7. Выделение 1:41 0 4729
8. Функции копирования и вставки. Часть 1. 3:20 0 7352
9. Функции копирования и вставки. Часть 2. 3:20 2 44121
10. Отмена действий 2:45 0 2863
11. Инструмент «Карандаш» 3:16 0 5686
Функции обработки
12. Смещение по оси амплитуды 2:16 0 5631
13. Изменение разрядности 2:17 0 4908
14. Изменение частоты сэмплирования 9:33 0 5605
15. Удаление фрагментов тишины 4:41 0 4850
16. Вставка тишины 1:05 0 3643
17. Изменение громкости звука. Часть 1. 1:09 0 8053
18. Изменение громкости звука. Часть 2. 1:09 0 9455
19. Нормализация звука 2:37 0 27550
20. Изменение каналов 4:31 0 4636
21. Панорамирование 3:26 0 3538
22. Эквализация, часть 1. 2:12 0 5807
23. Эквализация, часть 2. 2:12 0 5087
24. Эквализация, часть 3. 2:12 3 3056
25. Воспроизведение в обратном направлении 3:20 0 4656
26. Изменение скорости 1:57 0 18614
Эффекты в программе Sound Forge Pro 10
27. Эффекты эха 2:21 0 5897
28. Multi-Tap Delay 3:51 0 3021
29. Хорус (Chorus) 2:09 0 3275
30. Флэнжер (Flange) 2:25 0 2491
31. Pitch bend 2:42 0 3149
32. Pitch Shift 3:08 0 12197
33. Vibrato 2:47 0 2171