Как использовать спектрограмму и анализировать звук в Audacity

Спектрограмма представляет визуальное отображение частотного состава аудиосигнала во времени, где вертикальная ось показывает частоты, горизонтальная – временную шкалу, а интенсивность цвета отражает громкость на конкретной частоте. Такое представление звука позволяет обнаружить проблемы, которые сложно услышать при обычном воспроизведении – скрытые шумы, частотные срезы, артефакты сжатия и другие дефекты записи.

Профессиональные звукорежиссеры используют спектрограммы для точной диагностики аудиоматериала, определения качества файлов и поиска оптимальных настроек для последующей обработки эквалайзером или другими эффектами.

Включение режима спектрограммы

Audacity по умолчанию отображает аудиодорожки в виде волновой формы, где видна только амплитуда сигнала во времени. Переключение на спектрограмму открывает доступ к детальному анализу частотного содержания записи, при этом сохраняется возможность редактирования и применения эффектов к выбранным участкам. Режим спектрограммы работает с любыми аудиофайлами независимо от формата и качества исходного материала.

Кликните по названию трека в левой части окна программы или по трем точкам рядом с ним для вызова контекстного меню.
В открывшемся списке найдите пункт «Спектрограмма» и выберите его – дорожка мгновенно переключится на новый режим отображения.
Вертикальная шкала слева от трека теперь показывает частоты в герцах, а цветовая палитра отображает распределение энергии сигнала по частотному спектру.

Переключение между режимами не влияет на сам аудиофайл и выполняется мгновенно, позволяя быстро сравнивать волновую форму и спектральное представление одного и того же материала.

Для одновременного просмотра волновой формы и спектрограммы выберите в том же меню пункт «Мульти-вид», который разделит трек на две части с разными режимами отображения.

Комбинированный вид отображения при использовании спектрограммы в Audacity

Опция «Волноформа» вернет трек к стандартному виду амплитудной диаграммы, а «Логарифмическая» использует логарифмическую шкалу частот вместо линейной для более удобного анализа низких частот.

Переключение к стандартному виду при использовании спектрограммы в Audacity

Большинство задач анализа звука решается через стандартный режим спектрограммы, который обеспечивает оптимальный баланс между детализацией и скоростью работы программы.

Настройка параметров спектрограммы

Правильная конфигурация параметров спектрограммы критически важна для получения читаемого и информативного изображения частотного спектра. Настройки влияют на детализацию отображения, цветовую палитру и диапазон видимых частот, поэтому требуют индивидуального подбора в зависимости от типа анализируемого материала и конкретной задачи. Audacity предлагает два способа доступа к настройкам – через контекстное меню трека и через глобальные параметры программы.

Снова кликните правой кнопкой мыши по трем точкам возле трека для вызова быстрого меню настроек. В открывшемся окне «Настройки спектрограммы» доступны основные параметры отображения, которые применяются только к текущему треку без влияния на другие дорожки проекта.

Переход в настройки через контекстное меню при использовании спектрограммы в Audacity

Установите галочку «Использовать настройки» в верхней части окна для активации пользовательских параметров вместо значений по умолчанию из глобальных настроек программы.

Включение пользовательских настроек при использовании спектрограммы в Audacity

Шкала определяет способ отображения частот по вертикальной оси:

Mel – мел-шкала учитывает особенности восприятия звука человеческим ухом, где низкие частоты различаются лучше высоких, что делает этот режим удобным для анализа речи и вокала.
Линейная – равномерное распределение частот по высоте спектрограммы, где каждый герц занимает одинаковое пространство, подходит для технического анализа и точных измерений.
Логарифмическая – сжимает высокие частоты и растягивает низкие, обеспечивая более сбалансированное отображение всего спектра для музыкального материала.
Bark – барк-шкала основана на критических полосах слуха и часто используется в психоакустических исследованиях.
ERB – эквивалентная прямоугольная полоса пропускания, еще один вариант перцептивной шкалы для специализированного анализа.
Период – отображает период колебаний вместо частоты, применяется в специфических задачах анализа периодических сигналов.

Выбор типа шкалы при использовании спектрограммы в Audacity

Параметры «Минимальная частота (Гц)» и «Максимальная частота (Гц)» задают диапазон отображаемых частот на спектрограмме. Для анализа голосовых записей достаточно диапазона от 80 до 8000 Гц, поскольку основная энергия речи сосредоточена именно в этих пределах, а ограничение видимого спектра увеличивает детализацию важной области.

Дополнительные настройки шкалы при использовании спектрограммы в Audacity

Музыкальные записи требуют полного диапазона от 20 до 20000 Гц для оценки качества и выявления частотных срезов, характерных для сжатых форматов. Значение 0 в поле минимальной частоты заставляет программу автоматически определять нижнюю границу на основе частоты дискретизации файла.

Цвета в правой части окна настроек управляют внешним видом спектрограммы:

Усиление (дБ) регулирует яркость отображения – увеличение значения делает тихие компоненты сигнала более заметными, но может привести к засветке ярких участков, оптимальное значение находится в диапазоне 15-25 дБ.
Диапазон (дБ) определяет динамический диапазон цветовой палитры от самых тихих до самых громких компонентов, значение 80 дБ обеспечивает хороший баланс между детализацией и читаемостью.
Подъем ВЧ (дБ/дек) применяет предыскажение высоких частот для компенсации их естественного спада в большинстве аудиоматериалов, значение 0 отключает эту функцию.
Схема предлагает выбор цветовой палитры, где «Цвет (розовый)» использует градиент от синего через зеленый к красному, а другие варианты меняют визуальное представление без влияния на точность анализа.

Настройка цветов при использовании спектрограммы в Audacity

FFT-фильтр содержит технические параметры частотного анализа:

Алгоритм выбирает метод вычисления спектра, где «Частоты» обеспечивает стандартный анализ, а другие варианты применяются для специализированных задач.
Размер окна определяет количество сэмплов, анализируемых за один проход алгоритма быстрого преобразования Фурье – большие значения (4096-8192) дают лучшее частотное разрешение но хуже различают быстрые изменения во времени, маленькие (512-1024) точнее отображают временную структуру но теряют детализацию частот.
Тип окна задает оконную функцию для сглаживания краев анализируемого фрагмента, где «Ханна» представляет универсальный выбор для большинства задач, обеспечивая хороший компромисс между частотным и временным разрешением.
Коэфф. заполнения нулями увеличивает визуальную гладкость спектрограммы путем интерполяции данных, значение 2 удваивает количество отображаемых точек без реального улучшения разрешения.

Параметры FFT-фильтра при использовании спектрограммы в Audacity

Опция «Включить выбор спектра» в нижней части окна активирует возможность выделения определенных частотных диапазонов для последующей обработки или удаления. После применения настроек нажмите «ОК» для закрытия окна и обновления отображения спектрограммы согласно выбранным параметрам.

Активация выбора спектра при использовании спектрограммы в Audacity

Для изменения глобальных настроек, которые будут применяться ко всем новым трекам, откройте меню «Правка» – «Настройки» и перейдите в раздел «Треки» – «Спектрограммы».

Переход в нужный раздел настроек при использовании спектрограммы в Audacity

Параметры в этом окне идентичны настройкам отдельного трека, но служат шаблоном по умолчанию для всех последующих спектрограмм в текущей и будущих сессиях работы. Изменение глобальных настроек не влияет на уже открытые треки, для которых применены индивидуальные параметры.

Чтение и интерпретация спектрограммы

Спектрограмма кодирует информацию через три измерения: горизонтальная ось – время, вертикальная – частоты, цвет – интенсивность звука. Яркие насыщенные цвета (красный, желтый, белый) указывают на высокую энергию сигнала, темные холодные оттенки (синий, фиолетовый, черный) – на тихие или отсутствующие компоненты.

Просмотр и интерпретация показателей при использовании спектрограммы в Audacity

Характерные признаки разных типов звука:

Голос – полосовая структура в диапазоне 100-8000 Гц, основной тон в области 100-400 Гц, горизонтальные линии формантных частот, вертикальные импульсы согласных в высокочастотной области.
Музыка – басы до 250 Гц, средние частоты 250-4000 Гц с основной энергией, высокие выше 4000 Гц передают блеск, ударные создают широкополосные вспышки по всему спектру.
Низкочастотный гул – яркие горизонтальные линии в области 50-120 Гц с равномерно распределенными гармониками.
Высокочастотное шипение – равномерная текстура в верхней части спектра выше 8000 Гц без выраженных пиков.
MP3-файлы – резкий частотный срез на определенной высоте: 128 kbps около 16000 Гц, 256 kbps около 20000 Гц, 320 kbps на 20500 Гц.
Lossless-форматы – полный частотный диапазон до границы Найквиста со слабым высокочастотным шумом до максимальной частоты.
Клиппинг – характерные вертикальные линии, пронизывающие весь частотный диапазон в моменты перегрузки.

Использование инструмента «График спектра»

Встроенный анализатор спектра предоставляет численные данные о частотном составе выбранного фрагмента аудиозаписи в виде графика распределения энергии по частотам. В отличие от спектрограммы, которая показывает изменение спектра во времени, график спектра отображает усредненную картину для конкретного участка, что делает его незаменимым для точных измерений и сравнения различных записей. Инструмент позволяет определить доминирующие частоты, оценить частотный баланс и найти проблемные резонансы для последующей коррекции эквалайзером.

Выделите нужный фрагмент записи, который требуется проанализировать – для оценки общего частотного баланса выбирайте участок длительностью 3-5 секунд с типичным содержанием.
Откройте меню «Анализ» в верхней панели программы и выберите пункт «График спектра» для запуска анализатора.
В открывшемся окне отображается график, где горизонтальная ось представляет частоты от минимальной до максимальной в логарифмическом масштабе, а вертикальная показывает уровень сигнала в децибелах относительно максимального значения.

График представляет собой линию, соединяющую точки измерений на разных частотах, где высокие пики указывают на частоты с большой энергией, а провалы – на слабо представленные области спектра. При наведении курсора на любую точку графика в нижней части окна отображаются точные значения частоты в герцах и уровня в децибелах, что позволяет определить проблемные частоты для последующей обработки.

Выбор нужной точки в частотном анализе при использовании спектрограммы в Audacity

Дополнительно программа показывает ближайшую музыкальную ноту для каждого пика, что помогает при анализе музыкального материала и настройке инструментов.

Выпадающий список «Алгоритм» в верхней части окна предлагает выбор метода анализа спектра. Вариант «Спектр» использует классическое быстрое преобразование Фурье и подходит для большинства задач общего анализа, обеспечивая точное отображение распределения энергии по частотам.

Переключение алгоритма при использовании спектрограммы в Audacity

Опция «Стандартная автокоррекция» применяет автокорреляционный анализ для выявления периодических компонентов сигнала, что полезно при определении основной частоты тональных звуков. Параметр «Кепстр» вычисляет кепстр сигнала – специальное преобразование для анализа спектральной огибающей и выявления формантной структуры речи.

Настройка «Функция» определяет тип оконной функции, применяемой к анализируемому фрагменту для снижения краевых эффектов. Окно Ханна (Hann) обеспечивает хороший баланс между частотным разрешением и подавлением боковых лепестков, что делает его универсальным выбором для анализа музыки и речи. Окно Хэмминга (Hamming) дает немного лучшее подавление боковых лепестков за счет небольшого снижения частотного разрешения, а прямоугольное окно (Rectangular) обеспечивает максимальное частотное разрешение но создает значительные искажения спектра.

Выбор функции при использовании спектрограммы в Audacity

Параметр «Размер» задает размер окна анализа в сэмплах, влияя на компромисс между частотным разрешением и временным усреднением. Значение 2048 обеспечивает достаточное разрешение для анализа речи и большинства музыкальных задач при умеренной вычислительной нагрузке.

Редактирование параметра Размер при использовании спектрограммы в Audacity

Увеличение размера до 8192 или 16384 улучшает различение близко расположенных частотных компонентов, что критично для анализа басовых инструментов и выявления гармонических структур. Меньшие значения 512-1024 ускоряют вычисления для быстрой оценки спектра, но снижают точность определения низких частот.

Кнопка «Экспорт» позволяет сохранить числовые данные спектра в текстовый файл для дальнейшего анализа в других программах или построения собственных графиков. Экспортированный файл содержит две колонки – частоту в герцах и соответствующий уровень в децибелах для каждой точки измерения.

Практический анализ для последующей обработки

Анализ частотного содержания помогает определить, какие эффекты применить и на каких частотах работать. Систематический подход экономит время и предотвращает ухудшение качества от неправильных настроек. Можно выделить ряд основных проблем и методы их быстрого решения.

Низкочастотный гул (50-120 Гц):

На спектрограмме: яркие горизонтальные полосы в нижней части.
На графике спектра: резкие пики на проблемных частотах.
Устранение: графический эквалайзер с понижением на 6-12 дБ или эффект «Notch Filter».

Устранение проблем через графический эквалайзер при использовании спектрограммы в Audacity

Высокочастотное шипение (выше 8000 Гц):

На спектрограмме: равномерный цветной фон в верхней части.
На графике спектра: общий подъем уровня без выраженных пиков.
Устранение: эквалайзер с плавным спадом высоких частот на 3-6 дБ или эффект «Подавление шума».

Устранение проблем через подавление шума при использовании спектрограммы в Audacity

Неравномерность частотного баланса:

Избыток басов: подъем графика ниже 200 Гц.
Недостаток высоких: преждевременный спад выше 4000 Гц.
Резонансные пики: локальные всплески на 500-2000 Гц.
Коррекция: параметрический или графический эквалайзер с изменением на 2-4 дБ.

Второй тип эквалайзера для исправления проблем при использовании спектрограммы в Audacity

Проблемы динамического диапазона:

Чрезмерная компрессия: равномерно яркие цвета по всей длине без чередования.
Недостаточная громкость: преобладание темных цветов с редкими всплесками.
Обработка: нормализация с последующей умеренной компрессией.

Применение нормализации при использовании спектрограммы в Audacity

Выбор параметров шумоподавления зависит от характера шума. Постоянный широкополосный шум требует умеренных настроек 6-12 дБ, локализованный шум на определенных частотах лучше убирать точечно через эквалайзер.

Работа со спектральным выделением

Спектральное выделение позволяет изолировать и редактировать определенные частотные диапазоны в конкретные моменты времени. В отличие от обычного выделения, которое охватывает все частоты, спектральное ограничивает область обработки по обеим осям – времени и частоте.

Активируйте функцию через настройки спектрограммы, установив галочку «Включить выбор спектра». Кликните левой кнопкой мыши в начальной точке нужной области и протяните курсор к конечной точке по диагонали – программа обозначит выделение белой рамкой. Границы можно корректировать, перетаскивая края рамки.

Выделение конкретной области при использовании спектрограммы в Audacity

Типичные применения:

Удаление узкополосных шумов – выделите проблемную область (свист, скрип) и примените «Подавление шума» с настройками 18-24 дБ или «Генерировать тишину» для полного удаления.
Устранение резонансов – выделите горизонтальную полосу на проблемной частоте по всей длине и примените легкое ослабление.
Тональная коррекция участков – создайте выделение широкого частотного диапазона на определенном временном отрезке для локальной обработки эквалайзером.
Множественные выделения – удерживайте Ctrl при создании нового выделения для одновременной обработки нескольких несвязанных участков.

Сохранение результатов анализа

Документирование результатов анализа помогает отслеживать изменения качества звука и создавать базу знаний о характерных проблемах.

Методы сохранения:

Скриншоты спектрограммы – нажмите Print Screen для захвата экрана или Alt + Print Screen для снимка окна программы, затем сохраните изображение в графическом редакторе.
Экспорт данных спектра – в окне «График спектра» нажмите «Экспорт» для сохранения числовых значений частот и уровней в текстовый файл.
Шаблон анализа – создайте документ с полями для частотного диапазона, наличия среза, характера шума, обнаруженных резонансов и общей оценки баланса.

Экспорт результатов при использовании спектрограммы в Audacity

Сравнивайте спектрограммы исходного и обработанного файлов, открыв их на разных дорожках с идентичными настройками отображения. Успешная обработка должна показать уменьшение фонового шума без снижения интенсивности полезного сигнала.

Типичные ошибки интерпретации

Неправильное понимание информации на спектрограмме приводит к ошибочным выводам о качестве записи. Начинающие пользователи часто путают естественные характеристики звука с дефектами.

Распространенные заблуждения:

Темные области – не всегда проблема. Мужской голос естественно не содержит энергии ниже 80 Гц и выше 8000 Гц – это норма, а не дефект. Попытка «заполнить» эти области через эквалайзер добавит только шум и искусственность.
Высокочастотный шум выше 15000 Гц. Большинство взрослых не слышит частоты выше 16000 Гц. Агрессивная фильтрация может устранить визуальный «мусор», но одновременно смягчить звучание из-за фазовых искажений фильтра.
Частотный срез MP3. Правильно закодированный MP3 320 kbps может звучать неотличимо от lossless несмотря на срез на 20500 Гц. Проблема – несоответствие заявленного и реального качества, а не сам факт сжатия.
Яркость не равна качеству. Перегруженная запись с клиппингом демонстрирует очень яркую спектрограмму, но звучит хуже правильно записанного материала с умеренными уровнями. Динамичная музыка с чередованием ярких и темных участков отражает естественные перепады громкости.

Оценивайте спектрограмму в контексте типа материала, сравнивая с эталонными примерами и проверяя визуальные наблюдения через прослушивание.

Заключение

Спектрограмма превращает Audacity в инструмент профессиональной диагностики звука, позволяя обнаруживать скрытые дефекты и принимать обоснованные решения о необходимой обработке. Начинайте с простых задач – определения частотных срезов, поиска гула, оценки баланса через график спектра, постепенно переходя к выявлению апконвертов и работе со спектральным выделением. Комбинируйте визуальный анализ с критическим прослушиванием, используя спектрограмму как инструмент подтверждения проблем, а не единственный критерий оценки качества.

Читайте также в Комьюнити: