Вокодер был изобретён в 1920-х годах для нужд коммуникации и связи. Однако своё предназначение вокодер нашёл в электронной музыке, где стал инструментом для создания роботизированных голосов. Спустя почти сто лет после своего появления вокодер активно используется в музыкальной индустрии, но далеко не все знают, как появился этот инструмент и как он обрабатывает голос. Из этого текста вы узнаете, как Вторая Мировая война популяризовала синтезаторы речи, как работает вокодер и как им пользоваться.
Разработка вокодера началась в 1928 году силами инженера Гомера Дадли, работавшего на Bell Labs. Итоговый результат был готов к середине 1930-х, в ноябре 1937 года Дадли получил первый патент на изобретение, а в 1939 году — второй. Идея Дадли заключалась в том, чтобы воспроизвести речевой и голосовой аппарат человека посредством электроники. С помощью электронных компонентов и эффектов инженер стремился максимально точно сымитировать работу речевого тракта — то, как звук издаётся благодаря прохождению воздуха через лёгкие и другие органы внутри человеческого тела.
В 1939 году Bell Labs продемонстрировала общественности устройство для синтеза речи VODER (Voice Operating Demonstrator), проведя серию показов в Нью-Йорке и Сан-Франциско. Внутри устройства располагалась пара переключаемых осцилляторов и шумогенератор в роли источника звукового сигнала. Специальный вокальный тракт, состоявший из десятиполосных фильтров, был соединён с чувствительной к силе нажатия клавиатурой, которая управляла интенсивностью фильтрации. Изменение высоты звука производилось посредством ножной педали. Дополнительные специальные клавиши отвечали за генерацию букв «P», «D», «J», а также комбинаций звуков «JAW», «CH».
VODER был очень сложен в использовании — без специальной подготовки и обучения, которое длилось несколько месяцев, сгенерировать узнаваемую речь было непосильной задачей. Для проведения ежедневных демонстраций Bell Labs специально обучили 20 человек, которые посменно показывали всем желающим новинку. Во время показа VODER произносил фразу «Good afternoon, radio audience!».
В 1949 году появился голосовой преобразователь KO-6, который кодировал речь и информацию со скоростью 1200 бит в секунду. В 1953 году появился ещё один вокодер — KY-9 THESEUS, который не только увеличил скорость обработки до 1650 бит в секунду, но и использовал другие компоненты. За счёт изменившихся материалов вес вокодера удалось снизить с 55 тонн у SIGSALY до 256 килограмм у KY-9. Наконец, в 1961 году вместе с выходом преобразователя HY-2 удалось снизить вес вокодера до 45 килограмм, а также увеличить скорость кодирования до 2400 бит в секунду. HY-2 стал последним промышленным вокодером, использовавшимся в защищённых системах связи — инструмент остался только на потребительском рынке.
В 1948 году немецкий учёный Вернер Майер-Эпплер, проявлявший особый интерес к синтезу голоса, опубликовал диссертацию на тему синтеза речи и электронной музыки с точки зрения синтеза звука. Позднее его знания сыграли важную роль в создании Студии электронной музыки Радио Западной Германии (англ. Studio for Electronic Music WDR) в Кёльне в 1951 году.
Первое использование вокодера для создания музыки состоялось в 1959 году всё в той же Германии. В период с 1956 по 1959 годы компания Siemens разработала синтезатор Siemens Synthesizer, который мог преобразовывать звук в речь. В 1968 году Роберт Муг, основатель известной компании Moog, разработал один из первых вокодеров, созданных специально для применения в музыкальной индустрии. Вокодер был сделан по заказу Университета Баффало.
После этого история закрутилась сама по себе, а вокодер прочно вошёл во все сферы аудио и видео. Для широкого круга слушателей инструмент стал известен благодаря Kraftwerk, который собрали вокодер для своих экспериментов самостоятельно, и использовали его с момента своего основания в 1970 году. Самым же известным и популярным примером применения вокодера стал альбом Kraftwerk «Trans-Europe Express», подробнее о котором мы рассказывали в обзоре необычных музыкальных инструментов немецких электронщиков.
Как работает вокодер
Лучше одного сигнала — два сигнала. Для работы вокодеру нужны два источника звука:
- Оператор — исходный звуковой сигнал.
- Модулятор — сигнал с иными гармоническими характеристиками, которые формируют звук оператора.
Звук проходит через специальный «банк фильтров», который анализирует сигнал модулятора, разделяет его на частотные диапазоны и применяет фильтр к каждой полосе. Сами фильтры всегда работают так, что точка среза устанавливается строго по центру каждого диапазона в сигнале модулятора. Вне зависимости от плотности нарезки, внутри каждого диапазона сигнал фильтруется в центре.
Затем на модулятор подаётся сигнал-оператор, который проходит через все фильтры. В зависимости от гармоник и обертонов в сигнале-модуляторе, вокодер повышает или понижает точку среза каждого фильтра.
Если отбросить всю техническую заумь и перейти к более приземлённым примерам, проведём аналогию с человеческим голосом. Звук голоса также формируется посредством сигналов операторов и модуляторов. Когда мы хотим что-то сказать, лёгкие выдувают поток воздуха, который проходит через вибрирующие голосовые связки — так «генерируется» исходный сигнал-оператор. Одновременно с этим вибрирует оставшаяся часть голосового аппарата, что генерирует сигнал-модулятор. Его характеристики отличаются от исходного сигнала и напрямую влияют на его звучание.
Когда воздух и звук покидают наш рот, люди слышат совмещённый сигнал оператора и модулятора. То, что слышат наши собеседники — результат влияния модулятора на оператор их объединении. Именно модулятор формирует итоговые характеристики голоса: высоту, тембр, глубину. Вокодер работает схожим образом: исходник изменяется за счёт характеристик дополнительного сигнала.
Любой аудиосигнал может быть оператором или модулятором (причём одновременно). Несмотря на это продюсеры обычно используют синтезированные звуки в роли оператора, а голос — в качестве модулятора. Классический пример использования вокодера в музыке — уже упомянутый трек Kraftwerk «Trans-Europe Express» (отметка в районе 1:16) с одноимённого альбома немецкого коллектива. Оператором выступает сигнал синтезатора с формой волны Saw, модулятором — обычная речь.
Более экспериментальное использование вокодера найдётся в знаменитом треке Kavinsky «Nightcall», который стал одним из пионеров коммерческого синтвейва (особенности стиля мы уже разбирали подробно). Воссоздать такой же эффект можно с помощью iZotope VocalSynth при настройке патча таким образом, что он генерировал аккорды из двух квадратных звуковых волн и белого шума в роли оператора, которые модулируются голосом. Смело переходите на эту страницу, чтобы посмотреть во всех подробностях, как создаётся такой эффект.
Как пользоваться вокодером
Чтобы вокодер звучал не хуже, чем на различных коммерческих записях, сигнал-оператор должен быть богат на обертона. Чем насыщеннее оператор, тем заметнее проявляется влияние модулятора.
Начните эксперименты с патчей с пилообразной формой звуковой волны (Saw) или тех, что частично созданы на её основе. По своему содержанию сигналы с пилообразной волной богаче и насыщеннее сигналов с треугольной или синусоидальной формой. Хорошая практика — компрессировать или сатурировать сигнал-оператор на пути в вокодер. Сжатие динамического диапазона акцентирует внимание на эффекте от прохождения сигнала через банк фильтров.
Голос в роли модулятора — не простая говорильня. Произносить слова при записи нужно очень чётко и чисто, явно выделяя артикуляцию. Каким бы не был ваш голос, именно чёткая дикция создаёт тот самый эффект вокодера, напоминающий речь робота. Обратите внимание, как всё в той же «Nightcall» Кавински чётко и медленно проговаривает и пропевает каждое слово. При работе с вокодером от вас требуется тоже самое. Будете мямлить или забьете на артикуляцию и на выходе получите пережёванное компьютеризированное месиво.
Высота звука не так важна при пении через вокодер. Вместо того, чтобы забираться выше или ниже по звукоряду и пытаться поразить всех своими вокальными данными, сконцентрируетесь на других характеристиках голоса: тембре, глубине, чистоте, чёткости звукоизвлечения.
Какие параметры управляют работой вокодера
Аппаратные и VST-вокодеры оснащаются схожим набором параметров. В большинстве случаев настройки идентичны: в зависимости от производителя могут меняться названия регуляторов и настроек, но чуть остаётся неизменной.
Количество полос (Bands)
Параметр Bands отвечает за активность нарезки сигнала на диапазоны. В зависимости от положения регулятора модулятор разделяет сигнал на заданное число диапазонов. В отличие от виртуальных вокодеров и плагинов, винтажные аппараты ограничены в числе диапазонов, на которые можно нарезать сигнал. Для получения классического роботизированного звука в духе Kraftwerk параметр Bands можно установить в пределах 8-12 пунктов.
Диапазон частот (Frequency Range)
Указывает верхнюю и нижнюю границу частотного спектра сигнала-оператора. Во время работы вокодер заберёт для обработки сигнал только в заданном диапазоне, всё остальное пройдёт мимо эффекта. Чтобы повысить разборчивость звука, верхний порог лучше вывести за отметку 5 кГц.
Форманта (Formant)
Некоторые модели вокодеров оснащаются возможностью настройки форманты — параметр часто называют «Shift» (сдвиг). С его помощью пользователь может расширить или сузить нарезанные диапазоны для фильтрации. Расширение делает обработанный сигнал ярче, сужение — мутнее и глубже.
Обычно параметром форманта настраивают вокодер под женские и мужские голоса — сдвиг делает роботизированный голос более жено- или мужеподобным. Некоторые модели вокодеров вместо ручки формантов оснащаются параметром «Gender», позволяющим настроить, если так можно выразиться, половую принадлежность получающегося голоса
Неголосовые звуки (Unvoiced)
Человеческая речь на любом языке всегда сопровождается так называемыми взрывными звуками (англ. Plosive Sounds). Взрывной звук образуется в моменты, когда для его издания нужно пропустить поток воздуха через сомкнутые губы — например, сюда относится произношение букв «П» и «Б». Взрывные звуки не имеют прямого отношения к самому голосу, поэтому их часто называют неголосовыми звуками (англ. Unvoiced Sounds).
Неголосовые звуки не обладают высотой и представляют собой шум по всему частотному диапазону, игнорируется вокодером. Радоваться исключению таких шумов нет смысла: представьте, как звучат привычные слова без всё тех же букв «П» и «Б» («привычный» — «риычный», «проблема» — «ролема»).
Чтобы вокодер не пропускал взрывные звуки и не проглатывал буквы в словах, производители добавляют в секцию настроек специальный параметр «Unvoiced». Под капотом регулятор связан с генератором шума, который исправляет недостатки в работе вокодера: чем сильнее повёрнута ручка, тем интенсивнее коррекция. Генератор шума воспроизводит сигнал с аналогичной сигналу-оператору формой звуковой волны. Все безвысотные и переходные взрывные звуки остаются в сигнале, буквы в словах не съедаются, а речь после вокодера звучит правильно.
Гуру эффектов выбрали эти статьи для вас 🧐
Что такое реверберация и какие виды этого эффекта существуют
Что такое лимитер: как, чем и зачем ограничивать звуковой сигнал
Основы эквализации: зачем нужен эквалайзер, как он работает и в чём помогает
Что такое High-Pass фильтр: зачем фильтровать высокочастотный сигнал
Что такое Low-Pass фильтр: зачем фильтровать низкочастотный сигнал