Искусственный интеллект давно заполонил рынок музыкального программного обеспечения. Разработчики всячески стремятся упростить жизнь музыкантов, а искусственный интеллект обещает сделать всю работу за пользователя. Но так ли всё радужно, как нам кажется? Из этого материала вы узнаете, почему умные плагины совершенно не умны, а также поймёте, как они вредят вам и вашим миксам.
Мы живём во времена бурного развития компьютерных технологий. С каждым днём цифровизация и автоматизация сильнее проникают во все сферы деятельности, производство музыки здесь не исключение. Музыкальное программное обеспечение обрастает всё новыми возможностями, что, по задумке разработчиков, делает музыкантов, звукорежиссёров и продюсеров намного эффективнее.
Один из главных трендов последнего времени на музыкальном рынке — «умные» плагины с искусственным интеллектом или функциями машинного обучения. Разработчики активно продвигают такие инструменты, в которых ИИ якобы значительно упрощает работу над миксами.
Одними из первых, кто оседлал умную тему, были разработчики из iZotope. Несколько лет назад компания представила умного помощника Track Assistant, способного анализировать сигнал и применять к нему серию обработок для его улучшения. Искусственный ассистент используется в Ozone, Neutron и Nectar и, если верить заявлениям iZotope, выдаёт на выходе идеально сведённую, эквализованную и откомпрессированную дорожку, которая сходу ложится в микс.
Успех iZotope не прошёл незамеченным, многие компании пошли тем же путём. Сегодня каждый второй плагин получает звание «умного инструмента», способного сделать всю работу за пользователя. Однако всё не так просто, как кажется: хотя некоторые плагины реально упрощают жизнь наличием искусственного интеллекта, большая часть умных продуктов таковыми попросту не являются.
ЖЕСТОКАЯ ПРАВДА
Этот текст — адаптированный и дополненный перевод одного из материалов журнала MusicTech. Жестокая правда — это советы и очевидные мысли, которые вы вряд ли хотите услышать, но которые наверняка сделают вас намного лучше.
Интеллект без интеллекта
Цель любого программного обеспечения — выполнять набор инструкций, заданных разработчиком. Результаты работы программы представляют собой отражение идей и взглядов создателя на возможное решение конкретной проблемы.
Жестокая правда в том, что ни одно музыкальное программное обеспечение, в возможностях которого упоминается искусственный интеллект или иные умные функции, не имеет никакого искусственного интеллекта. Эти инструменты не обладают мышлением, не думают за музыканта и, тем более, не принимают самостоятельных решений.
Использование конструкций «искусственный интеллект» и «умный помощник» в описании плагинов и музыкальных программ говорит только об одном — перед нами продукт, в котором нет ни ума, ни интеллекта. За громкими высказываниями стоит обыкновенная маркетинговая брехня, цель которой — создать захватывающую и модную картинку.
Конечно, ровнять всех разработчиков неправильно: некоторые «умные» инструменты на самом деле используют наработки, использующиеся в области искусственного интеллекта. Так, например, гейт Oxford Drum Gate от Sonnox использует алгоритмы машинного обучения, помогающие плагину точнее определять транзиенты бочки, снейра и томов. В свою очередь, спектральный редактор Steinberg SpectraLayers также обладает собственными «умными» алгоритмами, вполне успешно разделяющими микс на составные части.
Наличие алгоритмов, способных успешно решать всевозможные рутинные задачи, кажется более полезной вещью, чем небывалая база пресетов, 99% которых так же эффективны, как бетонный парашют. Машинное обучение и прочие подобные штуки приносят больше всего пользы именно в монотонных процессах, требующих десятка часов кропотливой работы.
Да, мы можем создать идеальное ограничение для каждого удара барабанной установки, равно как и определить и извлечь различные компоненты микса. Однако ручная работа займёт слишком много времени, которое большинство предпочло бы потратить на создание музыки, а не вращение ручек. Переложить скучные задачи на плечи алгоритма, решающего конкретную проблему, — вполне разумно.
Однако маркетологи не говорят о таких возможностях, ведь они не продают продукт массовому потребителю. Чего не скажешь об интеллеетуальных функциях, представляющих настоящий спасательный круг, минимизирующий или полностью нивелирующий некомпетентность конечного пользователя в том или ином вопросе.
Музыкантов завлекают невероятными умными функциями, которые экономят время и позволяют сосредоточиться на творчестве. Умные эквалайзеры обещают нам идеальную коррекцию любого источника сигнала, умные компрессоры завлекают обещаниями правильной настройки динамики звука.
Вся эта «умность» выглядит отличной идеей и создаёт у покупателя иллюзию полной цифровизации музыки, где роль человека уходит на второй план. Достаточно нажать одну-две кнопки, чтобы всесильный искусственный интеллект сделал всё, что нужно, а мы — получили готовый к релизу трек. Красота? Она самая!
Однако за этим прекрасным началом скрывается проблема, о которой большинство музыкантов даже не задумываются.
ПРЕДЫДУЩИЙ ВЫПУСК
Не ваш результат
Какими бы умными не казались плагины, результат их работы зачастую предсказуем. Вне зависимости от того, какой сигнал поступил на вход, на выходе мы получаем примерно одно и то же.
Более того, плагины обрабатывают сигнал не так, как мы думаем. Маркетологи убеждают нас, что искусственный интеллект анализирует сигнал и выбирает лучшие настройки, но дело в том, что он толком ничего не анализирует и не выбирает. Итоговая обработка представляет собой не решения некоего всесильного компьютерного разума, а лишь набор приёмов и методик, определённых разработчиками.
Алгоритмы плагинов ничего не решают. Всё, что они делают — это транслируют идеи своих авторов, которые считают, что сигнал должен обрабатываться именно так.
Работа умных плагинов всегда выглядит захватывающе — процессор что-то анализирует, показывает графики и самостоятельно активирует те или иные обработки. Но под красивой обёрткой скрывается всего лишь набор определённых разработчиками команд, призванных в конечном счёте согласовать сигнал на входе и выходе плагина.
Конечно, это не означает, что умные плагины ничего не умеют. Напротив, некоторые разработки (например, тот же iZotope Ozone) неплохо справляются с теми задачами, для которых их создавали. Проблема лишь в том, что результат всегда одинаков: два продюсера, использующие один и тот же плагин для сведения своих треков, получит очень похожие по звучанию миксы.
Музыканты стремятся к собственному уникальному звуку, мечтают выделяться на фоне других исполнителей, а затем используют плагины, в которых решения за них приняла команда неизвестных разработчиков. В итоге, вместо экспериментов и поисков, люди доверяют инструментам, изменяющим сигнал так, как это решили программисты.
Все умные плагины делают то, что решила команда разработчиков. Группа программистов и аналитиков решила, что конкретный сигнал должен звучать после обработки вот так и никак иначе. Почему? Этого не знает никто, кроме самих создателей плагинов. А они, в свою очередь, никогда не расскажут, почему их методика хороша и полезна.
Никто не спорит, что настройка компрессоров, эквалайзеров и прочих обработок может быть сложным делом, особенно для начинающих музыкантов. Но это не высшая математика и даже не сопромат. Изучить общие принципы и методики работы со звуком не так сложно, как кажется, а научиться сводить и принимать правильные решения поможет постоянная практика.
Сведение и продюсирование музыки — это история о принятии решений, подходящих в определённой ситуации для конкретного сигнала. Работа над миксом — это место, где встречается творческое и техническое начало, и только от человека зависит, как именно в конечном счёте зазвучит композиция. Именно поэтому важно учиться самостоятельно принимать решения на основе своих желаний, а не слепо доверять идеям разработчиков.
КОММЕНТАРИЙ СПЕЦИАЛИСТА
Тема искуственного интеллекта поднимается достаточно часто. Это «стильно, модно, молодежно».
Сравнительно недавно под соусом музыки, созданной «искусственным интеллектом», в разных частях мира появились несколько компаний, которые говорили, что уже сейчас музыка неотличима от «живой», то есть написанной живым человеком. Ну и, конечно, что ИИ спасёт мир и сделает миксы идеальными.
Как выяснилось потом, музыкальные треки были ни чем иным, как миксами живых музыкантов, присылавших в эти платформы свои треки. Так что, зачастую, под видом новых нейро-плагинов, нам продают привычные инструменты в красивой обертке.
И всё же технологии не стоят на месте. Если натренировать нейронную сеть на датасете из сотен тысяч часов музыки в определённом стиле, то мы получим робота-мастеринг-инженера, который делает свою работу достаточно хорошо. По крайней мере достаточно настолько, насколько это нужно обывателю, для которого музыка служит фоном, под которую можно съесть бургер или сходить на пробежку.
Но для создания шедевра пока что всё равно требуется прикосновение человека и его природной сущности. Нужен опыт (как у нейросетей), интуиция или чутьё. С последними у нейросетей в музыке пока что всё не очень хорошо. Впрочем, это вопрос времени.
— Василий Филатов,
основатель Института звукового дизайна и агентства SoundDesigner.PRO
Алгоритмы не заменят человека
Умные плагины можно рассматривать в виде подсказки, как именно можно обработать сигнал. Однако не стоит воспринимать их предложения, как единственно верные и правильные.
Итог, как и всегда, всё тот же: чтобы научиться сводить, нужно чаще сводить. Допускать ошибки, нарабатывать опыт, принимать неправильные решения и делать правильные выводы. Конечно, неудачи расстраивают, но это не повод отчаиваться: если вы хотите научиться чему-то, вы должны совершить десятки ошибок, чтобы понять, что нужно и не нужно делать.
Надежды на модный искусственный интеллект, который обещает идеально свести дорожки между собой, ведёт к тому, что вы никогда не научитесь сводить самостоятельно. В общем, нужно учиться и помнить, что ни один алгоритм не сведёт песню за вас.