Adobe Enhance Speech исправляет звучание некачественных аудиозаписей так, как будто они были «записаны на профессиональной студии»

Adobe запустила бесплатный инструмент очистки голосовых аудиозаписей Adobe Enhance Speech. Сервис работает в рамках платформы Adobe Podcast и использует алгоритмы машинного обучения для удаления артефактов, резкости и шума из речи.

Enhance Speech стал частью ранее запущенного сервиса онлайн-обработки аудио Adobe Podcast. Бесплатная платформа объединяет два элемента — функцию Mic Check для проверки и настройки подходящего уровня записи микрофона и утилиту Enhance Speech для работы с уже записанным сигналом.

Инструменты внутри Adobe Podcast предназначены для авторов подкастов, интервью и блогеров. Отмечается, что «умный» обработчик аудио создан для аудиофайлов, записанных в неподготовленных условиях при помощи встроенного микрофона смартфона, планшета или ноутбука.

По словам разработчиков, Enhance Speech делает звучание голосовых аудиозаписей таким, как если бы они «были записаны в профессиональной студии». Отмечается, что система успешно обрабатывает речь, даже записанную с помощью «самых бюджетных микрофонов в неидеальных условиях».

Процесс улучшения и очистки идентичен обработке аудиофайлов в сервисах онлайн-мастеринга. После загрузки аудио на странице сервиса необходимо дождаться окончания обработки, чтобы получить улучшенный файл.

Обзоры возможностей сервиса и результаты обработки показывают, что алгоритм действительно заметно улучшает качество записей. Технология Adobe успешно удаляет артефакты, устраняет резкость и фоновые шумы. Вместе с тем алгоритм смягчает проблемы сибилянтов и взрывных согласных.

При загрузке качественных записей, сделанных на более качественные микрофоны и в лучших условиях, результаты работы Speech Enhance, ожидаемо, не так хороши. По словам блогера PiXimperfect, протестировавшего платформу, нормальные записи после обработки кажутся даже хуже, чем были, — очевидно, что алгоритм Adobe создан для «особенно плохих записей».

Программное обеспечение не способно анализировать и улучшать аудио с одновременной речью нескольких человек и пением, и предназначено для обработки файлов с чётко разделёнными по времени голосами. Будут ли возможности алгоритма расширены в будущем, не сообщается.

Другой инструмент в составе Adobe Podcast — Mic Check — также полагается на функции машинного обучения для анализа аудио. Инструмент проверяет записанный заранее сэмпл и сообщает его состояние: интенсивность эффекта близости, примерный уровень гейна при записи, количество фоновых шумов и артефактов. Полученные данные пользователи могут использовать для изменения настроек записи речи.

По словам Adobe, в ближайшее время платформа получит новые функции. В частности, сервис научится расшифровывать аудио в текст, редактировать записанные файлы и вести удалённую запись. Последнее предполагает возможность одновременной записи нескольких человек, находящихся в разных местах, с последующим объединением записанного в один файл. Компания также планирует добавить шаблоны проектов для быстрого создания подкастов.

Для работы с платформой Adobe Podcast требуется аккаунт в системе Adobe. Возможности сервиса предоставляются на бесплатной основе, однако для получения доступа требуется оставить заявку на тестирование. Получить больше подробностей, проверить возможности платформы и улучшить записанные аудиофайлы можно на этой странице.

Видео

15 комментариев

cage_unlimited 27.12.2022 в 07:46

Забавно, что русскую речь в плохих условиях записи воспринимает, как английскую (оно и понятно, почему). Но результат довольно потешный :)
Ссылка на фрагмент записи заседания с шумовика до и после обработки
https://disk.yandex.ru/d/taSQEem7V1shtg

Войдите, чтобы оставить комментарий
- Кирилл Бекетов 28.12.2022 в 17:33
  
  в целом не так и плохо, хотя и не так хорошо, как хотелось бы)) видимо нужна такая же модель для нейронки, но натренированная на русской речи, чтобы всё получилось
  
  Войдите, чтобы оставить комментарий
StiffGear 23.12.2022 в 19:00

Жаль, что настроек нет. Эффект помещения убирал бы отдельно, было бы поинтереснее. Там при тестировании микрофона 4 критерия, их бы включать/выключать.

Войдите, чтобы оставить комментарий
nagorov 23.12.2022 в 16:32

Понятно. Спасибо за отклик.

Войдите, чтобы оставить комментарий
nagorov 23.12.2022 в 14:15

Интересно, а записанный в неподготовленной комнате вокал хорошо обработает? Кто то пробовал?

Войдите, чтобы оставить комментарий
- Егор Ревенга 23.12.2022 в 15:27
  
  Так говорят, с вокалом не работает, пение не умеет обрабатывать, только речь обычную
  
  Войдите, чтобы оставить комментарий
  - александр алексеев 23.12.2022 в 19:35
    
    Давно я хотел интервью Летова 80-х годов отремастерить, надо попробовать. Качество ужасное, хочу протестировать сервис
    
    Войдите, чтобы оставить комментарий
    - Егор Ревенга 23.12.2022 в 19:40
      
      И все записи заодно можно тоже (шутка)
      а в чем проблема их почистить в том же RX от iZotope?
      
      Войдите, чтобы оставить комментарий
      - александр алексеев 23.12.2022 в 20:04
        
        Записи настолько плохие, что изотоп вряд ли поможет. Они делались просто для журналистов, а не на широкую публику
      - Егор Ревенга 23.12.2022 в 20:22
        
        Понятно. Поделитесь потом мнением, что получилось и как впечатления вообще у вас.
      - александр алексеев 23.12.2022 в 20:48
        
        ок
      - александр алексеев 28.12.2022 в 15:56
        
        Делюсь мнением. Самое некачественно записанное интервью сервис вообще не распознал, звука нет и скачать нельзя, ошибка. Проверил какую-то аудиокнигу, идеально записанную, так вот на выходе звук стал даже хуже)
      - Кирилл Бекетов 28.12.2022 в 17:32
        
        Потому что с русской речью модель, на которой они тренировали свой алгоритм банально не знакома.
        Вся эта адобовская система изначально создана под английский язык и разговор, там все более менее в порядке.
      - александр алексеев 28.12.2022 в 21:31
        
        ясно
александр алексеев 23.12.2022 в 12:15

Тересно

Войдите, чтобы оставить комментарий