Сервис «нейродубляжа» ElevenLabs, развивающий нейросеть для озвучания и перевода роликов, представил функцию GenFM для создания подкастов из текстового файла. Генератор голоса поддерживает русский язык и предлагает озвучку с двумя «ИИ-ведущими».
Новая функция озвучивает тексты из PDF-файлов, электронных книг и документов с помощью ИИ-голосов. Платформа поддерживает 32 языка, включая русский. Пользователи могут расставить интонации и акценты в загруженном тексте, чтобы сделать речь более живой.
Отмечается, что в сценарии можно использовать «максимум два „ведущих“». Как отмечает портал TechCrunch, речь персонажей получается достаточно правдоподобной, при этом пользователи могут добавить в генерируемые файлы междометия и «вдумчивые паузы», чтобы приблизить нейросетевой результат к реальному разговору.
- Пример сгенерированного подкаста из текста ElevenLabs 0:32
Согласно описанию на сайте проекта (для доступа на территории РФ и РБ требуется VPN или прокси-подключение), создание подкастов из аудиофайлов уже доступно всем пользователям в приложении ElevenReader для iOS и Android. Использование функции бесплатное.
В сентябре 2024 года похожая функция появилась в генераторе NotebookLM от Google. Версия технологического гиганта создаёт голосовые передачи из текстовых файлов, но поддерживает только русский язык.
ElevenLabs была основана в 2022 году бывшим ML-инженером Google Пётром Дабковски и разработчиком стратегий развёртывания Palantir Мати Станишевски. Широкую известность платформа получила в октябре 2023 года, представив функцию «нейродубляжа» видеороликов на разные языки. Последняя привела к появлению большого количества мемов, шутливых видеороликов и прочего контента.