Почти половина людей не могут отличить музыку, сгенерированную ИИ, от написанной человеком. К такому выводу пришли бразильские учёные по итогам слепого тестирования слушателей.

Исследователи Федерального университета Минас-Жерайса в Бразилии провели слепой тест наподобие теста Тьюринга. Для проверки использовались наборы композиций, в которых один из треков обязательно был сгенерирован с помощью нейросетей. Участникам предлагалось послушать несколько песен и определить, какая из них создана алгоритмом.

Представители университета рассказали, что своей работой стремились выяснить, могут ли люди понять, что слушают музыку, созданную искусственным интеллектом. И, как показала практика, в случае прослушивания случайных композиций люди определяют работу алгоритмов едва ли в половине случаев. Результаты исследования уже опубликованы на платформе arXiv.

Как отметили авторы, предыдущие подобные эксперименты всегда полагались на новую музыку — исследователи использовали композиции, сгенерированные под конкретный тест. Искусственность такой музыки зачастую была заметна сразу по характерным артефактам и общей новизне содержания.

Чтобы эксперимент был точнее, в подборку музыки включили только уже существующие композиции. Авторы собрали каталог ИИ-музыки, размещённой в открытой библиотеке Suno и на YouTube, отдавая предпочтения композициям, выпущенным в период с июля 2023 года по февраль 2025-го.

Участники эксперимента слушали десять композиций: пять пар треков в разных жанрах. Время от времени, но не всегда в одной из пар оказывались похожие песни: одна была настоящей, вторая — сгенерированная алгоритмом. Пятая пара произведений была контрольной и всегда состояла из вступления к Пятой симфонии Людвига ван Бетховена и созданной искусственным интеллектом композиции.

Отмечается, что сгенерированная музыка, дополнявшая Пятую симфонию, начиналась со слов «Эта музыка создана не человеком, я скажу это сразу». Фраза звучала не просто так: с её помощью авторы проверяли внимательность и доверчивость слушателей.

При подсчёте результатов учитывались ответы только тех участников эксперимента, кто узнал симфонию Бетховена. Из результатов также исключали ответы тех, кто знал хотя бы одну из песен в первых четырёх музыкальных парах. Таким образом из 653 участников сформировали итоговую контрольную группу слушателей из 290 человек.

В случае, когда первые четыре пары состояли из случайных композиций, мало похожих между собой, то участники верно определяли естественное или искусственное происхождение музыки в 53% случаев. Если же в парах появлялись похожие по содержанию и характеру композиции, доля правильных ответов возрастала до 66%.

Люди с музыкальным образованием или умением играть на музыкальных инструментах чаще давали правильные ответы и корректно определяли работу алгоритмов. Верные ответы также часто встречались среди испытуемых, имевших опыт генерации музыки в одном из доступных сейчас сервисов.

Как отметили авторы, в среднем по всем типам пар люди верно определяли происхождение музыки в 60% случаев. В реальности же отделить реальное творчество от сгенерированного получалось только у половины слушателей, участвовавших в эксперименте.

В будущем учёные планируют расширить свой эксперимент, добавив больше участников в выборку и расширив жанровое разнообразие музыки. В планах бразильских исследователей также значится провести похожие активности и для других видов контента — текстов, видео и изображений.