О том, что нейросеть MusicLM, сочиняющая музыку по текстовому описанию, теперь находится в публичном доступе, Google объявила в ходе ежегодного эвента Google I/O 2023. Об этом сообщает издание TechCrunch со ссылкой на анонс компании.
Нейросеть MusicLM была представлена в январе 2023 года. По словам компании, алгоритм обучен на базе 280 000 часов записей, благодаря чему способен генерировать композиции в любых жанрах. Тогда же Google заявила, что не собирается отпускать нейросеть в свободное плавание, предоставляя к ней свободный доступ. По какой причине компания изменила своё решение, не уточняется.
Нейросеть MusicLM распространяется в составе пакета AI Test Kitchen для iOS и Android. Для получения доступа к алгоритму необходимо присоединиться к программе тестирования, оставив заявку на отдельном сайте.
MusicLM успешно комбинирует жанры и инструменты, а также «пишет» композиции на основе абстрактных запросов. Так, например, в ходе январского тестирования искусственный интеллект успешно объединил танцевальную музыку и реггетон, придумал звучание для запроса «чувство трепета и благоговения» и скомпоновал трек с «космическим и потусторонним» звуком.
Алгоритм создаёт два варианта музыкального произведения на основе текстового пользовательского запроса. Такое решение компания объясняет возможностью выбора пользователем более подходящего примера. Отмечается, что текстовое описание может включать не только информацию об инструментальных особенностях композиции, но и об эмоциональном настроении музыки.
Пока что нейросеть понимает запросы только на английском языке. Будет ли список языков расширен в будущем, не уточняется.
Представители Google заявили, что стремятся избежать проблем с нарушением авторских прав, поэтому MusicLM не будет создавать композиции и произведения с вокалом конкретных исполнителей. Вместе с тем алгоритм способен генерировать музыку с вокальным исполнением, однако в таком случае создаваемый голос будет чем-то вроде собирательного образа.