Глава команды разработки Stability AI, известной по выпуску музыкального генератора под управлением искусственного интеллекта Stable Audio, Эд Ньютон-Рекс объявил об уходе со своего поста в компании. Своё решение разработчик объяснил несогласием с тем, как индустрия обучает ИИ-модели.
Stability AI занимается разработками и исследованиями в области искусственного интеллекта. Основными продуктами компании являются нейросети, генерирующие аудиовизуальный контент по текстовым запросам пользователя — Stable Audio для генерации музыки и Stable Diffusion для генерации изображений.
По словам разработчиков, тренировка языковой модели Stable Audio проводилась на коммерческой и авторской музыке. В общей сложности нейросеть отслушала 19 500 часов музыки, используя для этого базу AudioSparx — именно этот материал лёг в основу навыка нейросети создавать собственные музыкальные произведения.
Созданием и подготовкой обеих моделей руководил Эд Ньютон-Рекс — музыкант и разработчик, чьи идеи легли в основу музыкального генератора Stable Audio. Несмотря на успех алгоритмов, глава разработки решил покинуть компанию, выразив несогласие с тем, как Stability AI и вся индустрия в целом обучает языковые модели.

В опубликованном сообщении Ньютон-Рекс отметил, что не согласен с политикой Stability AI, считающей приемлемым использование материалов, защищённых авторским правом, при обучении искусственного интеллекта. Компания отмечает, что полагается на принцип «добросовестного использования», прописанный в применяемом в США Законе об авторском праве. Согласно ему, охраняемые законом материалы могут быть ограниченно использованы без согласия правообладателя в случаях, если они применяются в рамках критики и освещения новостей, а также в образовательных и исследовательских целях.
По словам Ньютон-Рекса, что на «добросовестное использование» ссылаются многие крупные компании, занимающиеся генеративным искусственным интеллектом и создающие соответствующие модели. Однако разработчик не согласен с тем, что обучение искусственного интеллекта на чужих произведениях подпадает под образовательные и исследовательские цели.
Ньютон-Рекс отмечает, что законодательство США не допускает прикрытие понятием «добросовестного использования» в тех случаях, когда использование материалов влияет на «потенциальную стоимость произведения, защищённого авторским правом». Автор моделей считает, что нейросети обесценивают произведения, на которых они обучались, и создают условия для нечестной конкуренции. «Я не понимаю, как [в подобной ситуации] использование [охраняемых законом] произведений для обучения нейросетей можно считать добросовестным использованием», — заявил программист.
Развивая свою мысль, разработчик отметил, что методы обучения языковых моделей не только не подпадают под понятие добросовестного использования, но и попросту морально некорректны. Раскрывая свою мысль, Ньютон-Рекс заявил, что большие компании с миллионными счетами бесплатно обучают нейросети на чьих-то произведениях, после чего зарабатывают ещё больше на своих алгоритмах.
Компании с миллиардами долларов без какого-либо разрешения [со стороны авторов] обучают генеративные модели искусственного интеллекта на работах других людей, после чего модели создают новый контент, во многих случаях способный конкурировать с оригинальными работами. Я не понимаю, как это может быть приемлемо в обществе, где экономика в сфере творчества построена таким образом, что авторы полагаются только на авторское право.
Эд Ньютон-Рекс, один из авторов ИИ Stable Audio
Разработчик отметил, что остаётся сторонником генеративного искусственного интеллекта, чей потенциал всё ещё не до конца раскрыт. Тем не менее он будет поддерживать только те алгоритмы, которые не эксплуатируют авторов и не используют чьё-либо творчество без разрешения, признался автор Stable Audio.
Раскрывая свою мысль, Ньютон-Рекс обратил внимание на общую нечестность ситуации. Искусственный интеллект бесплатно обучается на произведениях других авторов, вложивших в них весь свой талант и многие часы работы. В итоге интеллект учится на лучших произведениях, создаёт всё более убедительные работы, становится сильнейшим конкурентом людям и всё это происходит под эгидой «добросовестного поведения», что в корне несправедливо.

Комментируя уход Ньютон-Рекса и его видение происходящего, генеральный директор Stability AI Эмад Мостак заявил, что разработчик дал старт важной дискуссии, требующей серьёзного внимания общественности. Вместе с тем руководитель не согласился с тем, что компании извращают понятие добросовестного использования и привёл ссылку на документ, излагающий позицию Бюро авторских прав США по вопросу обучения генеративных моделей на защищённых авторским правом произведениях.
Вместе с тем пользователи, ознакомившиеся с позицией разработчика, выразили сомнение относительно его взглядов. В частности, ряд комментаторов отметил, что нейросети обучаются на материалах, защищённых авторским правом, точно так же, как и люди, которые учатся играть и писать собственную музыку, слушая песни других авторов и черпая из них вдохновение. «Чем обучение модели на чужих песнях отличается от обучения студента на чужих песнях?», — задался вопросом один из пользователей Твиттера/X, однако ответа от Ньютон-Рекса не получил.
https://youtu.be/iaLFrGCsxcA?si=5myPjjCtWoNafwQf
Интересная тема. Я вот почитал отзывы и задумался. Я вот получается тоже могу остаться без работы? Раз пишется музыка , генерируются автонастройки голосов Меркьюри, Синатры, обучение АІ как в шахматах музыке, то будущее выглядит туманным? Каспаров проиграл компьютеру.(чемпион мира)… Кто вообще будет востребован? Думаю запас лет 10 у нас ещё есть или уже нет? Родоначальник Аі сказал нейросети через 5 лет будут обладать самосознанием
Ну сказал, и сказал, будут и будут
Я может наивный, но все могут остаться без работы и без всякого ИИ — всегда появляется кто-то лучший или случается что-то, что вообще оставляет всех с носом.
Думаю, что в итоге все накушаются этого ИИ, и созданное человеком будет цениться больше намного. Типа вот хочешь уникальный штучный продукт, вот тебе человек. Нужно быстро и без заморочек, вот тебе ИИ. Ну, хочется в такое верить.
В общем, все от задач зависит и целей, которые будут ставиться.
Про студентов — это лёгкий вопрос — студент не может написать 200 часов музыки за 1 час и должен тратить своё время и деньги на обучение, а также на покупку инструментов , нотных тетрадей и самой музыки тоже, потому что всем музыкантам новая музыка не доступна бесплатно, а для ИИ получается доступна, поскольку бигкорп отдают всё на обучение и могут никого не спрашивать — это же не стримы, ну и пускай один стрим — полцента, да им наплевать. Но человеку заучить мелодию — нужно 4-5 -10 раз прослушать, а ИИ с первого раза сразу оцифровывает по сути информацию и делает по факту её копию и хранит в своей базе, а это уже противозаконно, даже если формат файла как-то отличается, но ИИ может точно из этого формата сам воспроизвести.
В итоге, конечно, это может быть другой уровень музыкального развития и восприятия, музыка по заказу под конкретного человека, но при этом не указываются никакие из авторов обучения, хотя их материалы прямо заимствованы и получается, что в это как derivative work на которые вообще должны получать разрешение и в случае с ИИ на самом деле есть смысл подавать иски, поскольку ответчиком будет не какой-то нищеброд с гитарой на улице, а реальная компания с миллионным бюджетом, которая продаёт этот контент таким же компаниям или миллионам пользователей в час — чего один студент сможет сделать лет через 10-15, если будет сам тянуть всё и то вряд ли.
Тут самое опасное — это подмена ценностей и то, о чём пишут в Китае про ИИ, что можно внедрять чуждые ценности с использованием ИИ, но ответственности по сути никто нести не будет, а в случае с реальным музыкантом — эта ответственность ложится целиком на него. Как бы они впаривают фейк, как искусство, а искусство основано на переживаниях автора, а там просто перебор вариантов и сравнение с базой выстреливших хитов — это плагиат называется.
И бигкорп хотят делать плагиаты, а зарабатывать на этом ещё больше бабла только за счёт доступа к базе слушателей и подбору для них «своей авторской» музыки, которая не авторская и плагиат, то есть это не является их достижением или объектом авторского права вообще по своей сути — это дипфейк как бы, просто в случае с видео и изображениями — это проще отследить, а с музыкой сложнее и основано на тех же алгоритмах проверки через ИИ, поэтому они используют как бы бэкдор и эксплуатируют дыру в безопасности в целом системы авторских прав и музыки в частности — они её разрушают для всех артистов вообще-то. Забастовки сценаристов и актёров недавно — это вот об этом было.
Здесь лучший пример финала — это фильм Москва-Кассиопея.
И в случае студента — он не сможет прослушать те 20000 часов музыки, всё запомнить и сделать вариант, который будет в чём-то отличаться без повторов, а ИИ может и ещё он сможет найти этот трек среди всех остальных миллионов треков, а вот этот студент не сможет никогда.
просто последний вариант может заблокировать всем артистам творчество, потому что окажется, что ИИ уже все варианты создал и запатентовал, поэтому ты вообще не сможешь ничего опубликовать без разрешения какой-то бигкорп и сразу будешь должен пожизненно.
и это как бы серьёзная такая опасность вообще-то.
Добрый вечер!
Разрешите поделиться вашим комментарием с указанием, в своём канале?
да, не вопрос. страшилка хорошая ))
там можно ещё добавить, что принципиально у компьютера нет совести или каких-то сомнений и он выполняет поставленные задачи пока из розетки не отключат, поэтому ему скажут давай все прогрессии разбери и он разберёт. И недавно был случай, что механическая рука убила человека — вот так просто не распознала или ошибка в программе, ИИ переехал человека — то есть это не тот Искусственный Разум, который что-то осмысливает и выдаёт своё достижение — это брутфорс генератор, основанный на неёросетях для отсева ошибок. А в музыке заключается часть общения людей, основанная на эмоциональной и смысловой нагрузке — для ИИ это просто как дрель, он ей сверлит, вот есть ноты, он их ставит, цель — составить правильный порядок слов, но это не является личным опытом или реальным достижением чего-то нового.
Тут даже лучше подходит сравнение с поисковой машиной (которая так и есть), что поиск не является самым умным, а выдает результаты трудов других людей, но на самом деле это не принадлежит поисковику.
Проблема всей этой истории с ИИ в том, что из разных источников раньше звучало и сейчас звучит, что в ближайшем счастливом будущем люди не будут заниматься ручным трудом, гнуть спину, таскать тяжести и вот это вот всё. Для всего будут машины и искусственный интеллект, который освободит нас от неблагодарных занятий и всего такого, взяв всю грязную работу на себя. Никто не говорит, что ИИ поумнеет и нас всех уничтожит, это история для фантастов. Типа просто будет много машин, которые сделают за нас всю дрянную работу, а люди смогут посвятить себя высшим и прекрасным занятиям — творчеству, искусству, созиданию и вот этому всему. Каждый будет творец в меру талантов и жизнь в кайф, и все такое третье.
А на деле ИИ движет нас в ещё более страшное будущее, где он не будет нас всех уничтожать, нет. Просто он стремиться заменить или заменяет нас не на работах, где надо гнуть спину, а именно в этом обещанном прекрасном будущем, где каждый творец и все такое. В итоге корпорации предлагают нам не париться, продолжать гнуть спину и потреблять сгенерированное эрзац-творчество в качестве благодарности.
Сейчас вот научат ИИ писать идентичные треки на любой вкус под каждого человека, потом научат кино и сериалы так же снимать. Хочешь стихи, пожалуйста. Романы и триллеры, вот тебе вагон того, что ты любишь, свежесгенерированного. Потом научат еще что-то творческое делать. И корпоратам от этого отлично, ведь интеллект генерирует так, как скажут 24/7, рисков в сравнении с музыкантами-писателями-художниками минимум, ведь ИИ не бухает, не бунтарит, у него нет семьи, у него все в порядке со здоровьем, у него нет творческого застоя и прочих неприятностей.