URL: https://www.opennet.ru/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 129278
[ Назад ]

Исходное сообщение
"Система машинного обучения Stable Diffusion адаптирована для синтеза музыки"

Отправлено opennews , 16-Дек-22 12:05 
Проектом Riffusion развивается вариант системы машинного обучения Stable Diffusion, адаптированный для генерации музыки вместо изображений. Музыка может синтезироваться текстового описания на естественном языке или на основе предложенного шаблона. Компоненты для синтеза музыки написаны на языке Python с использованием фреймворка PyTorch и доступны под лицензией MIT. Обвязка с интерфейсом реализована на языке TypeScript  и также распространяется под лицензией MIT. Натренированные модели открыты под пермиссивной лицензией Creative ML OpenRAIL-M, допускающей использование в коммерческих целях...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=58336


Содержание

Сообщения в этом обсуждении
"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:05 
Единственное нормальное применение этого стейбл диффьюжена.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 13:25 
Вы, батенька, пользоваться просто не умеете

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 13:55 
Чем дебильными наркоманскими картинками? И хорошо что не умею, просмотр ковра это развлечения я оставлю для тебя.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 14:07 
какие запросы такие и картинки ... завязывайте с наркотиками

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 17-Дек-22 22:53 
завязывай с порнухой

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Жироватт , 16-Дек-22 12:09 
А собачку на спектрограмме не дорисует? Фрактальную собачку из фрактальных собачек.

А вообще да, многовато в последнее время громких FizzBuzz-заголовков про очередную нейросеть Hurr, натренированную на Durr, написанную omg, this is PYTHON!

Конкретно эта сеть смогЁт или не смогЁт убрать фоновый отсчётный бдыщь-бдыщь из обоих семплов без потери качества остальных инструментов? Или окна берутся как промежутки между этим задолбавшим в каждом первом треке отсчетами?


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:26 
Странные у тебя фантазии про собачек. Но принцип работы в твоё случае это убрать звук с бдыщами и выдумать на основе обучение ту часть, которую ты хочешь заменить. С качеством может все и будет норм, но это уже будет не тот кусок, который был до этого, а свежевыдуманные на основе того что было рядом.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Жироватт , 16-Дек-22 13:01 
Не странные, просто раньше были распространены картинки, где нейросеть рисовала фрактальных собачек
https://www.nanonewsnet.ru/files/users/u3/2016/04/fef1b38863...
вместо того, что надо. Мне просто интересно, таки будет фрактальная собачка на спектрограмме, или уже нет.

> Но принцип работы в твоё случае это убрать звук с бдыщами и выдумать на основе обучение ту часть, которую ты хочешь заменить.
> без потери качества остальных инструментов?

Или выдумать, или экстраполировать звучание остальных каналов в сведенной, запеченной для продакшена мелодии. Бдыщи же небольшие по длительности. Вот мне интересно, сможет оно или не сможет сделать это?
Ну или если выражаться яснее - сможет ли она достроить выпавшие куски так, чтобы а) не было видимых переходов "данные - генерированное - данные" и при этом для инструментов сохранялась форма и пропорции, которые можно получить на основе диапазона инструмента из "чистых" кусков.

Просто иначе это не заслуживает внимания.


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:30 
>без потери качества

А если подумать? Нейросети дорисовывают, может только попробовать угадать. Результат известен.


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Жироватт , 16-Дек-22 13:01 
Угадать или вычленить-экстраполировать-достроить без потери экстремумов.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:10 
Результаты похожи на творчество The Caretaker

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:12 
Битмейкеры уже напряглись?

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Жироватт , 16-Дек-22 12:14 
Зачем? Обезьянка с пираченным фрутилупс таки дешевле сожженого на запуск нейросетки электричества.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:22 
Сможет ли робот написать симфонию? Смитт напрягся.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено лютый ж.... , 17-Дек-22 10:51 
>Сможет ли робот написать симфонию?

даже до качественного митола (ну там) / пинкфлойдов далеко. в музоне вся шифка - новое придумать. а картинки с сицками нейросети, как раз, уже неплохо повторяют. только это не творчество


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Анонус , 16-Дек-22 14:03 
Да брось ты.
Щас какой нить вендор начнет играться и впаривать нагенеренные сэмпл-паки битмарям, битмари будут по-прежнему впаривать этот нагенеренный непосильным творческим трудом кал рэпперам, последние будут есть и обляпываться

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:21 
> используется оконное преобразование Фурье

- вершина математической науки. Дожили. Хотя чему удивляться? https://www.cnews.ru/news/top/2022-12-15_cnewsvtb_i_skolkovo...


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:58 
Ты участвуешь?

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 17-Дек-22 18:50 
Нет, его послали. Иначе бы не бургутил.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:32 
Гачимучи будет синтезировать.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Жироватт , 16-Дек-22 13:08 
У них в инструкции написано, что этого надо будет купить PREMIUM-датасет за THREE HUNDRED BUCKS, докупить еще один терабайтник для FU*EN SLAVE-нейросети, а затем позвать DUNGEON MASTER для инсталляции.
Попробуй, отпишись, как пойдет.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 15:05 
Without further interruption let's celebrate and make some datasets!

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Full Master , 22-Дек-22 08:37 
А картинки такие оно уже умеет генерировать?

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 12:48 
музыка дак как будто из порно

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 13:02 
А как она звучит? Напой пожалуйста, друг интересуется.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено BrainFucker , 16-Дек-22 21:25 
https://cloudflare-ipfs.com/ipfs/QmZpzH7ifE9NdRgRoh7Lz218MQE.../

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 18-Дек-22 20:43 
Как специалист в этом вопросе имею сказать, что вот эта песня и песни вроде неё часто используются https://www.youtube.com/watch?v=TP8O2mmDLzI так что нет, только в дешёвом и без души будет такой треш как в ОП, откат за использование трека не такой уж и большой.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Жироватт , 16-Дек-22 13:03 
Нейросетюшка, ты ювелир!

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено анонна , 16-Дек-22 20:54 
это она и есть)) а вообще создать музыку на компе можно, но это будет звук без души. музыка написанная человеком и отличается тем, что не строгие промежутки звучания и смены нот. это как электромузыка тож самое. там мало таланта и мастерства самого человека. музыка должна пройти через руки мастера играющего на инструменте чтобы быть музыкой.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 17-Дек-22 18:52 
>не строгие промежутки звучания

Ты бы хоть про темперацию почитал, а? А то и правда нейросетке сольёшь.


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено анонна , 17-Дек-22 23:17 
я слушал то что сочинила прога и то что сыграл мастер.)) поверь разница колосальная.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 18-Дек-22 15:40 
Так это от того, что ты знал заранее, где мастер, где прога, и настроил так себя. Если бы ты не знал, где кто играет, ты бы может и не отличил, от мастера может и отличил бы (да и то, я вот за себя не поручусь), а от обычного среднего неплохого музыканта?

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено анонна , 18-Дек-22 16:36 
> Так это от того, что ты знал заранее, где мастер, где прога,
> и настроил так себя. Если бы ты не знал, где кто
> играет, ты бы может и не отличил, от мастера может и
> отличил бы (да и то, я вот за себя не поручусь),
> а от обычного среднего неплохого музыканта?

сам играю на электрогитаре. поверь разница между машиной и музыкантом в том как он делает интонации и как он играет иногда специально не соблюдая ритм и длину нот. в этом отличие человека от машины. он не способен долго выдерживать правильный темп и сила удара по струнам разная создавая интонацию. не музыкант и правда не всегда услышит. для обычного обывателя и правда сложно может быть отличить. но интонацию и общий характер звучания думаю сможет.


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 18-Дек-22 14:23 
Дааа… Уже 50 лет как буквально вся музыка "создана на компе" -- большое число семплов максимально искусственные. Реальная музыка и живое исполнение есть практически только в саундтреках к играм и фильмам.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено анонна , 18-Дек-22 14:56 
> Дааа… Уже 50 лет как буквально вся музыка "создана на компе" --
> большое число семплов максимально искусственные. Реальная музыка и живое исполнение есть
> практически только в саундтреках к играм и фильмам.

значит ты слушаешь только электро. рок послушай или классику там без живой музыки никак. а попса она и есть попса. уродство то еще. там нет текстов песен достойных , а музыка... можно ли её еще музыкой назвать. бит для тугослышащих.))


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 18-Дек-22 17:54 
О нет, тексты бывают удивительно глубокие, люди просто не задумываются о смысле, да и редко когда поймёшь сразу. Ещё имеют некоторое значение личности авторов и исполнителей. Музыка… Ну, тут у каждого свои предпочтения, но мелодичность и техничность исполнения параметры вполне объективные. Лично я вообще только группы вроде Merzbow^W Heilung слушаю, но всё же у большинства популярных исполнителей живые концертные исполнения такое себе, сколько ни смотрел. Только если очень нравится исполнитель, у меня есть коллекция концертных блюреев. Классику же сегодня разве что в этих самых играх и услышишь. Ещё можно в аниме натуральные инструментальные исполнения найти. А вот рок сам по себе попса в худшем смысле, только устаревшая, к тому же в нём обычно есть и семплы и постобработка. Я конечно не осуждаю ценителей живого натурального исполнения а ля Anal Cunt, но это немного не моё.

PS можно ли считать Mono "живой музыкой"? https://www.youtube.com/watch?v=FOxNd5ia_GY это наверное самое близкое к живой музыке, что можно найти. А Boris? С Masonna по живости конечно никто не сравнится. Кстати, это всё типичные рок исполнители. Но живая музыка никому не интересна, почему-то. Поэтому её мало делают. Акустический альбом сегодня? Не продадите, а капелла лучше продастся. Но если серьёзно, разве рок вроде In this moment (та самая "компьютерная" музыка) так уж лучше электронной музыки Night Club? Я не могу выбрать, что мне нравится больше. Night Club даже поприятнее местами.


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено анонна , 18-Дек-22 18:04 
>[оверквотинг удален]
> мелодичность и техничность исполнения параметры вполне объективные. Лично я вообще только
> группы вроде Merzbow^W Heilung слушаю, но всё же у большинства популярных
> исполнителей живые концертные исполнения такое себе, сколько ни смотрел. Только если
> очень нравится исполнитель, у меня есть коллекция концертных блюреев. Классику же
> сегодня разве что в этих самых играх и услышишь. Ещё можно
> в аниме натуральные инструментальные исполнения найти. А вот рок сам по
> себе попса в худшем смысле, только устаревшая, к тому же в
> нём обычно есть и семплы и постобработка. Я конечно не осуждаю
> ценителей живого натурального исполнения а ля Anal Cunt, но это немного
> не моё.

я любитель живого исполнения музыки и рок с текстами редко слушаю. скорее чистые композиции музыки без слов. так в роке так уж повелось исполнители песен не певцы. разве что кипелов во времена арии. ну и некоторые группы европейские и американские, где певцы - женщины. сам предпочитаю джемовать на гитаре с другими гитаристами через полностью аналоговое оборудование. гитара, лампа там и педальки. никакого компа. разве что минуса иногда с него.



"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено v_shestom , 17-Дек-22 03:04 
В принципе, звучит не хуже, чем минимум 1/3 фонотеки Spotify. Разве что битрейт оставляет желать лучшего.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Анонус , 16-Дек-22 13:01 
Интересно, а если Стабильную Диффузию тренировать не на спектрограммах, а на нотных листах, получится что-то более слушабельное?

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено devl547 , 16-Дек-22 13:27 
Для начала можно попробовать натренировать на басовых партиях. Правда может нажраться в итоге.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Анонус , 16-Дек-22 13:59 
нельзя.
басисты всегда отмороженные, возьмите любую (совершенно) группу - басист там будет самым обмороком.
нельзя подпускать к басу нейросеть, нельзя, одумайтесь, остановитесь

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Анонус , 16-Дек-22 14:03 
> нельзя.
> басисты всегда отмороженные, возьмите любую (совершенно) группу - басист там будет самым
> обмороком.
> нельзя подпускать к басу нейросеть, нельзя, одумайтесь, остановитесь

Тогда может виолончель? Она почти как бас, но не бухает.


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено лютый ж.... , 17-Дек-22 10:53 
>возьмите любую (совершенно) группу - басист там будет самым обмороком

genesis, pink floyd )


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Assador , 25-Дек-22 10:18 
О, да! Уотерс — образец адекватности! ))

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Sw00p aka Jerom , 17-Дек-22 13:58 
>нельзя.

тут надо добавить - OMG, SLAP :) Davie504


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено подрывник , 16-Дек-22 18:18 
Не получится. Оно не понимает пифагоровы расстояния (деление струны на 2, 3, 4, 5, 6, и 9) и прочитать ноты не сможет.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено warlock66613 , 16-Дек-22 18:41 
Результат, выдаваемый этой системой, напомнил анекдот, где у человека получалось печатать 1000 слов в в минуту. Даже cat /proc/kernel > /dev/dsp выдавал звук поприятнее.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено фывафыва , 16-Дек-22 19:03 
sudo cat /proc/kernel > /dev/dsp
zsh: permission denied: /dev/dsp
Как вы это делаете? Тоже хочу.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 16-Дек-22 19:49 
эмуляцию oss загрузи в ядре (через modprobe)

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Агл , 16-Дек-22 23:26 
следующими в очереди на замещение -- математики

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено fuggy , 16-Дек-22 23:51 
Зачем такая прослойка. Неужели нельзя было натренировать нейросеть на самых волнах, а не картинках спектрограмм? Ещё и пришлось приплетать алгоритм нахождения фазы.
Напоминает шутку, про починить двигатель автомобиля через выхлопную трубу.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 18-Дек-22 15:43 
> Неужели нельзя было натренировать нейросеть на самых волнах, а не картинках спектрограмм

Тогда это была бы другая нейросеть, не стейбл диффьюжн. Стейбл диффьюжн - это именно сетка, базово работающая с изображениями. Вот ребята попытались музыку перекодировать изображением


"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Геймер , 17-Дек-22 00:21 
Сочинение популярной массовой трёхаккордовой попмузыки не требует вообще никакого интеллекта. Какие-то слишком сложные симфонии сочиняет этот ваш AI Стэбл Дифужэн.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Аноним , 17-Дек-22 22:58 
В общем, человек не нужен, мы поняли

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Нет времени обьъяснять , 22-Дек-22 23:03 
Для поколения зуммеров музыка вполне приемлемого качества. Думаю для 99% современной молодёжи лучше и не придумаешь - надо же заполнить нишу которую занимали рэперы-наркоманы с ужасной дикцией.

"Система машинного обучения Stable Diffusion адаптирована для..."
Отправлено Bob , 14-Янв-23 21:04 
Зовите GPT Chat - надо пару песен написать!