Нейросеть по заказу Сбера записала музыкальный альбом. Для супермаркетов – годно!

Все композиции написаны без участия человека. Мы отдали их послушать профессиональным музыкантам.

Предыстория

СберЗвук опубликовал альбом Thriving Machine, который целиком написала нейросеть. Альбом доступен всем подписчикам сервиса, а остальные могут послушать первые 30 секунд каждого трека.

Thriving Machine содержит треки разных направлений: ambient, lounge, рок, хаус, псевдоклассика и других.

Выход альбома Сбер приурочил к международной конференции по искусственному интеллекту и анализу данных – AI Journey 2021.

Как нейросеть писала музыку

Чтобы сгенерировать 15 треков, SymFormer обучался на 160 тысячах образцов из разных жанров. Примечательный факт: весь процесс обучения и работы проводился на «Кристофари» – суперкомпьютере, который построил Сбером.

Создание каждого трека проходило поэтапно:

  • анализ заданного человеком жанра музыки и генерация «скелета» композиции;
  • генерация бита, тембров, темпов, наложение инструментов – создание нескольких треков;
  • выбор наиболее удачных и релевантных требуемому стилю вариантов (силами искусственного интеллекта).

Обложку Thriving Machine тоже сгенерировала нейронная сеть. И названия треков придумал искусственный интеллект:

Слишком пафосно получилось, не находите?

##READMORE_BLOCK_94980##

Thriving Machine – знаковое событие, ведь альбом целиком создала нейронная сеть. Пусть сам по себе он не представляет выдающейся художественной ценности, это важный этап развития ИИ.

Я бы даже не заметил, что эту музыку написала машина. Мне кажется, треки хорошо дополнят коллекцию фоновой музыки в супермаркете, но вряд ли будут расцениваться серьезно и сейчас, и, тем более, через десятки лет.

Я не уверен, что такую музыку нужно оценивать, но вот мои мысли: несмотря на множество тембров и попытки имитации разных стилей, звучание всех треков довольно однообразное.

Слышно, что нейросеть обучалась на образцах популярной музыки. Гармонические ходы – самые простые. Быстро приедается почти одинаковый набор сэмплов и бит во многих треках.

Вся «попса», народная музыка строится по стандартному гармоническому принципу: T-S-D-T (прим.ред. – тоника – субдоминанта – доминанта – тоника), который прослеживается и в этих композициях. Они звучат банально и однородно, потому что созданы машиной. Композитор-человек, даже зная музыкальные правила, отходит от них и создает шедевр.

Машину в данном случае обучали на примере популярных песен, часто написанных непрофессионалами на двух аккордах. Ожидать при этом большой оригинальности от нейросети, конечно, не стоит: чему мы ее научили, то она и выдала.