Szövegből gyárt dallamokat a mesterséges intelligencia

A tokiói National Institute of Informatics intézet kutatói egy olyan gépi tanulási módszert fejlesztettek ki, amely képes tisztán a szövegekből hozzá passzoló dallamokat generálni. Teszi ezt azáltal, hogy a mesterséges intelligencia alapú rendszer képes kapcsolatokat teremteni a szavak és a szótagok között.
A kutatók szerint nagy kihívást jelent a dalszövegekből dallamokat felépíteni, de jó úton haladnak a fejlesztésben. A rendelkezésre álló szövegeket, a dallam-adatkészletet és a mesterséges intelligencia által erősített zenei tudásbázist fokozatosan fejlesztik, hogy egyre jobb és élvezetesebb eredmények születhessenek.
A mesterséges intelligencia segít a minőségibb zeneélmény elérésében
A rendszer kiképzésére a szakemberek 12.197 MIDI fájlból álló adatkészletet állítottak össze, amelyek mindegyikében dalszöveg- és dallamigazítást alkalmaztak. Ezek egy része nyílt forrású adatbázisból, másik része pedig a Reddit MIDI-adatkészletéből származik. Ehhez csaknem 21.000 egyedi szótagot és több mint 20.000 egyedi szót társítottak, részletes analízisnek vetve alá mindegyiket, hogy a lehető legjobb kombinációkat hozhassák ki belőle, amikor szükséges.Az elképzelések szerint a jövőben ez a fajta technológia más területeken is be tud segíteni. Ilyen lesz például az, hogy ha hiányzik a szövegből egy töredék (tehát a dalszöveg írójának nem jut eszébe egy rím vagy a megfelelő kifejezés), akkor a mesterséges intelligencia segít kiegészíteni. De az is megoldható lesz, hogy adott esetben a meglévő dallamhoz készít szöveget az MI.
A mesterséges intelligencia a zeneiparban már jelen van, és hamarosan egy igen fontos tényezője is lesz ennek a világnak. Ott van például az OpenAI és a Google, ami év elején debütált egy olyan online alkotóeszközzel, ami zenét generáló algoritmusokat használ. Nemrég pedig a Sony kutatói kezdtek bele egy projektbe, ahol gépi tanulási modellt alkottak meg a lábdob-hangzás generálására.
- Varga Viktor -