2019. 05. 29. - 10:00
Arcot kapcsol a hanghoz a mesterséges intelligencia
A mesterséges intelligencián alapuló hang- és videómanipuláció egyre nagyobb fejlődést mutat. Újabban már arcot is tud társítani az MI egy személy hangjához.
Tagadhatatlan, hogy hihetetlen iramban fejlődik a mesterséges intelligencia és az arra alapozott videó-, illetve hangmanipuláció.
Most olyan speciális algoritmus született a neurális hálózathoz, amely képes egy személy hangjához arcot is kapcsolni – a fejlesztés az MI-projektek terén méltán híres Massachusettsi Műszaki Egyetem érdeme.
A kutatók intelligens biológiai ihletésű szimulációt alkottak, ez a mesterséges neuronháló, amely képes a tanulásra.
A mesterséges intelligencia már arcot is tud társítani a hanghoz
A meghökkentő képességekkel bíró hálózat hang alapján meg tudja különböztetni egymástól a nemet, a kort, a faji hovatartozást. Ehhez a kiemelkedő eredményez az kellett, hogy a neurális hálózatnak csaknem 1 millió különböző képanyagot mutassanak, rajtuk nagyjából 100 ezer, egymástól eltérő emberrel. A program a videó- és hangsávokat külön tudja kezelni.
A neuronháló a képarzenál alapján előbb szemből kezdi elkészíteni az emberi arcot, ezt követően ismét analizálja az adott hangspektrumot. A végeredmény: megalkotta a hanghoz tartozó emberi arcot.
A mesterséges intelligencia lényegében megtanulta az emberi megjelenés számos jellemzőjének beazonosítását, bár nem teljesen tökéletesen.
Egy biztos, a program még igényel némi tökéletesítést – ám jelenlegi formájában is képes egyes technológiákkal karöltve animált avatárok létrehozására.
A kutatók arra is rájöttek a közelmúltban, miként lehet statikus portrékat animáló neurális hálózaton alapuló algoritmust létrehozni – a portrékat ebben az esetben Gif-képpé lehet átalakítani, így tulajdonképpen lehetővé válik a híres, rég elhunyt személyek „újjáélesztése”.
László Adrienn