2022. 10. 12. - 09:40
Tévéző macska és bolyhos lajhárbaba - Videókat generál szövegből a Meta-féle mesterséges intelligencia
Mesterséges intelligencia használatával generál videókat a Meta szöveg alapján, a „make-a-video” funkcióval. A csúcstechnológia segítségével bármilyen vízió „életre kelthető”.
Videókat generál szövegből „make-a-video” funkcióval a Meta új mesterséges intelligenciája. A Facebook cége csúcstechnológiának nevezi új rendszerét, a Make-A-Video-t.
Egy közelmúltbeli fejlesztésen alapul, a szövegből képpé generáló technológián keresztül, amely leírások segítségével mozgóképeket vág ki szövegekből. A Meta szárnyai alá vette a fejlesztést, s így lehetővé tette, hogy a felhasználók saját GIF-et vagy videót készítsenek néhány szó vagy szövegsor segítségével. Olvasd el: Képpé alakít bármely szöveget a Google legújabb mesterséges intelligencia-eszköze
A fejlesztő csapat kipróbált néhány leírást, például: „Egy kutya szuperhős ruhában, vörös köpennyel repül át az égen”, „Macska tévét néz távirányítóval a kezében”, „Olajfestmény egy házaspár hivatalos estélyi ruházatáról, akik éppen hazamennek, esernyőkkel, heves felhőszakadásban”, és „Egy bolyhos lajhárbaba narancssárga kötött sapkával ismerkedik egy laptoppal, a képernyő rendkívül részletgazdag, amely tükröződik a szemében.”
Videókat generál szövegből a Meta-féle mesterséges intelligencia
Úgy tűnik, az első két esetben pontos kép született, csupán néhány szóval, míg az utóbbi kettő esetben - bár pontos képeket is közölt a rendszer, több részletet igényelt. Ennek ellenére azonban a mozgóképek rögzítették a leírásokat a csapat szövegeiből.
A Meta szerint a Make-A-Video lehetőségeket nyit meg a tartalomkészítők és művészek előtt: eszközöket kínál számukra, melyek segítségével gyorsan és egyszerűen hozhatnak létre új tartalmat a generatív mesterséges intelligencia (MI) segítségével.
„A rendszer a párosított szöveg-képadatokból tanulja meg, a hozzá tartozó szöveg nélküli videofelvételekből, hogyan néz ki és hogyan mozog a világ - írta Meta. - A rendszer képes videókat is készíteni képekből, vagy meglévő videók alapján hasonlókat készíteni.”
Hozzátették: szeretnék átgondolni, hogyan építsenek új, ehhez hasonló generatív mesterséges intelligencia-rendszereket.
A felhasználók egyébként statikus képet is feltölthetnek, a Meta Make-A-Video mozgóképpé alakítja azt, köszönhetően a generatív MI technológiának.
A Make-A-Video nyilvánosan elérhető adatkészleteket használ, a Meta pedig nyíltan megosztja generatív mesterséges intellingencia-kutatásait és eredményeit közösségével, mert szeretnének visszajelzést kapni.
Állítása szerint továbbra is használja majd „felelős mesterséges intelligencia keretrendszerét”, hogy finomítsa és fejlessze a feltörekvő technológiával kapcsolatos megközelítést. Olvasd el: Mesterséges intelligencia készít videókat az őseinkről
Bármilyen vízió megvalósítható a Meta mesterséges intelligenciájával
A Make-A-Video forrásadatai több millió adatot elemeznek a világ megismeréséhez. Ahhoz, hogy csökkentsék a káros tartalom létrehozásának kockázatát, a fejlesztőcsapat megvizsgálja, alkalmazza és ismételgeti a szűrőket.
A Meta okkal tesz minden videójára vízjelet. „Ez segít abban, hogy a nézők tudják: a videót mesterséges intelligencia segítségével hozták létre és nem rögzített videóról van szó" – jelezte a vállalat.
L.A.