2022. 10. 12. - 09:40

Tévéző macska és bolyhos lajhárbaba - Videókat generál szövegből a Meta-féle mesterséges intelligencia

Mesterséges intelligencia használatával generál videókat a Meta szöveg alapján, a „make-a-video” funkcióval. A csúcstechnológia segítségével bármilyen vízió „életre kelthető”.

Videókat generál szövegből „make-a-video” funkcióval a Meta új mesterséges intelligenciája. A Facebook cége csúcstechnológiának nevezi új rendszerét, a Make-A-Video-t.

Egy közelmúltbeli fejlesztésen alapul, a szövegből képpé generáló technológián keresztül, amely leírások segítségével mozgóképeket vág ki szövegekből. A Meta szárnyai alá vette a fejlesztést, s így lehetővé tette, hogy a felhasználók saját GIF-et vagy videót készítsenek néhány szó vagy szövegsor segítségével. Olvasd el: Képpé alakít bármely szöveget a Google legújabb mesterséges intelligencia-eszköze

A fejlesztő csapat kipróbált néhány leírást, például: „Egy kutya szuperhős ruhában, vörös köpennyel repül át az égen”, „Macska tévét néz távirányítóval a kezében”, „Olajfestmény egy házaspár hivatalos estélyi ruházatáról, akik éppen hazamennek, esernyőkkel, heves felhőszakadásban”, és „Egy bolyhos lajhárbaba narancssárga kötött sapkával ismerkedik egy laptoppal, a képernyő rendkívül részletgazdag, amely tükröződik a szemében.”

Videókat generál szövegből a Meta-féle mesterséges intelligencia

Úgy tűnik, az első két esetben pontos kép született, csupán néhány szóval, míg az utóbbi kettő esetben - bár pontos képeket is közölt a rendszer, több részletet igényelt. Ennek ellenére azonban a mozgóképek rögzítették a leírásokat a csapat szövegeiből.

A Meta szerint a Make-A-Video lehetőségeket nyit meg a tartalomkészítők és művészek előtt: eszközöket kínál számukra, melyek segítségével gyorsan és egyszerűen hozhatnak létre új tartalmat a generatív mesterséges intelligencia (MI) segítségével.

„A rendszer a párosított szöveg-képadatokból tanulja meg, a hozzá tartozó szöveg nélküli videofelvételekből, hogyan néz ki és hogyan mozog a világ - írta Meta. - A rendszer képes videókat is készíteni képekből, vagy meglévő videók alapján hasonlókat készíteni.”

Hozzátették: szeretnék átgondolni, hogyan építsenek új, ehhez hasonló generatív mesterséges intelligencia-rendszereket.

A felhasználók egyébként statikus képet is feltölthetnek, a Meta Make-A-Video mozgóképpé alakítja azt, köszönhetően a generatív MI technológiának.

A Make-A-Video nyilvánosan elérhető adatkészleteket használ, a Meta pedig nyíltan megosztja generatív mesterséges intellingencia-kutatásait és eredményeit közösségével, mert szeretnének visszajelzést kapni.

Állítása szerint továbbra is használja majd „felelős mesterséges intelligencia keretrendszerét”, hogy finomítsa és fejlessze a feltörekvő technológiával kapcsolatos megközelítést. Olvasd el: Mesterséges intelligencia készít videókat az őseinkről

Bármilyen vízió megvalósítható a Meta mesterséges intelligenciájával

A Make-A-Video forrásadatai több millió adatot elemeznek a világ megismeréséhez. Ahhoz, hogy csökkentsék a káros tartalom létrehozásának kockázatát, a fejlesztőcsapat megvizsgálja, alkalmazza és ismételgeti a szűrőket.

A Meta okkal tesz minden videójára vízjelet. „Ez segít abban, hogy a nézők tudják: a videót mesterséges intelligencia segítségével hozták létre és nem rögzített videóról van szó" – jelezte a vállalat.

Olvasd el ezt is: Mi a GPT-3 és miért olyan megdöbbentően jó?

L.A.

Tévéző macska és bolyhos lajhárbaba - Videókat generál szövegből a Meta-féle mesterséges intelligencia

Hírlevél feliratkozás

Az Amazon új rendszere úgy működik, mint az emberi agy

A generatív MI hidat épít a tudás és a siker között

A generatív MI tervez, te viseled: ilyen lesz a jövő divat világa

Nagy segítség lehet az MI az ünnepi időszakban a magyar kkv-knak

Felnőttekkel erotikusan is cseveg majd a ChatGPT - Sam Altman bedobta a bombát

Gemini Enterprise: a Google új szuperügynöke