2026. 02. 15. - 12:00
A valóság dekódolása: ez a mesterséges intelligencia elemzi a világ összes videóját
Tokiótól az Egyesült Államokig: új mesterséges intelligencia platform indul a globális piacon és ez sok mindenre hatással lehet.
A vállalatok soha nem látott mennyiségű videóanyagot halmoztak fel az elmúlt években, amelynek jelentős része elemzés nélkül pihen szervereken. A TechCrunch beszámolója szerint két korábbi Google szakember, Aza Kai és Hiraku Yanagita erre a problémára építette fel az InfiniMind nevű startupot, amely mesterséges intelligencia segítségével strukturált, lekérdezhető üzleti adattá alakítja a videó és hang állományokat.
A háttérben a látás nyelvi modellek ugrásszerű fejlődése áll. A TechCrunch cikke rámutat, hogy 2021 és 2023 között a mesterséges intelligencia képességei túlléptek az egyszerű objektumfelismerésen. A rendszerek már képesek narratívákat értelmezni, ok okozati összefüggéseket feltárni és komplex kérdésekre válaszolni több száz órányi felvétel alapján.
Az InfiniMind első terméke, a TV Pulse, valós időben elemzi a televíziós tartalmakat, követi a márkamegjelenéseket és a fogyasztói reakciókat. A TechCrunch szerint a vállalat már fizető ügyfelekkel rendelkezik Japánban, miközben 5,8 millió dolláros kezdő tőkét vont be nemzetközi befektetőktől.

A mesterséges intelligencia, mint a valóság értelmezője
A DeepFrame nevű platform képes akár kétszáz órányi videó feldolgozására, hogy pontos jeleneteket, szereplőket vagy eseményeket azonosítson. A rendszer nem igényel programozást az ügyfelek részéről, a mesterséges intelligencia önállóan dolgozza fel a feltöltött adatokat, miközben a hang és beszéd elemzését is integrálja.
A videóelemzési piac széttagolt, számos szereplő kínál általános megoldásokat. Az InfiniMind azonban kifejezetten vállalati felhasználásra koncentrál, beleértve a biztonsági, kiskereskedelmi és médiaipari alkalmazásokat. A cél nem csupán a tartalom címkézése, hanem a valóság mélyebb megértése mesterséges intelligencia segítségével.
A fejlesztők szerint a videó intelligencia az egyik lépés az általános mesterséges intelligencia felé vezető úton. A valóság strukturált értelmezése nemcsak üzleti előnyt jelent, hanem új dimenziót nyit az ember és a technológia együttműködésében.

