2025. 06. 26. - 09:35

Önmagát képző mesterséges intelligencia-modellt hozott létre a Massachusetts-i Technológiai Intézet

Önmagát képző mesterséges intelligencia-modellt hozott létre a Massachusetts-i Technológiai Intézet

Mesterséges intelligencia-modellt alkotott meg a Massachusetts-i Technológiai Intézet (MIT), amely önmagát képes képezni. A fejlesztés jelentős lépés a független MI-modellek létrehozása felé.

Önmagát képző mesterséges intelligencia-modellel állt elő a Massachusetts-i Technológiai Intézet (Massachusetts Institute of Technology - MIT).
 
A kutatók egy új keretrendszert fejlesztettek ki, amely lehetővé teszi a nagy nyelvi modellek (LLM-ek) számára az önképzést – ez pedig jelentős előrelépés a MI-fejlesztésben.
 
Régóta várt mérföldkő
 
Az új keretrendszer - az úgynevezett Self-Adapting Language Models, vagy SEAL - lehetővé teszi az LLM-ek számára, hogy saját képzési adatokat és oktatási frissítéseket generáljanak, s ezzel egyben folyamatosan felülvizsgálják belső rendszereiket emberi beavatkozás nélkül.
 
Az önfejlesztés újszerű képessége régóta várt mérföldkő a területen – jegyezte meg a kutatócsapat.
 
„Az LLM-ek hatékonyak, de statikusak; hiányoznak belőlük azok a mechanizmusok, amelyekkel súlyaikat az új feladatokhoz, ismeretekhez vagy példákhoz igazíthatnák” – jelezték a fejlesztésről szóló cikkben. Olvasd el: Mesterséges neurális hálózatok belső működése segít az MI megértésében
 
algorithms_1
 
„Bemutatjuk a SEAL-t, egy olyan keretrendszert, amely megoldja az LLM-ek számára, hogy saját finomhangoló adataik és frissítési direktívák generálásával önadaptáljanak… lehetővé téve a tartós alkalmazkodást.”
 
Testre szabott, saját oktatási stratégia
 
Hagyományosan a nyelvi modellek finomhangolással vagy kontextuson belüli tanulással alkalmazkodnak az új feladatokhoz, emberek által kurált és formázott adatokra támaszkodva.
 
Ennek a megközelítésnek azonban vannak korlátai - a kutatók megjegyzik, hogy a rendelkezésre bocsátott adatok „nem mindig optimálisak a modell hatékony tanulásához”.
 
A SEAL azonban lehetővé teszi a modell számára, hogy eldöntse, hogyan tanuljon a legjobban az új információkból és testre szabja saját oktatási stratégiáját.
 
A kutatócsoport megerősítéses tanulást is alkalmazott a rendszer betanításához, beleértve a ReST algoritmust, amely kiértékeli és jutalmazza a leghatékonyabb „önszerkesztéseket” – a modell által generált finomhangoló irányelveket.
 
A tesztekben a SEAL-lal betanított modellek több feladat során is drámai mértékben felülmúlták a standard LLM-eket - például a GPT-4.1.
 
Egy kísérletben a rejtvénymegoldási teljesítmény 0-ról 72,5 százalékra emelkedett a modell saját, önmaga által generált tananyagának használatával.
 
Intelligensebb chatbotok és virtuális asszisztensek
 
A csapat szerint az eredmények rövid távon intelligensebb chatbotok és virtuális asszisztensek kifejlesztéséhez vezethetnek, amelyek alkalmazkodnak az egyes felhasználók preferenciáihoz és folyamatosan frissítik magukat új információkkal.
 
A tanulmány utat nyithat azon modelleknek is, amelyek képesek eldönteni, mikor alkalmazkodnak az új információkhoz és önállóan határozhatnak arról is, szükség van-e önszerkesztésre – vélik a kutatók.
 
Az ilyen fejlesztések olyan ágensalapú MI-ágensek létrehozásához vezethetnek, amelyek képesek folyamatos fejlesztésre interakció és reflexió révén.
 
A rendszernek ugyanakkor megvannak a korlátai. A kutatócsapat szerint a modell „katasztrofális felejtéstől” szenved, amikor régebbi feladatok és ismeretek eltűnnek az újabb bemenetek hozzáadásával.
 
„Ez arra utal, hogy a tudásmegőrzés explicit mechanizmusai nélkül az önmódosítás felülírhatja az értékes korábbi információkat” – jelezték a szakemberek.
 
Hozzátették azonban: a kihívás kezelése folyamatban van. A lehetséges megoldások közé tartozik az újrajátszás, a korlátozott frissítések vagy a reprezentációs szuperpozíció.
 
 
B.A.

 

Hírlevél feliratkozás

Kérjük, add meg adataidat a hírlevélre történő feliratkozáshoz! A megadott adatokat bizalmasan kezeljük, azokat harmadik félnek át nem adjuk.