2025. 08. 17. - 10:00

A DeepSeek titkos küzdelme: késik a világ egyik legfejlettebb MI modellje

A Financial Times szerint a kínai DeepSeek kísérlete a Huawei chipekkel történő modell tréningre komoly technikai akadályokba ütközött, de a vállalat továbbra is hisz a mesterséges intelligencia jövőjében.

A kínai DeepSeek, amely a generatív mesterséges intelligencia területén közvetlen riválisa a ChatGPT-nek, egy merész lépésre szánta el magát: a legújabb R2 modelljét teljes egészében kínai fejlesztésű Huawei Ascend chipekkel szerette volna betanítani. A Financial Times riportja szerint a projekt célja nem csak a technológiai önállóság demonstrálása volt, hanem annak bizonyítása is, hogy Kína képes az amerikai Nvidia processzorokat helyettesíteni. A tét óriási volt, hiszen a mesterséges intelligencia modell tréning az egyik legnagyobb számítási kapacitást igénylő folyamat, amelyre a 6G hálózatok érkezésével még nagyobb igény mutatkozik majd.

A valóság azonban sokkal keményebbnek bizonyult: a Huawei chipekkel végzett tréning során a DeepSeek mérnökei folyamatos stabilitási problémákkal, lassabb adatkapcsolattal és gyengébb szoftveres ökoszisztémával szembesültek, mint amit az Nvidia rendszerei kínálnak.

Végül a vállalat kénytelen volt kompromisszumot kötni: az R2 modellt Nvidia chipekkel tanították be, a Huawei hardverét pedig csupán az úgynevezett inference, azaz a kész modell futtatása során használják. Ez a döntés ugyan lehetővé tette a fejlesztés folytatását, de hónapokkal hátráltatta a tervezett premier időpontját.

Olvasd el: James Cameron: Nem félni kell a generatív MI-től, hanem mesterévé válni!

A mesterséges intelligencia harca a hardver korlátokkal

A történet jól példázza, mennyire összetett feladat a mesterséges intelligencia ökoszisztémájának kiépítése, ha egy ország technológiai függetlenséget szeretne elérni. Bár a Huawei mérnökei személyesen is bekapcsolódtak a DeepSeek munkájába, a Financial Times értesülései szerint egyetlen teljes, sikeres tréningfutást sem tudtak végrehajtani az Ascend processzorokkal.

Ez azonban nem jelenti azt, hogy a jövőben ez ne sikerülhetne: iparági szakértők szerint idő kérdése, hogy a kínai chipgyártás felzárkózzon a vezető amerikai megoldásokhoz.

Liang Wenfeng, a DeepSeek alapítója belső körben ismerte el, hogy elégedetlen az R2 jelenlegi állapotával és hosszabb fejlesztési ciklust tart szükségesnek ahhoz, hogy a cég megőrizze erős pozícióját a mesterséges intelligencia területén. A 6G elterjedésével a hatalmas adatfeldolgozási kapacitás még fontosabb lesz és a hardveres korlátok áttörése kulcsfontosságú tényezővé válik minden piaci szereplő számára.

Olvasd el ezt is: A Microsoft új kísérlete: bárki készíthet 3D modellezést percek alatt

CS.SZ.