2025. 08. 17. - 10:00

A DeepSeek titkos küzdelme: késik a világ egyik legfejlettebb MI modellje

A DeepSeek titkos küzdelme: késik a világ egyik legfejlettebb MI modellje

A Financial Times szerint a kínai DeepSeek kísérlete a Huawei chipekkel történő modell tréningre komoly technikai akadályokba ütközött, de a vállalat továbbra is hisz a mesterséges intelligencia jövőjében.

A kínai DeepSeek, amely a generatív mesterséges intelligencia területén közvetlen riválisa a ChatGPT-nek, egy merész lépésre szánta el magát: a legújabb R2 modelljét teljes egészében kínai fejlesztésű Huawei Ascend chipekkel szerette volna betanítani. A Financial Times riportja szerint a projekt célja nem csak a technológiai önállóság demonstrálása volt, hanem annak bizonyítása is, hogy Kína képes az amerikai Nvidia processzorokat helyettesíteni. A tét óriási volt, hiszen a mesterséges intelligencia modell tréning az egyik legnagyobb számítási kapacitást igénylő folyamat, amelyre a 6G hálózatok érkezésével még nagyobb igény mutatkozik majd.
 
A valóság azonban sokkal keményebbnek bizonyult: a Huawei chipekkel végzett tréning során a DeepSeek mérnökei folyamatos stabilitási problémákkal, lassabb adatkapcsolattal és gyengébb szoftveres ökoszisztémával szembesültek, mint amit az Nvidia rendszerei kínálnak.
 
Végül a vállalat kénytelen volt kompromisszumot kötni: az R2 modellt Nvidia chipekkel tanították be, a Huawei hardverét pedig csupán az úgynevezett inference, azaz a kész modell futtatása során használják. Ez a döntés ugyan lehetővé tette a fejlesztés folytatását, de hónapokkal hátráltatta a tervezett premier időpontját.
 
 
deepseek_huawei_torzs
A mesterséges intelligencia harca a hardver korlátokkal 
 
A történet jól példázza, mennyire összetett feladat a mesterséges intelligencia ökoszisztémájának kiépítése, ha egy ország technológiai függetlenséget szeretne elérni. Bár a Huawei mérnökei személyesen is bekapcsolódtak a DeepSeek munkájába, a Financial Times értesülései szerint egyetlen teljes, sikeres tréningfutást sem tudtak végrehajtani az Ascend processzorokkal.
 
Ez azonban nem jelenti azt, hogy a jövőben ez ne sikerülhetne: iparági szakértők szerint idő kérdése, hogy a kínai chipgyártás felzárkózzon a vezető amerikai megoldásokhoz.
 
Liang Wenfeng, a DeepSeek alapítója belső körben ismerte el, hogy elégedetlen az R2 jelenlegi állapotával és hosszabb fejlesztési ciklust tart szükségesnek ahhoz, hogy a cég megőrizze erős pozícióját a mesterséges intelligencia területén. A 6G elterjedésével a hatalmas adatfeldolgozási kapacitás még fontosabb lesz és a hardveres korlátok áttörése kulcsfontosságú tényezővé válik minden piaci szereplő számára.
 
 

Hírlevél feliratkozás

Kérjük, add meg adataidat a hírlevélre történő feliratkozáshoz! A megadott adatokat bizalmasan kezeljük, azokat harmadik félnek át nem adjuk.