A Baidu nyílt forráskódú ERNIE 4.5-je a DeepSeek riválisával szemben
A kínai technológiai óriás, a Baidu nagyszabású lépést tett a nyílt forráskódú mesterséges intelligencia terén, kiadva új ERNIE 4.5 modellcsaládjának tíz különböző verzióját. Köztük egy figyelemre méltó, 424 milliárd paraméteres multimodális rendszer is, amely képes túlszárnyalni a DeepSeek V3-at kulcsfontosságú teszteken, annak ellenére, hogy mérete csupán a fele. Ez a lépés jelentős változást jelez a Baidu stratégiájában, és felerősíti a kínai AI-versenyt.
- Az ERNIE 4.5 modellek paraméterei a legkisebb, 300 milliós verziótól a legnagyobb, 424 milliárdos rendszerekig terjednek.
- Minden modell az Apache 2.0 licenc alatt érhető el, a Hugging Face platformon keresztül.
- A Baidu legnagyobb modellje 28 referenciapontból 22-ben felülmúlja a DeepSeek V3 teljesítményét.
A Baidu belép a nyílt forráskódú AI-versenybe
A kínai technológiai piac egyik meghatározó szereplője, a Baidu meglepő, de annál jelentősebb lépésre szánta el magát: nyílt forráskódúvá tette új ERNIE 4.5 modellcsaládjának tíz különböző változatát. Ezzel az óriásvállalat éles versenyt indít az AI-piacon, különösen a DeepSeek ellenében, amely eddig jelentős pozíciókat foglalt el a nyílt forráskódú modellek terén.
Az ERNIE 4.5 modellcsalád kiemelt tagja egy lenyűgöző, 424 milliárd paraméteres multimodális rendszer, amely a szöveges és vizuális adatok feldolgozására egyaránt képes. Ami igazán figyelemre méltó, hogy ez a modell, bár mindössze fele akkora, mint a DeepSeek V3, kulcsfontosságú teszteken mégis felülmúlja riválisát.
Technológiai részletek és teljesítmény
A Baidu ERNIE 4.5 modelljei széles skálán mozognak a paraméterek számát illetően. A legkisebb változatok 300 millió paraméterrel rendelkeznek, míg a sorozat zászlóshajója a már említett 424 milliárd paraméteres rendszer. Fontos kiemelni, hogy mindegyik modell az Apache 2.0 licenc alatt vált elérhetővé a Hugging Face platformon, ami széles körű hozzáférést és felhasználást tesz lehetővé a fejlesztői közösség számára.
A modellek hatékonyságát egy „heterogén” képzési architektúra biztosítja, amely lehetővé teszi, hogy a szöveges és vizuális képességek ne versengjenek egymással az erőforrásokért, hanem kölcsönösen erősítsék egymást. Ez az innovatív megközelítés hozzájárul a jobb teljesítményhez és az erőforrások optimalizálásához.
A Baidu legnagyobb modellje 28 referenciapontból 22-ben felülmúlta a DeepSeek V3-at, ami komoly jelzés az erejéről. Emellett az ERNIE 4.5 variánsai a piac más nagy szereplőivel, mint az o1, a GPT 4.1 és a Qwen 3 modellekkel is felveszik a versenyt különböző feladatokban, igazolva sokoldalúságukat és robusztusságukat.
Miért fontos ez a lépés?
Ez a nyílt forráskódú bemutatkozás különösen figyelemre méltó, tekintettel arra, hogy mindössze egy évvel ezelőtt a Baidu vezérigazgatója még kritizálta ezt az irányt, különösen a DeepSeek megjelenése előtt. A cég irányváltása arra utal, hogy a nyílt forráskódú AI-modellek terén zajló verseny és innováció immár megkerülhetetlen tényezővé vált.
Míg az Egyesült Államokban az OpenAI, a Google és az Anthropic között zajlik éles AI-verseny, Kínában is egyre intenzívebbé válik a küzdelem az óriásvállalatok, mint a Baidu, a ByteDance, az Alibaba, a Tencent és a DeepSeek között. Ezek a vállalatok folyamatosan feszegetik a határokat a modellkiadások sebességében és a nyílt forráskódú AI-ranglisták élén álló megoldások minőségében, ezzel dinamikusan alakítva a globális mesterséges intelligencia fejlődését.