Kínai tudósok áttörést jelentő kutatása megerősítette, hogy a mesterséges intelligencia (MI) képes spontán módon kialakítani az emberi szintű megismerést, ami azt jelenti, hogy az MI modellek nem csupán felismerik, hanem valójában meg is értik a valós világ tárgyait és fogalmait, hasonlóan az emberekhez.

Illusztráció: MI-alkalmazások használata mobiltelefonon keresztül. Fotó: VCG

Egy áttörést jelentő kínai tudományos kutatás bebizonyította, hogy a mesterséges intelligencia (MI) technológián alapuló multimodális nagyméretű nyelvi modellek (LLM-ek) spontán módon képesek kialakítani egy olyan tárgyfogalom-reprezentációs rendszert, amely rendkívül hasonló az emberi kognícióhoz. Egyszerűbben fogalmazva: az MI spontán módon fejleszti ki az emberi szintű megismerést.

A Kínai Tudományos Akadémia (CAS) Automatizálási Intézetének, Idegkutatási Intézetének, valamint más együttműködő partnerek kutatócsoportjai végezték el a tanulmányt. Az eredményekről szóló tanulmány június 9-én jelent meg online a Nature Machine Intelligence című rangos folyóiratban. A publikáció szerint a felfedezések előreviszik a gépi intelligencia megértését, és hozzájárulnak az emberibbé váló mesterséges kognitív rendszerek fejlesztéséhez.

Az emberi megismerés és az MI kihívása

Az emberek képesek fogalmilag megragadni a természeti világ tárgyait, és ezt a kognitív képességet régóta az emberi intelligencia alapjának tekintik. Amikor az emberek látnak egy „kutyát”, „autót” vagy „almát”, nemcsak fizikai jellemzőiket (méret, szín, forma stb.) ismerik fel, hanem megértik funkcióikat, érzelmi értéküket és kulturális jelentésüket is – magyarázta Du Changde, a CAS Automatizálási Intézetének munkatársa és a tanulmány első szerzője. Du szerint az ilyen többdimenziós fogalmi reprezentációk alkotják az emberi megismerés alapkövét.

Az utóbbi években, az olyan nagyméretű nyelvi modellek (LLM-ek), mint a ChatGPT robbanásszerű fejlődésével felmerült az alapvető kérdés, hogy vajon ezek a modellek képesek-e az emberihez hasonló tárgyfogalom-reprezentációkat kialakítani a nyelvi és multimodális adatokból. Ez a kérdés széles körű figyelmet kapott.

He Huiguang, a CAS Automatizálási Intézetének kutatója és a tanulmány levelező szerzője rámutatott, hogy a hagyományos MI-kutatás az objektumfelismerés pontosságára összpontosított, ritkán vizsgálva azt, hogy a modellek valóban „megértik-e” a tárgyak jelentését. „A jelenlegi MI képes megkülönböztetni a macskák és kutyák képeit, de az e ’felismerés’ és az emberi ’megértés’ közötti alapvető különbséget még tisztázni kell” – áll a CAS által a Global Timesnak küldött sajtóközleményben.

Áttörés a gépi „megértésben”

A kínai kutatócsoport viselkedési kísérleteket és neuroképalkotó elemzéseket kombinált, hogy feltárja az LLM-ek tárgyfogalom-reprezentációi és az emberi megismerés közötti kapcsolatot. 4,7 millió hármas ítéletet gyűjtöttek össze LLM-ektől és multimodális LLM-ektől, hogy alacsony dimenziójú beágyazásokat nyerjenek, amelyek 1854 természetes objektum hasonlósági struktúráját rögzítik.

Az ebből adódó 66 dimenziós beágyazások stabilan prediktívek voltak, és szemantikai klaszterezést mutattak, hasonlóan az emberi mentális reprezentációkhoz. Figyelemre méltó, hogy az alapul szolgáló dimenziók értelmezhetők voltak, ami arra utal, hogy az LLM-ek és a multimodális LLM-ek emberihez hasonló fogalmi reprezentációkat alakítanak ki a tárgyakról.

A csapat ezután összehasonlította az LLM-ek és az emberek viselkedési választási mintáinak konzisztenciáját, és az eredmények azt mutatták, hogy az LLM-ek jobban teljesítettek a konzisztencia tekintetében. A tanulmány azt is feltárta, hogy az emberek hajlamosak a vizuális jellemzőket és a szemantikai információkat kombinálni a döntéshozatal során, míg az LLM-ek inkább a szemantikai címkékre és az absztrakt fogalmakra támaszkodnak.

He Huiguang szerint a tanulmány áttörést hozott a „gépi felismerésből” a „gépi megértésbe”. Az eredmények azt mutatják, hogy az LLM-ek nem „sztochasztikus papagájok”. Ehelyett ezek a modellek belső megértéssel rendelkeznek a valós világbeli fogalmakról, nagyon hasonlóan az emberekhez. A fő megállapítás az, hogy a „mentális dimenzió” különböző utakon keresztül ér el hasonló kognitív célokat.

Forrás:

Szerző: Szuhi Attila

Írd meg a véleményed!

Az e-mailcímed nem lesz nyilvános. A * jelölt mezők kötelezőek.

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Cikkek a témában

június 23, 2025

Az Intel kiszervezi marketingjét az Accenture-nek és az

június 23, 2025

A brit telekommunikációs óriás, a BT vezérigazgatója, Allison

június 23, 2025

Friss kutatások rávilágítottak arra, hogy a vezető mesterséges

június 23, 2025

Apple, Meta: Kíméletlen vadászat mesterséges intelligencia tehetségekre és


INGYENES!

TÖLTSD LE A GOOGLE 100 SEO TANÁCSÁT

A Google 100 legfontosabb keresőoptimalizálási tanácsa!