A chatbotok nem csak beszélni tudnak – gondolkodnak is a nyelven

Egy friss kutatás szerint a mesterséges intelligencia (AI) nyelvi modelljei, különösen az OpenAI o1-es modellje, már nem csupán utánozzák a nyelvet, hanem képesek megérteni annak mélyebb szerkezetét. Ez a felfedezés azt sugallja, hogy az AI a jövőben sokkal megbízhatóbban és árnyaltabban kommunikálhat velünk, értelmezve a bonyolult nyelvi jelenségeket, mint a rekurzió vagy a többértelműség.

Az OpenAI o1 nevű modellje figyelemre méltóan képes felismerni, feltérképezni és építeni a nyelvi rekurzió – a mondatokba ágyazott mondatok – összetett jelenségét.
A Kaliforniai Egyetem (Berkeley) nyelvész professzora, Gašper Beguš és kutatótársai által végzett tanulmány eredményei az IEEE Transactions on Artificial Intelligence szaklapban jelentek meg.
Ez az áttörés azt ígéri, hogy a jövő mesterséges intelligencia rendszerei sokkal stabilabbak lesznek a gondolkodásban és képesek lesznek pontosabban értelmezni akár irodalmi vagy jogilag igényes szövegeket is.

A nyelvi modellek fejlődése: Emberi szintre emelkednek?

A mesterséges intelligencia (AI) nyelvi modelljei napról napra kifinomultabbá válnak, felvetve a kérdést, vajon mikor érik el teljes mértékben az emberi nyelvi képességeket. A válasz, úgy tűnik, közelebb van, mint gondolnánk.

Egy friss tanulmányban kutatók kimutatták, hogy az OpenAI o1 nevű gondolkodási modellje képes felismerni, feltérképezni, sőt, építeni is az emberi nyelv egyik legösszetettebb jelenségére, a nyelvi rekurzióra. A rekurzió azt jelenti, hogy egy mondatban az egyik elemet a másikba ágyazzuk; analógia lehet erre „egy tó egy szigeten egy tóban” példája. Az eredményeket június 3-án publikálták az IEEE Transactions on Artificial Intelligence szaklapban.

A tanulmány társszerzője, Gašper Beguš a Kaliforniai Egyetem (Berkeley) nyelvész docense, akit mélyen érdekel a nyelv és az intelligencia kapcsolata. Kutatása a gépi és emberi tanulási formák összehasonlításával igyekszik megérteni azok különbségeit és erősségeit, valamint az AI korlátait biztonsági és szabályozási szempontból.

Metanyelvi képességek: Több mint szavak

Az új tanulmányban Beguš és munkatársai négy nagy nyelvi modell (LLM) metanyelvi képességeit vizsgálták: az OpenAI GPT-3.5 Turbo, GPT-4 és o1 modelljeit, valamint a Meta Llama 3.1-ét. Míg számos tanulmány azt vizsgálta, hogy ezek a modellek milyen jól képesek nyelvet produkálni, ez a kutatás kifejezetten a modellek nyelvelemző képességét – metanyelvi képességeit – vizsgálta.

Például, ha egy mondatnak több jelentése van, képesek-e a nyelvi modellek helyesen feltérképezni és „megérteni” az összes lehetséges jelentést? Beguš egy egyszerű, egy szóból álló példával szemlélteti ezt a kihívást. „Az angol „Unlockable” szónak például két jelentése van, magyarázza: „vagy nem lehet kinyitni, vagy ki lehet nyitni.”

Tanulmányukban a kutatók nehéz, több jelentéssel bíró, úgynevezett kétértelmű szerkezetű teljes mondatokkal tesztelték az AI-modelleket. Például: „Eliza wanted her cast out.” (Eliza azt akarta, hogy kizárják / Eliza azt akarta, hogy levegyék a gipszét). Míg mind a négy nyelvi modell helyesen azonosította a mondat kétértelmű szerkezetét, csak az o1 volt képes pontosan feltérképezni a mondatban rejlő összes lehetséges jelentést.

A rekurzió mesterei: Az o1 kiemelkedő képességei

Beguš hangsúlyozza, hogy a tanulmány legfontosabb előrelépése az o1 azon képessége volt, hogy sikeresen kezelte a nyelvi rekurziót. Egy mondatban lévő rekurzív elemre példa a következő mondat zárójelbe tett része: „A világnézet [amit Nietzsche prózája kifejezett] példátlan volt.” Sőt, akárcsak az orosz matrioska babák, a mondat rekurziót tartalmaz a rekurzión belül: „A világnézet [amit a próza [amit Nietzsche írt] kifejezett] példátlan volt.”

A nyelvi rekurziós kísérletben a kutatók arra kérték a nyelvi modelleket, hogy határozzák meg, egy adott mondat rekurzív-e, azonosítsák a rekurzív részt, rajzoljanak egy szintaktikai fát a mondatot ábrázolva, és adjanak hozzá egy újabb rekurziós réteget a mondathoz.

Mind a négy modell képes volt azonosítani a rekurzív mondatokat, de az o1 drámaian felülmúlta a többi modellt az összetett mondatszerkezet helyes feltérképezésében, 0,87 pontot ért el az 1-ből, szemben a régebbi AI-modellek átlagosan 0,36 pontos teljesítményével.

Beguš megjegyzi, hogy ezen rekurzív mondatok elemzése még az emberek számára sem könnyű feladat. „Ezek a legösszetettebb mondattípusok még az emberek számára is elemzésre” – mondja. Hozzáteszi, hogy a rekurzió az emberi nyelv egyik meghatározó jellemzője, amely régóta lenyűgözi a nyelvészeket. Egyetlen más állat sem mutatott ilyen bonyolultságot a kommunikációban. Az a tény, hogy az AI-modellek képesek azonosítani és elemezni a rekurziót, azt mutatja, hogy képesek magas szintű nyelvi komplexitásra, mondja Beguš.

Hangtan és a nyelvi határok feszegetése

A kutatók a modellek fonológiai (hangtani) szabályok elemzésére való képességét is tesztelték, amelyek a hangok szerveződését jelentik egy nyelven belül. Ebben a kísérletben a kutatók kitalált nyelveket használtak, hogy az AI-modellek ne memorizálásra támaszkodjanak, hanem magát a szóstruktúrát elemezzék. Például megkérdezték a modelleket, hogy egy mássalhangzót mikor kell hosszúnak vagy rövidnek ejteni. Az o1 ismét jelentősen felülmúlta a többi modellt, 30 esetből 19-ben azonosította a fonológiai szabályok helyes feltételeit.

Beguš hangsúlyozza, hogy meg kell érteni, meddig juthatnak el ezek a modellek nyelvi képességeikkel, különösen a biztonság és a szabályozás szempontjából. „Azt mutatjuk, hogy a léc már elég magasan van, és elérik azt” – mondja.

De elgondolkodik azon, mennyire juthatnak még messzebb a modellek. Sikerülhetne-e nekik három rekurziós réteg elemzése? Mi a helyzet öttel vagy tízzel? „Hol állnak meg [a modellek]? Mert e kutatás nagy célja az, hogy valóban megértsük, mik a határaik?” – mondja. „Ez az egymillió dolláros kérdés.”

Miért fontos ez? Az mesterséges intelligencia a nyelv mélyebb megértését fejleszti ki – elmozdítva minket a puszta szimulációtól a valós kommunikáció felé.

Forrás: https://spectrum.ieee.org/ai-linguistics

Szerző: Szuhi Attila

Követhetsz

Share 0

Írd meg a véleményed!

Cikkek a témában

július 25, 2025

A chatbotok nem csak beszélni tudnak – gondolkodnak is a nyelven

A nyelvi modellek fejlődése: Emberi szintre emelkednek?

Metanyelvi képességek: Több mint szavak

A rekurzió mesterei: Az o1 kiemelkedő képességei

Hangtan és a nyelvi határok feszegetése

Szerző: Szuhi Attila

Írd meg a véleményed!

Az OpenAI előkészíti a GPT-5-öt az augusztusi debütálásra

Az OpenAI másodpilótája csökkenti az orvosi hibákat Kenyában

A Google mesterséges intelligencia segítségével dekódolja az ókori Rómát

Az Egyesült Államok átfogó mesterségesintelligencia-akciótervet tesz közzé

INGYENES!

TÖLTSD LE A GOOGLE 100 SEO TANÁCSÁT