Szuhi Attila
Utoljára frissítve: március 26, 2023
Témakör: 

Mi az a gépi tanulás?

A gépi tanulás a mesterséges intelligencia kutatás egyik alkalmazási részterülete. Lényege, hogy a gép előre megadott minták alapján képes szabályszerűségeket feltárni. Ehhez matematikai modelleket használ. A tanulási folyamat eredményeképpen a későbbiekben képes a feltárt minták alapján ismeretlen adatokra vonatkozóan is helyes döntést hozni.

A lényeg tehát, hogy nem mondjuk meg közvetlen módon a gépnek, hogy mit kell tennie, hanem a kapott adatokból képes szabályszerűségeket feltárni.

A gépi tanulás v. angolul a machine learning az elmúlt években robbanásszerű fejlődésen ment keresztül és ma gyakran és tévesen a mesterséges intelligencia kutatással azonosítják.

A gépi tanulás közérthetően

A gépi tanulás egyik klasszikus példája a kézzel írt számjegyek. A feladat: meg kell neveznie a gépnek, hogy a kézzel írt számjegy milyen számjegynek felel meg. Ez a látszólag egyszerű feladat nem is olyan könnyű, hiszen a számjegyeket mindenki kicsit másképp írja le.

A gépi tanulás során rengeteg példát mutatunk a gépnek kézzel írt számjegyekről és meg is nevezzük, hogy az adott kép melyik számjegynek felel meg. Ez alapján a gép képes szabályszerűségeket meghatározni, és ezt követően már egy ismeretlen kézzel írt számjegyet is felismer.

Hasonló logika alapján készülnek az arcfelismerő rendszerek, de a gépi tanulás segíthet betegségek felismerésében is, hiszen a gép megtanulhatja, milyen tünetek milyen betegségekre utalhatnak.

A gépi tanulás gyökerei a statisztikában lelhetőek fel, amely úgy is felfogható, hogy az adatokból tudást, vagy információt akarunk kinyerni. Az olyan módszerek, mint a lineáris regresszió, vagy a bayesiánus statisztika, amely több mint két évszázada ismert ma is a modern gépi tanulás alapjait képezik.

Hol használható a gépi tanulás?

Egészségügy: A betegek adatainak és nyilvántartásainak kezelése, valamint a betegek diagnózisának előrejelzése az orvosok számára.

Pénzügyek: Hitelkártyával kapcsolatos csalások előrejelzése.

Biológia: A rákot jelentő génmutációk mintázatainak megtalálása.

Webes keresőmotor: Az olyan keresőmotorok, mint a Google, a Bing stb. azért működnek olyan jól, mert a rendszer egy összetett tanulási algoritmus segítségével megtanulta, hogyan rangsorolja az oldalakat.

Spamdetektor: A levelezőprogramunk, mint például a Gmail vagy a Hotmail, rengeteg munkát végez helyettünk a levelek osztályozásában és a spam e-mailek spam mappába való áthelyezésében.

Online vásárlás : A felhasználók viselkedése alapján termékek ajánlása egy webáruházban. Az Amazon bevételeinek 35%-át például a termékajánlásokból származik.

A gépi tanulás három típusa

A gépi tanulást gyakran osztályozzák az alapján, hogy milyen problémákat akarnak velük megoldani.

A gépi tanulás leggyakoribb osztályozása az alábbi:

Felügyelt tanulás (supervised learning): A felügyelt tanulás során a gép olyan adatokat kap, amit az emberek megcímkéznek számára. Például kap rengeteg e-mailt és a spam e-maileket az emberek előre megcímkézik. Ennek köszönhetően tudja majd a későbbiekben eldönteni egy e-mailről, hogy mutatja-e a spam jelleg sajátosságait.

Felügyelet nélküli tanulás: itt a gép nem kap előre címkézett adatokat, hanem neki kell az adatokban mintázatokat keresni. Ez azt is jelenti, hogy nincs előre eldöntött „helyes” válasz.

Megerősítéses tanulás: a gép egy visszacsatoláson keresztül tanul.

Lássuk ezeket picit részletesebben!

Felügyelt tanulás

Van egy bemeneti adatunk, például egy közlekedési lámpáról készült kép, a gépnek megmondjuk, hogy a képen melyik közlekedési lámpa ég. A gépnek megmondjuk azt is milyen kimenetek lehetségesek (piros/zöld/sárga). A gép a kapott képek alapján tanul és később egy teljesen új képet is meg tud címkézni. A legegyszerűbb esetekben, a válasz igen/nem formát ölthet (ezt nevezzük bináris osztályozási problémának).

A gépi tanulás legegyszerűbb esetei általában a felügyelt tanulás, és azon belül is az osztályozási feladatok. Nézzünk erre néhány példát!

Tegyük fel, hogy a közlekedési táblákról látott képeket kell osztályozni a mesterséges intelligenciának (megállni tilos, stop, gyalogos-átkelőhely, stb.).

De ilyen feladat lehet például a hamis Twitter fiókok kiszűrése (például bemeneti adat lehet a követők száma, a követők számának időbeli változása, stb.). Ugyan erre példa a már említett kézírás során a betűk, vagy számok azonosítása.

Felügyelet nélküli tanulás (unsupervised learning)

A felügyelt tanulással szemben ebben az esetben nincsenek címkék, vagy helyes kimenetek, válaszok. A feladat az, hogy fel kell ismerni az adatstruktúrákat. Például a hasonló dolgokat egy csoportba sorolni, vagy csökkenteni az adatmennyiséget egy kisszámú, de fontos dimenzióra. Az adatvizualizáció szintén tekinthető felügyelet nélküli tanulásnak

Megerősített tanulás (reinforcement learning)

Gyakran használják olyan helyzetekben, amikor egy mesterséges intelligenciának, például egy önvezető autónak olyan környezetben kell boldogulnia, ahol a jó és rossz döntésekről kis késéssel kap visszajelzést. A lényeg a pozitív vagy negatív visszajelzés, amelyből a gép tanulni tud, és végül eljut a megfelelő válaszig.

A megerősített tanulásra jó példa, amikor a gépeket különböző játékokra, például sakkra, vagy GO!-ra tanítják.

Természetesen a gépi tanulásnak ezek a kategóriái néha zavarosak, vagy átfedhetik egymást, így néha nem egyszerű egy konkrét módszert egy kategóriába sorolni. Például az un. semi-supervised learning részben felügyelt, részben nem felügyelt gépi tanulás.

Szerző: Szuhi Attila

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Cikkek a témában

április 19, 2023

Oké, kezdjük azzal, amit már tudsz. A mesterséges

április 18, 2023

Meta nyílt forráskódú AI projektet hozott létre, amely

április 5, 2023

A BIG-bench (Behavior of Intelligence in the General

április 5, 2023

A Google Research nemrégiben jelentette be a Pathways


INGYENES!

TÖLTSD LE A GOOGLE 100 SEO TANÁCSÁT

A Google 100 legfontosabb keresőoptimalizálási tanácsa!

>