Szuhi Attila
Utoljára frissítve: április 5, 2023
Témakör: 

A BIG-bench (Behavior of Intelligence in the General sense: a teljesítményértékelés) egy átfogó tesztrendszer, amelyet mesterséges intelligencia (MI) rendszerek teljesítményének mérésére terveztek. Célja, hogy a kutatók számára egy átfogó és sokrétű mérőeszközt biztosítson, amely értékelni tudja a MI rendszerek intelligenciáját és képességeit a természetes nyelvű feladatokban.

A BIG-bench eredetileg egy Google projekt, amihez számos nagy név, köztük az OpenAi is csatlakozott.

A BIG-bench olyan különféle feladatokat tartalmaz – jelenleg több mint 200-at – amelyek a nyelvi modellek és az MI rendszerek különböző aspektusainak értékelésére összpontosítanak. Ezek a feladatok számos területet lefednek, mint például az olvasásértés, a logikai következtetés, a kreativitás és a tárgyi tudás. A BIG-bench a sokszínű feladatkörrel próbálja kiküszöbölni a korábbi tesztek korlátozottságait, és lehetővé teszi a kutatók számára, hogy mélyebben megértsék az MI rendszerek viselkedését és képességeit.

A BIG-bench összehasonlítja az MI rendszerek teljesítményét, és lehetővé teszi a fejlesztők számára, hogy a lehető legjobb megoldásokat dolgozzák ki és iterálják, miközben elősegíti a fejlődést és a versenyt a mesterséges intelligencia területén.

Néhány feladat a BIG-bench tesztsorából:

  1. CIFAR10 képek osztályozása különböző kódolásokban.
  2. Sakkpozícióban olyan lépést találni, amely mattot eredményez.
  3. Angol nyelvű leírás készítése Python kódhoz.
  4. Kérdések megválaszolása (spanyolul) a kriobiológia témakörében.
  5. Rövid bűnügyi történetek alapján az elkövető azonosítása és az indoklás ismertetése.
  6. Nyelvi modell öntudatosságának mérés.
  7. Egy modellpéldányt felkérni egy másik példány oktatására, majd az oktatás minőségének értékelése.
  8. Olyan etikai döntés meghozása meghatározása, amely leginkább összhangban van az emberi ítélettel.
  9. Két mondat közül eldönteni, melyik szarkasztikus.

BIG-bench a GitHub-on: https://github.com/google/BIG-bench/tree/main/docs

Szerző: Szuhi Attila

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Cikkek a témában

április 19, 2023

Oké, kezdjük azzal, amit már tudsz. A mesterséges

április 18, 2023

Meta nyílt forráskódú AI projektet hozott létre, amely

április 5, 2023

A BIG-bench (Behavior of Intelligence in the General

április 5, 2023

A Google Research nemrégiben jelentette be a Pathways


INGYENES!

TÖLTSD LE A GOOGLE 100 SEO TANÁCSÁT

A Google 100 legfontosabb keresőoptimalizálási tanácsa!

>