Szuhi Attila
Utoljára frissítve: április 5, 2023
Témakör: 

A BIG-bench (Behavior of Intelligence in the General sense: a teljesítményértékelés) egy átfogó tesztrendszer, amelyet mesterséges intelligencia (MI) rendszerek teljesítményének mérésére terveztek. Célja, hogy a kutatók számára egy átfogó és sokrétű mérőeszközt biztosítson, amely értékelni tudja a MI rendszerek intelligenciáját és képességeit a természetes nyelvű feladatokban.

A BIG-bench eredetileg egy Google projekt, amihez számos nagy név, köztük az OpenAi is csatlakozott.

A BIG-bench olyan különféle feladatokat tartalmaz – jelenleg több mint 200-at – amelyek a nyelvi modellek és az MI rendszerek különböző aspektusainak értékelésére összpontosítanak. Ezek a feladatok számos területet lefednek, mint például az olvasásértés, a logikai következtetés, a kreativitás és a tárgyi tudás. A BIG-bench a sokszínű feladatkörrel próbálja kiküszöbölni a korábbi tesztek korlátozottságait, és lehetővé teszi a kutatók számára, hogy mélyebben megértsék az MI rendszerek viselkedését és képességeit.

A BIG-bench összehasonlítja az MI rendszerek teljesítményét, és lehetővé teszi a fejlesztők számára, hogy a lehető legjobb megoldásokat dolgozzák ki és iterálják, miközben elősegíti a fejlődést és a versenyt a mesterséges intelligencia területén.

Néhány feladat a BIG-bench tesztsorából:

  1. CIFAR10 képek osztályozása különböző kódolásokban.
  2. Sakkpozícióban olyan lépést találni, amely mattot eredményez.
  3. Angol nyelvű leírás készítése Python kódhoz.
  4. Kérdések megválaszolása (spanyolul) a kriobiológia témakörében.
  5. Rövid bűnügyi történetek alapján az elkövető azonosítása és az indoklás ismertetése.
  6. Nyelvi modell öntudatosságának mérés.
  7. Egy modellpéldányt felkérni egy másik példány oktatására, majd az oktatás minőségének értékelése.
  8. Olyan etikai döntés meghozása meghatározása, amely leginkább összhangban van az emberi ítélettel.
  9. Két mondat közül eldönteni, melyik szarkasztikus.

BIG-bench a GitHub-on: https://github.com/google/BIG-bench/tree/main/docs

Szerző: Szuhi Attila

Írd meg a véleményed!

Az e-mailcímed nem lesz nyilvános. A * jelölt mezők kötelezőek.

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Cikkek a témában

január 23, 2025

Az OpenAI-től @SebastienBubeck az o1 paradigmáról: „Semmilyen taktikát

január 23, 2025

A The Information értesülései szerint az OpenAI egy

január 23, 2025

Demis Hassabis, a Google DeepMind vezérigazgatója elmondta, hogy

január 23, 2025

Noam Brown, az OpenAI munkatársa szerint, ha az


INGYENES!

TÖLTSD LE A GOOGLE 100 SEO TANÁCSÁT

A Google 100 legfontosabb keresőoptimalizálási tanácsa!