Megatron-Turing nagy nyelvi modell (NVIDIA)

A Microsoft és az NVIDIA bemutatja a Megatron-Turing Natural Language Generation modellt (MT-NLG), amelyet a DeepSpeed és a Megatron hajt, és amely a legnagyobb és legerősebb, 530 milliárd paraméterrel képzett monolitikus transzformátor-nyelvi modell. Az MT-NLG a Turing NLG 17B és a Megatron-LM utódja. A modell mérete háromszorosa a legnagyobb hasonló modellnek. Nagy pontossággal képes természetes nyelvi feladatokat elvégezni, mint például előrejelzés, olvasásértés, hétköznapi érvelés, természetes nyelvi következtetés és szóértelmezés tisztázása.

Megjelenés dátuma: 2021. október

Fejlesztő: NVIDIA-Microsoft

Paraméterszám: 530 milliárd

Képzési anyag mérete: 338.6 milliárd token

Forrás: https://github.com/NVIDIA/Megatron-LM

Szerző: Szuhi Attila

Követhetsz

Share 0

Írd meg a véleményed!

Cikkek a témában

január 23, 2025

Megatron-Turing nagy nyelvi modell (NVIDIA)

Szerző: Szuhi Attila

Írd meg a véleményed!

„Nincs Fal”: Az OpenAI kutatója elképesztő felfedezésről az o1 modellel kapcsolatban

Az OpenAI magas szintű mérnököket megszégyenítő kódoló AI-t fejleszt

Az AlphaFold milliárd évnyi kutatást végzett – hamarosan klinikai gyógyszerekkel jön

Az AI gondolkodása fontosabb, mint a méretet

INGYENES!

TÖLTSD LE A GOOGLE 100 SEO TANÁCSÁT