Szuhi Attila
2025-06-26
TÉMAKÖR: Egészségügy

A DeepMind bemutatta az AlphaGenome-ot, egy úttörő mesterséges intelligencia modellt, amely forradalmasítja a DNS-elemzést azáltal, hogy példátlan pontossággal és sebességgel képes előre jelezni a genetikai mutációk molekuláris folyamatokra gyakorolt hatását, drámaian felgyorsítva ezzel a betegségeket okozó variánsok azonosítását és a biológiai kutatást.

  • Az AlphaGenome akár 1 millió bázispár hosszúságú DNS-szakaszokat is képes elemezni, ami 100-szor hosszabb, mint a korábbi eszközök által kezelt hosszak.
  • Ez az egyetlen eszköz több ezer molekuláris előrejelzést egyesít magában, miközben felülmúlja a legtöbb speciális modellt a genomikai benchmarkokon.
  • A teljes rendszert mindössze négy óra alatt képezték ki nyilvános genetikai adatbázisok felhasználásával, a korábbi DNS-modelljükhöz képest fele annyi számítási kapacitást igényelve.

A genom az emberi test „sejtutasítási kézikönyve”, a DNS azon teljes készlete, amely egy élő szervezet szinte minden részét vezérli, a megjelenéstől és funkciótól kezdve a növekedésen és szaporodáson át. A genom DNS-szekvenciájának apró változásai megváltoztathatják egy szervezet környezetre adott válaszát vagy betegségekre való hajlamát. Azonban annak megfejtése, hogy a genom utasításait molekuláris szinten hogyan olvassák le – és mi történik, ha egy apró DNS-variáció bekövetkezik – továbbra is a biológia egyik legnagyobb rejtélye.

Most a Google DeepMind bemutatta az AlphaGenome-ot, egy új mesterséges intelligencia (MI) eszközt, amely átfogóbban és pontosabban képes előre jelezni, hogy az emberi DNS-szekvenciákban lévő egyedi variánsok vagy mutációk hogyan befolyásolják a géneket szabályozó biológiai folyamatok széles skáláját. Ezt többek között olyan technikai fejlesztések tették lehetővé, amelyek lehetővé teszik a modell számára a hosszú DNS-szekvenciák feldolgozását és nagy felbontású előrejelzések készítését.

A tudományos kutatás elősegítése érdekében az AlphaGenome előzetes verzióban már elérhető az AlphaGenome API-n keresztül, nem kereskedelmi célú kutatásokhoz, a modell teljes kiadása pedig a jövőben várható.

Hogyan működik az AlphaGenome?

Az AlphaGenome modell hosszú, akár 1 millió betű (bázispár) hosszú DNS-szekvenciát vesz bemenetként, és több ezer molekuláris tulajdonságot jósol meg, amelyek a szabályozó aktivitását jellemzik. Képes a genetikai variánsok vagy mutációk hatásait is pontozni a mutált szekvenciák és a nem mutáltak előrejelzéseinek összehasonlításával.

Az előre jelzett tulajdonságok közé tartozik, hogy a gének hol kezdődnek és hol végződnek a különböző sejttípusokban és szövetekben, hol illeszkednek be (splicing), mennyi RNS termelődik, és mely DNS-bázisok hozzáférhetők, közel vannak egymáshoz, vagy bizonyos fehérjékhez kötődnek. A képzési adatokat nagyméretű nyilvános konzorciumoktól szerezték be, mint például az ENCODE, GTEx, 4D Nucleome és FANTOM5, amelyek kísérletileg mérték ezeket a tulajdonságokat, lefedve a génszabályozás fontos modalitásait emberi és egér sejttípusok és szövetek százain keresztül.

Az AlphaGenome architektúra konvolúciós rétegeket használ a genomi szekvenciák rövid mintáinak kezdeti észlelésére, transzformátorokat az információk továbbítására a szekvencia összes pozícióján keresztül, és egy végső rétegsorozatot az észlelt minták különböző modalitásokra vonatkozó előrejelzésekké alakítására. A képzés során ezt a számítást több összekapcsolt Tensor Processing Unit (TPU) között osztják el egyetlen szekvencia esetében.

Ez a modell korábbi genomikai modelljükre, az Enformerre épül, és kiegészíti az AlphaMissense-t, amely a fehérjekódoló régiókban lévő variánsok hatásainak kategorizálására specializálódott. Ezek a régiók a genom 2%-át fedik le. A fennmaradó 98%, az úgynevezett nem kódoló régiók, kulcsfontosságúak a génaktivitás szabályozásában, és számos betegségekkel összefüggő variánst tartalmaznak. Az AlphaGenome új perspektívát kínál ezeknek a kiterjedt szekvenciáknak és a bennük lévő variánsoknak az értelmezéséhez.

Az AlphaGenome jellegzetes tulajdonságai

Az AlphaGenome számos megkülönböztető jellemzőt kínál a meglévő DNS-szekvencia-modellekhez képest:

  • Hosszú szekvencia-kontextus nagy felbontással: A modell akár 1 millió DNS-betűt is elemez, és egyedi betűk felbontásával készít előrejelzéseket. A hosszú szekvencia-kontextus fontos a távoli géneket szabályozó régiók lefedéséhez, a bázisfelbontás pedig a finom biológiai részletek megragadásához. Korábbi modelleknek kompromisszumot kellett kötniük a szekvenciahossz és a felbontás között, ami korlátozta a közösen modellezhető és pontosan előre jelezhető modalitások körét. Az AlphaGenome technikai fejlesztései kiküszöbölik ezt a korlátozást anélkül, hogy jelentősen növelnék a képzési erőforrásokat – egyetlen AlphaGenome modell képzése négy órát vett igénybe, és az eredeti Enformer modell képzéséhez használt számítási költség felét igényelte.
  • Átfogó multimodális előrejelzés: A hosszú bemeneti szekvenciák nagy felbontású előrejelzésének lehetővé tételével az AlphaGenome a legváltozatosabb modalitásokat tudja előre jelezni. Ezzel az AlphaGenome átfogóbb információkat biztosít a tudósoknak a génszabályozás komplex lépéseiről.
  • Hatékony variáns pontozás: Amellett, hogy molekuláris tulajdonságok változatos skáláját jósolja meg, az AlphaGenome egy másodperc alatt hatékonyan pontozhatja a genetikai variáns hatását ezen tulajdonságok mindegyikére. Ezt a mutált szekvenciák és a nem mutáltak előrejelzéseinek összehasonlításával teszi, és hatékonyan összegzi ezt a különbséget a különböző modalitásokhoz különböző megközelítésekkel.
  • Újszerű splice-junction modellezés: Számos ritka genetikai betegséget, mint például a gerincvelői izomsorvadást és a cisztás fibrózis bizonyos formáit, az RNS splicing hibái okozhatják – ez egy olyan folyamat, amely során az RNS molekula részeit eltávolítják, vagy „kivágják”, és a megmaradó végeket újra összekapcsolják. Az AlphaGenome először képes explicit módon modellezni ezen illesztési pontok elhelyezkedését és expressziós szintjét közvetlenül a szekvenciából, mélyebb betekintést nyújtva a genetikai variánsok RNS splicingre gyakorolt ​​következményeibe.
  • Élvonalbeli teljesítmény a benchmarkokon: Az AlphaGenome élvonalbeli teljesítményt ér el számos genomikai előrejelzési benchmarkon, például annak előrejelzésében, hogy a DNS-molekula mely részei lesznek egymáshoz közel, hogy egy genetikai variáns növeli vagy csökkenti-e egy gén expresszióját, vagy megváltoztatja-e a gén splicing mintázatát. Az egyedi DNS-szekvenciákra vonatkozó előrejelzések készítésekor az AlphaGenome 24 értékelésből 22-ben felülmúlta a legjobb külső modelleket. A variáns szabályozó hatásának előrejelzésekor pedig 26 értékelésből 24-ben megfelelt vagy felülmúlta a legjobb teljesítményt nyújtó külső modelleket. Ez az összehasonlítás az egyes feladatokra specializálódott modelleket is magában foglalta. Az AlphaGenome volt az egyetlen modell, amely képes volt együttesen előre jelezni az összes értékelt modalitást, kiemelve annak általános jellegét.

Amiért az AlphaGenome fontos: Egy egyesítő modell előnyei

Az AlphaGenome általános jellege lehetővé teszi a tudósok számára, hogy egyetlen API-hívással egyszerre több modalitásban vizsgálják meg egy variáns hatását. Ez azt jelenti, hogy a tudósok gyorsabban generálhatnak és tesztelhetnek hipotéziseket anélkül, hogy több modellt kellene használniuk a különböző modalitások vizsgálatához.

Ráadásul az AlphaGenome erős teljesítménye azt jelzi, hogy viszonylag általános DNS-szekvencia-reprezentációt tanult meg a génszabályozás kontextusában. Ez erős alapot biztosít a szélesebb közösség számára, amelyre építhet. Miután a modell teljesen elérhetővé válik, a tudósok adaptálhatják és finomhangolhatják saját adatkészleteiken, hogy jobban megoldják egyedi kutatási kérdéseiket.

Végül, ez a megközelítés rugalmas és skálázható architektúrát biztosít a jövőre nézve. Az képzési adatok bővítésével az AlphaGenome képességei tovább fejleszthetők, jobb teljesítményt nyújthatnak, több fajt fedhetnek le, vagy további modalitásokat is magukba foglalhatnak, hogy a modell még átfogóbbá váljon.

„Ez egy mérföldkő a terület számára. Először van egyetlen modellünk, amely egyesíti a távolsági kontextust, a bázisszintű pontosságot és az élvonalbeli teljesítményt a genomikai feladatok egész spektrumában.” – Dr. Caleb Lareau, Memorial Sloan Kettering Cancer Center

Erőteljes kutatási eszköz: Alkalmazási területek

Az AlphaGenome prediktív képességei számos kutatási területet segíthetnek:

  • Betegségek megértése: A genetikai zavarok pontosabb előrejelzésével az AlphaGenome segíthet a kutatóknak pontosabban azonosítani a betegségek potenciális okait, és jobban értelmezni a bizonyos vonásokkal összefüggő variánsok funkcionális hatását, potenciálisan új terápiás célpontokat felfedezve. A modell különösen alkalmasnak tűnik a ritka, potenciálisan nagy hatású variánsok, például a ritka Mendeli rendellenességeket okozók tanulmányozására.
  • Szintetikus biológia: Előrejelzései felhasználhatók specifikus szabályozó funkcióval rendelkező szintetikus DNS tervezésének irányítására – például egy gén aktiválására csak idegsejtekben, de nem izomsejtekben.
  • Alapkutatás: Felgyorsíthatja a genom megértését azáltal, hogy segít feltérképezni kulcsfontosságú funkcionális elemeit és meghatározni szerepüket, azonosítva a legfontosabb DNS-utasításokat egy specifikus sejttípus működésének szabályozásához.

Például az AlphaGenome-ot felhasználva vizsgálták egy rákkal összefüggő mutáció potenciális mechanizmusát. A T-sejtes akut limfoblasztos leukémiában (T-ALL) szenvedő betegek egy meglévő tanulmányában a kutatók mutációkat figyeltek meg a genom bizonyos helyein. Az AlphaGenome segítségével azt jósolták, hogy a mutációk aktiválnának egy közeli gént, a TAL1-et, egy MYB DNS-kötő motívum bevezetésével, amely megismételte az ismert betegségmechanizmust, és rávilágított az AlphaGenome azon képességére, hogy specifikus nem kódoló variánsokat kapcsoljon betegséggénekhez.

„Az AlphaGenome egy erőteljes eszköz lesz a terület számára. A különböző nem kódoló variánsok relevanciájának meghatározása rendkívül nagy kihívást jelenthet, különösen nagy léptékben. Ez az eszköz kulcsfontosságú darabját adja a kirakósnak, lehetővé téve számunkra, hogy jobb kapcsolatokat találjunk az olyan betegségek, mint a rák, megértéséhez.” – Professor Marc Mansour, University College London

Jelenlegi korlátok

Az AlphaGenome jelentős előrelépést jelent, de fontos elismerni jelenlegi korlátait is:

  • Mint más szekvencia alapú modellek esetében, a nagyon távoli szabályozó elemek, például a 100 000 DNS-betűnél távolabb lévők befolyásának pontos megragadása továbbra is kihívást jelent.
  • Egy másik prioritás a jövőbeli munkában a modell azon képességének további növelése, hogy sejtspecifikus és szöveti specifikus mintázatokat is meg tudjon ragadni.
  • Nem a személyes genom előrejelzésére tervezték vagy validálták az AlphaGenome-ot, ami az MI-modellek számára ismert kihívás. Ehelyett inkább az egyedi genetikai variánsok teljesítményének jellemzésére összpontosítottak.
  • Bár az AlphaGenome előre jelezheti a molekuláris kimeneteleket, nem ad teljes képet arról, hogy a genetikai variációk hogyan vezetnek komplex vonásokhoz vagy betegségekhez. Ezek gyakran szélesebb biológiai folyamatokat, például fejlődési és környezeti tényezőket is magukban foglalnak, amelyek a modell közvetlen hatókörén kívül esnek.

Folyamatosan javítják a modelleket, és visszajelzéseket gyűjtenek, hogy segítsenek nekik kezelni ezeket a hiányosságokat.

A közösség bevonása és a jövő

Az AlphaGenome már elérhető nem kereskedelmi célú felhasználásra az AlphaGenome API-n keresztül. Fontos megjegyezni, hogy a modell előrejelzései kizárólag kutatási célokat szolgálnak, és nem klinikailag validáltak.

A világ minden tájáról érkező kutatókat felkérik, hogy vegyék fel a kapcsolatot az AlphaGenome lehetséges felhasználási eseteivel, tegyenek fel kérdéseket vagy osszanak meg visszajelzéseket a közösségi fórumon keresztül.

Remélik, hogy az AlphaGenome fontos eszköz lesz a genom jobb megértésében, és elkötelezettek amellett, hogy külső szakértőkkel, az akadémia, az ipar és a kormányzati szervezetek képviselőivel együttműködve biztosítsák, hogy az AlphaGenome a lehető legtöbb ember javát szolgálja.

A szélesebb tudományos közösség kollektív erőfeszítéseivel együtt remélik, hogy elmélyíti a DNS-szekvenciában kódolt komplex celluláris folyamatok és a variánsok hatásainak megértését, valamint izgalmas új felfedezéseket indít el a genomikában és az egészségügyben.

Forrás: https://deepmind.google/discover/blog/alphagenome-ai-for-better-understanding-the-genome/

Szerző: Szuhi Attila

Írd meg a véleményed!

Az e-mailcímed nem lesz nyilvános. A * jelölt mezők kötelezőek.

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Cikkek a témában

június 26, 2025

Egy friss kutatás szerint a mesterséges intelligencia (AI)

június 26, 2025

Az Anthropic jelentős fejlesztéssel bővítette a Claude mesterséges

június 26, 2025

A DeepMind bemutatta az AlphaGenome-ot, egy úttörő mesterséges


INGYENES!

TÖLTSD LE A GOOGLE 100 SEO TANÁCSÁT

A Google 100 legfontosabb keresőoptimalizálási tanácsa!