El sem hinnéd, ki ígér a ChatGPT-t is lepipáló új technológiát

2023.02.26.
Olvasási idő: 2 perc

Új nyelvi modellt mutattak be LLaMA néven, amely egyetlen jobbféle számítógépes GPU-n is futhat, és állítólag tízszer kisebb mérete ellenére is hasonlót nyújt, mint a ChatGPT. Így végső soron felülmúlja annak technológiáját.

A Meta, a Facebook anyavállalata pénteken bejelentette a LLaMA-13B nevű új, AI– (mesterséges intelligencia) alapú “nagy nyelvi modellt” (LLM), amely állítása szerint tízszer kisebb mérete ellenére is képes felülmúlni az OpenAI GPT-3 modelljét. A kisebb méretű AI-modellek lehetővé tehetik, hogy a ChatGPT-stílusú nyelvi asszisztensek helyben fussanak az olyan eszközökön, mint a PC-k és az okostelefonok.

Forrong az egész mesterségesintelligencia-iparág

Ez egy új nyelvimodell-család része, amelyet “Large Language Model Meta AI”, röviden LLAMA névre kereszteltek. A LLaMA nyelvi modellek gyűjteménye hétmilliárd és 65 milliárd paraméter közötti teljesítményűek. Összehasonlításképpen, az OpenAI GPT-3 modellje – a ChatGPT alapmodellje – 175 milliárd paraméterrel rendelkezik.

A Meta a LLaMA modelljeit nyilvánosan elérhető adathalmazok (mint a Common Crawl, a Wikipedia vagy a C4) segítségével tanította be, így elvileg nyílt forráskódúvá is teheti a modellt. Ez drámai új fejlemény lenne egy olyan iparágban, ahol eddig a nagy technológiai szereplők a mesterséges intelligenciáért folyatott versenyfutásban a legerősebb csúcsmodelleket megtartották maguknak – írja az Ars Technica.

  • A Chinchillával, a PaLM-mel vagy a GPT-3-mal ellentétben mi csak nyilvánosan elérhető adatkészleteket használunk, így munkánk reprodukálható. Míg a legtöbb létező modell olyan adatokra támaszkodik, amelyek vagy nem nyilvánosak, vagy dokumentálatlanok   tweetelte a projekt résztvevője, Guillaume Lample.

A Meta “alapozó modelleknek” (foundational models) nevezi, mert szándéka szerint a technológia jövőbeli, továbbfejlesztett AI-modellek alapját képezi majd. Hasonlóan ahhoz, ahogyan az OpenAI a GPT-3 alapjaira építette a ChatGPT-t. Míg a csúcs LLaMA modell LLaMA-65B 65 milliárd paraméterrel rendelkezik, a konkurens laborok DeepMind, Google és OpenAI hasonló ajánlataival vetekszik.

Zsebünkben lesz egy intelligens Llama?

A legérdekesebb a LLaMA-13B, amely állítólag képes felülmúlni a GPT-3 teljesítményét, miközben egyetlen GPU-n (grafikai processzoron) fut. Így megnyitja az utat, hogy a ChatGPT-hez hasonló teljesítmény a fogyasztók hardverein fusson. A nyelvi modell paramétereinek száma kulcsfontosságú tényező a teljesítmény szempontjából, a nagyobb modellek általában összetettebb feladatokat képesek kezelni és koherensebb kimenetet tudnak produkálni. (Apró érdekesség, hogy a llama szó spanyolul lámát jelent.)

Egy-két éven belül a ChatGPT képességeinek jelentős részével rendelkező nyelvi modelleket fogunk futtatni a saját (felső kategóriás) mobiltelefonjainkon és laptopjainkon írta Simon Willison független AI-kutató a Mastodonon.

Jelenleg a LLaMA egy lecsupaszított változata érhető el a GitHubon. A teljes kód megszerzéséhez a Meta egy űrlapot biztosít, amelyen az érdeklődő kutatók hozzáférést kérhetnek. Egyelőre nem jelentették be a modell szélesebb körű hozzáférhetővé tételének terveit.

Kapcsolódó cikkeink:

Címlapkép forrása: Pixabay.com

Legfrissebb hírek

Ezek a legkelendőbb videójátékok 2020 óta

Évente több tízezer videójáték jelenik meg, de alig pár tucat ér el globális sikert. A legnépszerűbb játékokat tízmilliók töltötték le, egy-egy játék népszerűségére pedig a Covid–19 is rátett. Íme a toplista, amelynek
lengyelország

Lengyelország csendben erősíti befolyását a Balti-térségben

Az elmúlt években Lengyelország nemcsak katonai és politikai értelemben vált egyre hangsúlyosabb szereplővé Kelet- és Közép-Európában, hanem infrastruktúrán keresztül is növeli regionális súlyát. Ennek egyik kulcseleme a Via Baltica autópálya, amely Lengyelországot
Hot Wheels vidámpark

Barbie és Hot Wheels vidámparkra költ milliárdokat Kansas

Kansas állam és Bonner Springs városa több százmillió dollárnyi adókedvezménnyel támogat egy új, nagyszabású vidámpark-projektet, amely a Barbie és a Hot Wheels márkákra épül. A Mattel Adventure Park névre keresztelt beruházás összértéke
Project BROMO

Európa űrharca: a Project BROMO lehet az utolsó esély

Európa űripara történelmi átalakulás előtt áll. Három nagyvállalat – az Airbus Defence and Space, a Thales Alenia Space és az olasz Leonardo – bejelentette, hogy egyesítik űrtevékenységeiket. Az ambiciózus terv, amelyet egyelőre

Mielőtt továbblépnél