El sem hinnéd, ki ígér a ChatGPT-t is lepipáló új technológiát

2023.02.26.
Olvasási idő: 2 perc

Új nyelvi modellt mutattak be LLaMA néven, amely egyetlen jobbféle számítógépes GPU-n is futhat, és állítólag tízszer kisebb mérete ellenére is hasonlót nyújt, mint a ChatGPT. Így végső soron felülmúlja annak technológiáját.

A Meta, a Facebook anyavállalata pénteken bejelentette a LLaMA-13B nevű új, AI– (mesterséges intelligencia) alapú “nagy nyelvi modellt” (LLM), amely állítása szerint tízszer kisebb mérete ellenére is képes felülmúlni az OpenAI GPT-3 modelljét. A kisebb méretű AI-modellek lehetővé tehetik, hogy a ChatGPT-stílusú nyelvi asszisztensek helyben fussanak az olyan eszközökön, mint a PC-k és az okostelefonok.

Forrong az egész mesterségesintelligencia-iparág

Ez egy új nyelvimodell-család része, amelyet “Large Language Model Meta AI”, röviden LLAMA névre kereszteltek. A LLaMA nyelvi modellek gyűjteménye hétmilliárd és 65 milliárd paraméter közötti teljesítményűek. Összehasonlításképpen, az OpenAI GPT-3 modellje – a ChatGPT alapmodellje – 175 milliárd paraméterrel rendelkezik.

A Meta a LLaMA modelljeit nyilvánosan elérhető adathalmazok (mint a Common Crawl, a Wikipedia vagy a C4) segítségével tanította be, így elvileg nyílt forráskódúvá is teheti a modellt. Ez drámai új fejlemény lenne egy olyan iparágban, ahol eddig a nagy technológiai szereplők a mesterséges intelligenciáért folyatott versenyfutásban a legerősebb csúcsmodelleket megtartották maguknak – írja az Ars Technica.

  • A Chinchillával, a PaLM-mel vagy a GPT-3-mal ellentétben mi csak nyilvánosan elérhető adatkészleteket használunk, így munkánk reprodukálható. Míg a legtöbb létező modell olyan adatokra támaszkodik, amelyek vagy nem nyilvánosak, vagy dokumentálatlanok   tweetelte a projekt résztvevője, Guillaume Lample.

A Meta “alapozó modelleknek” (foundational models) nevezi, mert szándéka szerint a technológia jövőbeli, továbbfejlesztett AI-modellek alapját képezi majd. Hasonlóan ahhoz, ahogyan az OpenAI a GPT-3 alapjaira építette a ChatGPT-t. Míg a csúcs LLaMA modell LLaMA-65B 65 milliárd paraméterrel rendelkezik, a konkurens laborok DeepMind, Google és OpenAI hasonló ajánlataival vetekszik.

Zsebünkben lesz egy intelligens Llama?

A legérdekesebb a LLaMA-13B, amely állítólag képes felülmúlni a GPT-3 teljesítményét, miközben egyetlen GPU-n (grafikai processzoron) fut. Így megnyitja az utat, hogy a ChatGPT-hez hasonló teljesítmény a fogyasztók hardverein fusson. A nyelvi modell paramétereinek száma kulcsfontosságú tényező a teljesítmény szempontjából, a nagyobb modellek általában összetettebb feladatokat képesek kezelni és koherensebb kimenetet tudnak produkálni. (Apró érdekesség, hogy a llama szó spanyolul lámát jelent.)

Egy-két éven belül a ChatGPT képességeinek jelentős részével rendelkező nyelvi modelleket fogunk futtatni a saját (felső kategóriás) mobiltelefonjainkon és laptopjainkon írta Simon Willison független AI-kutató a Mastodonon.

Jelenleg a LLaMA egy lecsupaszított változata érhető el a GitHubon. A teljes kód megszerzéséhez a Meta egy űrlapot biztosít, amelyen az érdeklődő kutatók hozzáférést kérhetnek. Egyelőre nem jelentették be a modell szélesebb körű hozzáférhetővé tételének terveit.

Kapcsolódó cikkeink:

Címlapkép forrása: Pixabay.com

Legfrissebb hírek

Oroszország virtuális

Oroszország virtuális drónharcterekre edzi a legénységet

A modern háborúk a pixelek világába költöztek. Oroszország hadserege most egy virtuális harctéren neveli a következő generáció drónpilótáit, amely valós időben integrálja a drónokat, robotokat, AI-elemeket és valós helyszínű szimulációkat. Az oroszországi
BMW iX3

Íme az elektromos jövő legfenntarthatóbb crossoverje

A BMW iX3 a márka eddigi legfenntarthatóbb sorozatgyártású modellje. Az új Neue Klasse platform mérnökei már az első lépéstől arra törekedtek, hogy minden szinten csökkentsék a környezeti terhelést: az anyagválasztástól az akkumulátorig,

Veszélyben a magánélet – mindent látni akar a YouTube

Újra az adatgyűjtés kiterjesztésével próbálkozik a big tech. Ezúttal a YouTube a ludas, éppen egy új AI-alapú korhatár-ellenőrző rendszer bevezetését tervezi, ahol egy szelfi alapján ellenőriznék a felhasználók életkorát. A vállalat szerint
WHO

Kik pénzelik valójában a WHO-t? Egyre több a kérdőjel 

A világjárványok, globális egészségügyi veszélyhelyzetek és a vakcinák jövője kapcsán gyakran halljuk a WHO, vagyis az Egészségügyi Világszervezet nevét. De vajon ki finanszírozza ezt a világszinten befolyásos szervezetet? Egy a BMJ Global
hu_HUHungarian

Mielőtt továbblépnél