Kiszivárgott a Meta AI nyelvi modellje, a LLaMA

2023.03.06.
Olvasási idő: 2 perc

A múlt héten a Meta beszállt a mesterséges intelligencia nyelvi modell versenybe a LLaMA bejelentésével, amely egy 65 milliárd paraméteres nyelvi modell (LLM), és amelynek célja, hogy segítse a kutatókat a mesterséges intelligencia ezen részterületén végzett munkájukban. A 20 leggyakrabban beszélt nyelv szövegein kiképzett LLaMA úgy működik, hogy bemenetként szavak sorozatát veszi, és a következő szót előrejelzi, hogy rekurzív módon szöveget generáljon, lehetővé téve a nagy mennyiségű infrastruktúrához nem férő kutatók számára a nyelvi modellek tanulmányozását.

Bár a modellt nem kereskedelmi licenc alatt adták ki nyilvánosan, sokan, köztük kutatók és ismert AI-rajongók, megjegyezték, hogy nem kapták meg a Meta jóváhagyását, és a kérelmüket látszólag minden ok nélkül elutasították. Szerencséjükre úgy tűnik, hogy most már létezik egy olyan megoldás, amely lehetővé teszi a LLaMA-hoz való hozzáférést anélkül, hogy hivatalos kérelmet kellene benyújtani a Metának.

Az információmorzsákat követve úgy tűnik, hogy az internet a 4chan fórumnak köszönheti a kiszivárgást. Múlt hét csütörtökön ‘llamanon’ felhasználó a 4chan technológiai fórumán posztolt, és torrenten keresztül közzétette a LLaMA 7B és 65B modelleket. A modell az AI Chatbot General megathreadben jelent meg.

Ezt a torrent linket ezután egy pull requestként hozzáadták a LLaMA GitHub oldalához. Ez a pull request a Google Forms linkkel együtt került fel, amelyet Meta a bothoz való hozzáférés biztosításához használt, látszólag az LLM-re való jelentkezés folyamatára utalva. Egy második pull requestet is benyújtottak a projekthez, amely egy torrent linket adott a modellhez. De azóta még több helyre is felkerült, szóval innentől leszedése szinte lehetetlen feladat lesz a Facebooknak.

Az egyik legnagyobb hiba azonban, amit a kiszivárogtató elkövetett, hogy a kiszivárgott modellben szerepeltette az egyedi azonosító kódját. Ezt a kódot kifejezetten a kiszivárogtatók felkutatására vezették be, ezzel veszélybe sodorva a felhasználó llamanon személyes adatait. Úgy tűnik azonban, hogy a Meta az elmúlt napokban nem tett semmilyen lépést, mivel a torrent továbbra is elérhető és letölthető.

A 4chan felhasználói egy praktikus forrást is létrehoztak azok számára, akik a modellt saját állomásukon szeretnék futtatni.

Bár ez a modell a Meta részéről nagy felhajtással jelent meg, a modell első tesztjei azt mutatták, hogy nem olyan kifinomult, mint a konkurens ajánlatok, például a ChatGPT. Fontos azonban megjegyezni, hogy ez csak egy language learning modell, míg a ChatGPT egy finomhangolt LLM-re épülő chatbot, de még így is képes válaszokat adni nyílt végű kérdésekre.

AI kutatók és fórumozok szerint a modellt „mindenre” betanították, ami viszont azt jelenti, hogy nem valamilyen konkrét célra finomhangolták. Figyelemre méltó, hogy a LLaMA azért emelkedik ki a többi közül, mert csak nyilvánosan hozzáférhető adatokon képezték ki. Egy felületes pillantás a kutatási dokumentumra azt mutatja, hogy a modell adatainak 60,7%-a a CommonCrawl, a feltérképezett weboldalak adatállományából származik.

Ez a cikk is érdekelhet: Torrentekhez hasonló módon használhatóak a legnagyobb nyelvi modellek

Zsófi

Minden érdekel, ami izgalmas, innovatív vagy meghökkentő – legyen szó technológiáról, gazdaságról vagy váratlan fordulatokról a nagyvilágban. Ezek a témák kizökkentenek a hétköznapokból, és új nézőpontokat mutatnak meg.

Legfrissebb hírek

Oroszország virtuális

Oroszország virtuális drónharcterekre edzi a legénységet

A modern háborúk a pixelek világába költöztek. Oroszország hadserege most egy virtuális harctéren neveli a következő generáció drónpilótáit, amely valós időben integrálja a drónokat, robotokat, AI-elemeket és valós helyszínű szimulációkat. Az oroszországi
BMW iX3

Íme az elektromos jövő legfenntarthatóbb crossoverje

A BMW iX3 a márka eddigi legfenntarthatóbb sorozatgyártású modellje. Az új Neue Klasse platform mérnökei már az első lépéstől arra törekedtek, hogy minden szinten csökkentsék a környezeti terhelést: az anyagválasztástól az akkumulátorig,

Veszélyben a magánélet – mindent látni akar a YouTube

Újra az adatgyűjtés kiterjesztésével próbálkozik a big tech. Ezúttal a YouTube a ludas, éppen egy új AI-alapú korhatár-ellenőrző rendszer bevezetését tervezi, ahol egy szelfi alapján ellenőriznék a felhasználók életkorát. A vállalat szerint
WHO

Kik pénzelik valójában a WHO-t? Egyre több a kérdőjel 

A világjárványok, globális egészségügyi veszélyhelyzetek és a vakcinák jövője kapcsán gyakran halljuk a WHO, vagyis az Egészségügyi Világszervezet nevét. De vajon ki finanszírozza ezt a világszinten befolyásos szervezetet? Egy a BMJ Global
hu_HUHungarian