Kiszivárogtatták a Meta AI nyelvi modelljét

A múlt héten a Meta beszállt a mesterséges intelligencia nyelvi modell versenybe a LLaMA bejelentésével, amely egy 65 milliárd paraméteres nyelvi modell (LLM), és amelynek célja, hogy segítse a kutatókat a mesterséges intelligencia ezen részterületén végzett munkájukban. A 20 leggyakrabban beszélt nyelv szövegein kiképzett LLaMA úgy működik, hogy bemenetként szavak sorozatát veszi, és a következő szót előrejelzi, hogy rekurzív módon szöveget generáljon, lehetővé téve a nagy mennyiségű infrastruktúrához nem férő kutatók számára a nyelvi modellek tanulmányozását.

Bár a modellt nem kereskedelmi licenc alatt adták ki nyilvánosan, sokan, köztük kutatók és ismert AI-rajongók, megjegyezték, hogy nem kapták meg a Meta jóváhagyását, és a kérelmüket látszólag minden ok nélkül elutasították. Szerencséjükre úgy tűnik, hogy most már létezik egy olyan megoldás, amely lehetővé teszi a LLaMA-hoz való hozzáférést anélkül, hogy hivatalos kérelmet kellene benyújtani a Metának.

Az információmorzsákat követve úgy tűnik, hogy az internet a 4chan fórumnak köszönheti a kiszivárgást. Múlt hét csütörtökön ‘llamanon’ felhasználó a 4chan technológiai fórumán posztolt, és torrenten keresztül közzétette a LLaMA 7B és 65B modelleket. A modell az AI Chatbot General megathreadben jelent meg.

Ezt a torrent linket ezután egy pull requestként hozzáadták a LLaMA GitHub oldalához. Ez a pull request a Google Forms linkkel együtt került fel, amelyet Meta a bothoz való hozzáférés biztosításához használt, látszólag az LLM-re való jelentkezés folyamatára utalva. Egy második pull requestet is benyújtottak a projekthez, amely egy torrent linket adott a modellhez. De azóta még több helyre is felkerült, szóval innentől leszedése szinte lehetetlen feladat lesz a Facebooknak.

Az egyik legnagyobb hiba azonban, amit a kiszivárogtató elkövetett, hogy a kiszivárgott modellben szerepeltette az egyedi azonosító kódját. Ezt a kódot kifejezetten a kiszivárogtatók felkutatására vezették be, ezzel veszélybe sodorva a felhasználó llamanon személyes adatait. Úgy tűnik azonban, hogy a Meta az elmúlt napokban nem tett semmilyen lépést, mivel a torrent továbbra is elérhető és letölthető.

A 4chan felhasználói egy praktikus forrást is létrehoztak azok számára, akik a modellt saját állomásukon szeretnék futtatni.

Bár ez a modell a Meta részéről nagy felhajtással jelent meg, a modell első tesztjei azt mutatták, hogy nem olyan kifinomult, mint a konkurens ajánlatok, például a ChatGPT. Fontos azonban megjegyezni, hogy ez csak egy language learning modell, míg a ChatGPT egy finomhangolt LLM-re épülő chatbot, de még így is képes válaszokat adni nyílt végű kérdésekre.

AI kutatók és fórumozok szerint a modellt „mindenre” betanították, ami viszont azt jelenti, hogy nem valamilyen konkrét célra finomhangolták. Figyelemre méltó, hogy a LLaMA azért emelkedik ki a többi közül, mert csak nyilvánosan hozzáférhető adatokon képezték ki. Egy felületes pillantás a kutatási dokumentumra azt mutatja, hogy a modell adatainak 60,7%-a a CommonCrawl, a feltérképezett weboldalak adatállományából származik.

Ez a cikk is érdekelhet: Torrentekhez hasonló módon használhatóak a legnagyobb nyelvi modellek

Zsófi

Minden érdekel, ami izgalmas, innovatív vagy meghökkentő – legyen szó technológiáról, gazdaságról vagy váratlan fordulatokról a nagyvilágban. Ezek a témák kizökkentenek a hétköznapokból, és új nézőpontokat mutatnak meg.

Legfrissebb hírek

Titkos kísérletek az árnyékban: mit árulnak el az FBI emberkísérletei?

Az utóbbi időben újra reflektorfénybe kerültek az amerikai hatóságok múltbeli és jelenlegi kutatásai, különösen azok, amelyek embereken végzett vizsgálatokhoz köthetők. Egy kiszivárgott prezentáció és több beszámoló alapján kirajzolódik egy kevéssé ismert világ,

3000 éves város került elő Üzbegisztánban – új fejezet nyílik a Selyemút történetében

Egy különleges régészeti felfedezés hozta ismét reflektorfénybe Közép-Ázsia múltját. Üzbegisztán déli részén egy több mint 3000 éves város maradványaira bukkantak, amely fontos szerepet tölthetett be a korai Selyemút mentén. A lelőhely nemcsak

Az autizmus diagnózisok számának növekedése csak túldiagnosztika

A közvéleményben, a közösségi médiában és még szakmai fórumokon fellángol időről-időre a vita az autizmus előfordulásának állítólagos növekedéséről. Nagyon sok esetben azt a széles körben vizsgált, de megalapozatlannak bizonyult állítást is meg

Eltűnt remekművek: a történelem legmerészebb műkincsrablásai

A műkincsrablások világa mindig is különleges helyet foglalt el a bűnügyi történetek között. Ezek az esetek nem csupán pénzről szólnak, hanem kulturális örökségről, presztízsről és sokszor egészen meghökkentő emberi történetekről. A közelmúltban

Így épülhetett a nagy piramis: egy új elmélet mindent megmagyaráz

A gízai nagy piramis több mint 4600 éve áll, és azóta is az emberiség egyik legnagyobb rejtélyének számít. Hogyan voltak képesek az ókori egyiptomiak ilyen hatalmas építményt létrehozni modern eszközök nélkül, ráadásul

Egy garázsvásár rejtett kincse: 18 év után szivárgott ki a GTA 4 titkos változata

Néha a legnagyobb gaming felfedezések nem laborokból vagy szerverekről, hanem teljesen hétköznapi helyekről kerülnek elő. Pontosan ez történt most is: egy használt Xbox 360 konzolból olyan anyag került napvilágra, amely új megvilágításba

Napkitörés veszélyeztetheti a NASA Hold-misszióját

Egy váratlan és erős napkitörés borzolja a kedélyeket az űriparban, éppen akkor, amikor a NASA az egyik legfontosabb küldetésére készül. A szakértők egy X1.5-ös erősségű napkitörést észleltek, amely akár hatással is lehet

Megtalálták a sokáig elveszettnek hitt várost

A történelem tele van olyan történetekkel, amelyeket sokáig puszta legendának tartottak. Időnként azonban a modern technológia képes igazolni azt, amit korábban csak régi feljegyzések sejtettek. Pontosan ez történt Norvégiában is, ahol egy

Eltűntek a bakiparádék: miért nem nevethetünk már a filmek végén?

Volt idő, amikor a filmek vége nemcsak a történet lezárását jelentette, hanem egy könnyed, felszabadító pillanatot is. A stáblista után jöttek a bakiparádék: elrontott jelenetek, elszúrt mozdulatok, váratlan nevetések. Ezek a kis

Kína új lézerfegyverei másodpercek alatt semmisítik meg a drónokat

A modern hadviselés egyik legnagyobb kihívása ma már nem a hagyományos fegyverrendszerekhez, hanem a kisméretű, olcsó és nehezen észlelhető drónokhoz kapcsolódik. Ezek az eszközök alacsonyan repülnek, gyorsan mozognak, és gyakran egyszerűen kicsúsznak

Javaslatok

Kiszivárgott a Meta AI nyelvi modellje, a LLaMA

Legfrissebb hírek