Torrentekhez hasonló módon használhatóak a legnagyobb nyelvi modellek

2023.01.06.
Olvasási idő: 2 perc

Az interneten elég sokféle definíciót találhatunk a Natural Language Processing – NLP fogalmára, ami összességében a természetes nyelvek feldolgozására épülő mesterséges intelligencia. Ennek kulcsfontosságú szerepe van a fordítóprogramoknál, automata cikkíró programoknál, chatbotoknál. Hiszen ennek segítségével tudja egy program, egy számítógép értelmezni azt, hogy adott emberi mondatok mit is jelentenek. Mert azt egy idegen nyelv esetén megnézhetjük a szótárban, hogy mit jelent egy szó, de ezt kontextusban is értelmezni kell. Ebben segít az NLP.

Az LLM-ek használatának leghatékonyabb módja lehet a PETALS

Az LLM-ek, azaz Large Language Models pedig olyan gépi tanulási modellek/algoritmusok, amelyek rengeteg NLP felhasználási területen tudnak segíteni. Manapság a modern nyelvi modellekben már sok milliárd paraméter van kezelve és ez csak növekszik. Ahogy a méret növekszik, úgy nő a performancia is. Vannak már 100 milliárdnál is több paraméterből álló LLM-ek. A legnagyobb a BigScience projekt LLM-je (a BLOOM), amelyben már 176 milliárd paraméter van kezelve, 46 természetes nyelvet és 13 programnyelvet lefedve ezzel. Mondjuk ezeknek a hozzáférhetősége elég nehézkes az átlagember számára, de még a kutatóknak sem könnyű őket használni különféle költségek és memóriagondok miatt.

Szóval egy ilyen nagy LLM-hez több rendkívül erős GPU-ra van szükség, ami azért költséges mulatság. Ezért a modell paraméterek „kiszervezése” kisebb, lassabb, de ugyanakkor sokak számára elérhető eszközökre, majd rétegenként végrehajtva ezeket, segíthet az LLM-ek elérhetőbbé tételében. Bár azért az ilyen kiszervezésben ott a késleltetés miatti kockázat, még így is egyszerre párhuzamosan elég sok paraméter futhat. Az LLM-eket még nyilvános API-kon keresztül lehetne kutatásoknál használni, ahol az egyik fél hostolja a modellt, a többiek pedig online használhatják. Viszont ez egy elég merev struktúra, ráadásul a jelenlegi API árakat figyelve, még drága is. Nemrégiben azonban megjelent a PETALS nevű keretrendszer, ami lehetővé teszi az online együttműködést több felhasználó között, hogy nagyméretű modelleket optimalizáljanak.

Minden felhasználó egy klienst, egy szervert vagy mindkettőt futtat, hasonlóképpen mint egy torrenthálózatnál. A szerver válaszol a kliensek kéréseire és a modell rétegeinek egy részét helyben tárolja. Mintha mindenkinél meglenne a teljes modell egy része. A teljes modell használatához a kliens létrehozhat egy folyamatpárhuzamos, egymást követő szerverláncot. Emellett a résztvevők módosíthatják a modellt az összes réteg betanításával vagy adapterek és gyorshangolás segítségével. Az almodulokat aztán be lehet helyezni egy modellközpontba, hogy mások is felhasználhassák őket elemzésekhez.

A PETALS teljes leírása itt érhető el: https://arxiv.org/pdf/2209.01188.pdf

 

Tomasito

Leginkább a technológiai és tudományos témák mozgatnak meg, főleg a blokkláncok és a kriptovaluták technológiai háttere, a valós felhasználási esetek valamint a privacy kapcsán felmerülő lehetőségek érdekelnek. Pénzügy-IT háttérrel bírok, a kriptovaluták mellett elég sok különféle területen építettem tapasztalatot.

Legfrissebb hírek

Kina, hadsereg, robotfarkas

Fegyveres robotfarkasokat tesztel a kínai hadsereg

Míg nemrég még a Kawasaki fejlesztésén ámuldozott a világ – egy olyan robotlovon, amely hegyoldalakon és patakokon is képes átvágni –, most a kínai hadsereg mutatott valami egészen mást: robotfarkasokat. A fegyverrel
Simpson poén

Elképesztő kutatómunka állt egyetlen poén mögött

Meglepő módon egyetlen poén is több hétnyi kutatómunkát jelentett a The Simpsons legendás forgatókönyvírója számára. Josh Weinstein elárulta: egy 28 éves vicchez olyan aprólékos kutatásra volt szükség, ami szinte filmbe illő. Amikor
nukleáris háború

Mennyi ideig tartana egy nukleáris háború?

Az Egyesült Államok reakciója egy nukleáris támadásra szigorúan titkos, de a Washington Post lépésről lépésre rekonstruálta, mi történne, ha egy ellenséges ország nukleáris rakétát lőne Amerika felé. És eljő az apokalipszis! Mi
lengyel piramisok

Ősi „lengyel piramisokat” tártak fel

Lengyelország középső részén, egy természetvédelmi területen újabb ősi megalitikus síremlékeket tártak fel – ezek az impozáns, több mint 5500 éves építmények méretük miatt a „lengyel piramisok” nevet kapták. Titokzatos sírhalmok Poznańi régészek
ősi technológia

10 ősi technológia, ami megkérdőjelezi történelmünket

Sokan úgy gondolják, hogy a technológiai fejlődés csak az ipari forradalommal kezdődött. Mégis akadnak olyan régészeti leletek, amelyek arra utalnak: ősi civilizációk már több ezer évvel ezelőtt is meglepően fejlett eszközöket használtak
hu_HUHungarian