Kao i svaka druga velika kompanija vođena tehnologijom ovih dana, Meta je osmislila svoj vodeći generativni AI model, nazvan Llama. Llama je donekle jedinstvena među glavnim modelima po tome što je “otvorena”, što znači da je programeri mogu preuzeti i koristiti kako god žele, uz određena ograničenja. Ovo je u suprotnosti sa modelima kao što su Anthropic Claude, OpenAI GPT-4o, koji pokreće ChatGPT, i Google Gemini, kojima se može pristupiti samo preko API-ja.
Meta se također udružio s kompanijama kao što su AWS, Google Cloud i Microsoft Azure kako bi dostupne verzije Llame u oblaku. Osim toga, kompanija je izdala alate dizajnirane posebno za detaljno prilagođavanje i prilagođavanje modela prema željama korisnika.
Koje su zapravo posebnosti Llame kao generativnog modela umjetne inteligencije? Koje su prednosti ovog modela, a koje mane u odnosu na druge alate umjetne inteligencije? Odgovore na ova i druga pitanja možete pronaći u sljedećem članku.
Llama je porodica generativnih modela umjetne inteligencije
Postoje čak tri modela: Llama 8B, Llama 70B i Llama 405B. Najnovije verzije su Llama 3.1 8B, Llama 3.1 70B i Llama 3.1 405B, koje su objavljene u julu. Svaki od ovih modela obučen je na internet stranicama, na različitim jezicima, javnom kodu i fajlovima, te na sintetičkim podacima, odnosno na podacima generiranim drugim generativnim modelom umjetne inteligencije.
Llama 3.1 8B i Llama 3.1 70B su mali, kompaktni modeli dizajnirani za rad na uređajima u rasponu od laptopa do servera. Llama 3.1 405B, sa druge strane, je model velikih razmera koji zahteva hardver data centra. Llama 3.1 8B i Llama 3.1 70B su manje sposobni od Llame 3.1 405B, ali su brži. WITH
vi Llama modeli imaju prozore konteksta od 128.000 tokena. Kontekst modela ili kontekstni prozor se odnosi na ulazne podatke, npr. tekst, koje model uzima u obzir prije generiranja izlaza, npr. dodatni tekst. Duži kontekst će dovesti do toga da modeli neće “zaboraviti” sadržaj novijih dokumenata i na kraju krajeva spriječiti mogućnost “skretanja” s teme i pogrešnog definiranja stvari, kao i davanja pogrešnih rezultata.
Šta Llama kao generativni model umjetne inteligencije može učiniti?
Kao i drugi generativni AI modeli, Llama može obavljati niz različitih zadataka podrške, kao što su kodiranje i odgovaranje na osnovna matematička pitanja, kao i sažimanje dokumenata na osam jezika: engleskom, njemačkom, francuskom, talijanskom, portugalskom, hindi, španjolskom i tajlandskom. Llama se uglavnom koristi za obavljanje zadataka koji koriste tekst, kao što su analiza i izračunavanje podataka unutar tabela i slično. Ali nažalost, nijedan od Llama modela ne može obraditi ili generirati slike, iako bi se to moglo promijeniti u bliskoj budućnosti.
Svi najnoviji Llama modeli mogu se konfigurirati za korištenje aplikacija, alata i API-ja trećih strana za obavljanje zadataka. Nadalje, obučeni su da koriste Brave Search da odgovore na pitanja o nedavnim događajima, Wolfram Alpha API za upite u vezi s matematikom i naukom i Python interpreter za provjeru koda.
Gdje korisnici mogu koristiti Llama generativni model?
Ako želite komunicirati sa Llamom, imajte na umu da ovaj model pokreće Metin AI chat bot na Facebook Messengeru, WhatsAppu, Instagramu, Oculusu i Meta.ai. Programeri koji koriste Llamu mogu preuzeti, koristiti ili implementirati model na najpopularnijim cloud platformama.
Meta tvrdi da ima više od 25 partnera koji “hostuju” Llamu, uključujući Nvidiju, Databricks, Groq, Dell i Snowflake. Neki od ovih partnera razvili su dodatne alate i usluge, uključujući alate koji omogućavaju modelima da upućuju na vlasničke podatke i koji omogućavaju manje latencije.
Meta predlaže korištenje svojih manjih modela, Lama 8B i Llama 70B za aplikacije opće namjene poput pokretanja chatbotova i generiranja koda. Llama 405B kako Meta tvrdi, trebalo bi se koristiti za aktivnosti kao što je proces prenošenja znanja sa velikog modela na manji, efikasniji model i generisanje sintetičkih podataka za obuku ili fino podešavanje alternativnih modela.
Koje sve alate Meta nudi za Llamu?
Pored Llame, Meta nudi i sljedeće alate:
- Llama Guard,
- Prompt Guard,
- CyberSecEval
Llama Guard pokušava otkriti potencijalno problematičan sadržaj koji je učitan ili generiran modelom Llama, uključujući sadržaj koji se odnosi na kriminalne aktivnosti, iskorištavanje djece, kršenje autorskih prava, promociju različitih vrsta uznemirujućeg sadržaja i seksualno zlostavljanje. Programeri mogu prilagoditi kategorije blokiranog sadržaja i primijeniti blokove na sve jezike koje Llama podržava.
Prompt Guard može blokirati tekst namijenjen Llami, ali samo tekst namijenjen da “napadne” model i prisili ga da se ponaša bilo nenamjerno ili štetno. Meta tvrdi da se Llama Guard može braniti od eksplicitno zlonamjernih upita.
CyberSecEval to nije toliko alat koliko je to kolekcija mjerila koja se koriste za mjerenje sigurnosti modela. CyberSecEval može procijeniti rizik koji Llama model predstavlja za programere aplikacija i krajnje korisnike, u oblastima kao što su „automatski društveni inženjering“ i „skaliranje ofanzivnih sajber aktivnosti i operacija“.
Koja su ograničenja s kojima se Lama suočava?
Kao i svaki drugi generativni model umjetne inteligencije, Llama se suočava s određenim ograničenjima.
Na primjer, nejasno je da li je Meta “trenirao” Llamu na sadržaj zaštićen autorskim pravima. Ako je tako, korisnici bi mogli biti odgovorni za kršenje prava ako nesvjesno koriste isječak zaštićen autorskim pravima koji je model povratio i koristio.
Programiranje je još jedna oblast na koju treba obratiti pažnju. Razlog za to je jasan: Llama, kao i svaki drugi generativni model umjetne inteligencije koji ima “programske” mogućnosti, može dati pogrešan ili jednostavno loš kod.
Kao što je slučaj sa bilo kojim drugim generativnim AI modelom, najbolje je da čovjek, stručnjak u zavisnosti od oblasti u pitanju, sam pregleda konačni rezultat. Llama je, bez obzira na svoje mogućnosti i potencijal, i dalje samo program, kolekcija kodova koji funkcionira na temelju precizno definiranih zakona, što znači da Llama, kao nijedan drugi AI model, ne može ništa kreativno dizajnirati sam.
Alan Milić
Članak Meta Llama: novi i drugačiji generativni model umjetne inteligencije prvi put se pojavio na PC CHIP-u.
Izvor: ( pcchip.hr / hjpc.ba )