LLM modeli – Kako rade veliki jezički modeli

LLM modeli (Large Language Models) su temelj na kojem počivaju svi moderni AI asistenti – od ChatGPT do Claude i Llama. Ali šta zapravo znači „veliki jezički model” i kako on može da razume i generiše tekst na desetine jezika? U ovom vodiću objasnićemo osnave LLM-a na način koji razume i početnik.

Šta je LLM?

LLM je neuronska mreža obučena na ogromnim količinama teksta – knjigama, člancima, web stranicama i dokumentima. Cilj joj je jednostavan: da predvidi sledeću reč u nizu reči. Zvuči prosto, ali kada model ima stotine milijardi parametara, ta sposobnost se pretvara u razumevanje konteksta, logike, pa čak i kreativnosti.

Kako LLM radi – korak po korak

Tokenizacija: Tekst se deli na tokene (delovi reči, reči, znakovi)
Ugrađivanje (embedding): Svaki token se pretvara u vektor – niz brojeva
Pažnja (attention): Model određuje koji tokeni su važni za kontekst
Predikcija: Model predviđa verovatnoću za svaki sledeći token
Generisanje: Bira najverovatniji token i ponavlja proces

Šta su tokeni?

Token je osnovna jedinica koju LLM obrađuje. Jedan token može biti cela reč, deo reči ili čak jedan znak. Na primer, reč „računar” može biti jedan token, dok „nepravilnost” može biti podeljena na „ne” + „pravil” + „nost”. Prosečno važi: 1 token ≈ 0.75 reči na engleskom, a na bosanskom/hrvatskom/srpskom je odnos nepovoljniji (više tokena po reči zbog morfologije).

Najpopularniji LLM modeli

Zatvoreni (komercijalni) modeli

GPT-4o – OpenAI-ov najnapredniji model, brz i sposoban
Claude 3.5 Sonnet – Anthropic-ov model poznat po sigurnosti i dugačkom kontekstu
Gemini 1.5 Pro – Google-ov model sa ogromnim kontekstnim prozorom

Otvoreni (open-source) modeli

Llama 3.1 – Meta-ov model, besplatan za preuzimanje
Mistral – Evropski model, efikasan i brz
Qwen 2.5 – Alibaba-ov model sa odličnom višejezičnom podrškom

Kontekstni prozor – koliko LLM može da zapamti?

Kontekstni prozor određuje koliko tokena model može obraditi odjednom. Veći prozor = više teksta odjednom. Tipične vrednosti:

GPT-4o: 128K tokena (~96.000 reči)
Claude 3.5: 200K tokena (~150.000 reči)
Gemini 1.5: 1M tokena (~750.000 reči)
Llama 3.1: 128K tokena

Zaključak

LLM modeli su moćni alati koji transformišu način na koji komuniciramo sa računarima. Razumevanje osnova – tokena, kontekstnog prozora, razlike između otvorenih i zatvorenih modela – pomaže vam da donesete bolje odluke o tome koji model koristiti i kako da dobijete najbolje rezultate. Bilo da koristite ChatGPT za svakodnevne zadatke ili Llama za lokalne projekte, znanje o LLM-ima je ključno za budućnost rada sa veštačkom inteligencijom.