Zamislite da imate hiljade PDF dokumenata, ugovora i izveštaja, a treba vam odgovor na specifično pitanje. RAG (Retrieval-Augmented Generation) je tehnologija koja kombinuje pretragu dokumenata sa generisanjem odgovora – AI čita vaše podatke i daje precizne, dokumentovane odgovore umesto da nagađa.
Problem: LLM ne zna vaše podatke
Standardni LLM (kao ChatGPT) je obučen na javnim podacima do određenog datuma. Ne zna ništa o vašoj kompaniji, internim dokumentima ili specifičnoj bazi znanja. RAG rešava ovaj problem tako što „unosi” relevantne informacije u prompt pre nego što model generiše odgovor.
Kako RAG radi – 3 koraka
- Korak 1 – Indexed: Dokumenti se dele na chunks (delove), pretvaraju u vektore i čuvaju u vektorskoj bazi
- Korak 2 – Retrieval: Kada postavite pitanje, sistem traži najsličnije chunks u bazi koristeći semantičku pretragu
- Korak 3 – Generation: Pronađeni delovi se šalju LLM-u zajedno sa vašim pitanjem, i model generiše odgovor zasnovan na tim podacima
Praktični primeri RAG-a
- Korporativni asistent: Zaposleni pitaju „Koliko je godišnji odmor za probni rad?” – RAG nalazi odredbu u pravilniku i citira je
- Pravni asistent: Pretražuje ugovore i zakone za relevantne klauzule
- Medicinski asistent: Pretražuje medicinsku literaturu za simptome i terapije
- Tehnička dokumentacija: Programeri pitaju „Kako konfigurišem API autentikaciju?” – RAG nalazi odgovor u dokumentaciji
Alati za RAG
- LangChain – Popularni Python framework za RAG pipeline
- LlamaIndex – Framework specijalizovan za indeksiranje dokumenata
- Chroma / Pinecone / Weaviate – Vektorske baze podataka
- OpenAI Embeddings – Servis za pretvaranje teksta u vektore
Prednosti RAG-a nad finetuningom
Finetuning (dodatno treniranje modela) je skup i kompleksan. RAG je jednostavniji, jeftiniji i ažurniji – jednostavno dodajte nove dokumente u bazu bez ponovnog treniranja. Takođe, RAG uvek navodi izvore, što je važno za proverivost.
Zaključak
RAG tehnologija je most između opšteg znanja LLM-a i vaših specifičnih podataka. Umesto da se oslanjate na model koji nagađa, RAG mu daje tačne informacije na osnovu kojih gradi odgovor. Ako radite sa dokumentima, bilo kojim – od pravilnika do tehničke dokumentacije – RAG je tehnologija koju vredi upoznati.
