Ce este RAG?

Retrieval-augmented generation (RAG) este o tehnică prin care un model lingvistic caută, în momentul întrebării, fragmente relevante din datele tale și le folosește pentru a-și fundamenta răspunsul, astfel încât acesta să citeze surse reale și actuale, nu doar ce a memorat modelul la antrenare.

Citește în englezăRAG

De ce contează

Dacă vrei un asistent AI care răspunde din propriile tale documente, politici sau istoric de suport și rămâne la zi pe măsură ce acestea se schimbă, RAG este de obicei punctul de plecare corect. Păstrează răspunsurile ancorate în surse pe care le controlezi, iar asta le face suficient de demne de încredere ca să le pui în fața clienților.

Cum funcționează, pe scurt

Un pas de căutare găsește în conținutul tău indexat fragmentele cele mai relevante pentru întrebare, apoi le trimite modelului LLM împreună cu promptul. Modelul răspunde folosind acel context, deci poate menționa detalii pe care nu le-a văzut niciodată la antrenare.

Unde greșesc echipele

Modelul este rareori problema, calitatea căutării este. Majoritatea sistemelor dezamăgitoare eșuează la împărțirea în fragmente, la embedding sau la ordonare, nu la generare. Repară căutarea înainte să te gândești la un model mai mare sau la fine-tuning.

Când îl alegem

Pentru majoritatea cererilor de tip „chatbot peste baza noastră de cunoștințe” pornim cu RAG și luăm în calcul fine-tuning abia după ce căutarea este cu adevărat solidă, iar o lipsă tot rămâne.

Termeni similari

Folosit în

RAG vs fine-tuning: de care are nevoie funcția ta AI?Echipele apelează la fine-tuning când de fapt vor ancorare. Iată diferența onestă și de ce majoritatea produselor vor întâi retrieval.

← Înapoi la glosar