słownik automatyzacji
RAG
RAG (Retrieval-Augmented Generation) to technika, w której model językowy przed wygenerowaniem odpowiedzi pobiera z zewnętrznej bazy wiedzy fragmenty dokumentów semantycznie związane z zapytaniem. Dzięki temu odpowiedź opiera się na konkretnych, aktualnych danych zamiast tylko na wiedzy wyuczonej podczas treningu modelu.
Standardowy LLM ma trzy problemy przy zastosowaniach biznesowych: nie zna Twoich danych wewnętrznych, jego wiedza ma datę graniczną, i potrafi "halucynować" fakty. RAG rozwiązuje wszystkie trzy jednocześnie. Zamiast pytać modelu "co wiesz o naszym cenniku", wyszukujesz semantycznie odpowiednie fragmenty z własnej bazy i podajesz je jako kontekst. Model generuje odpowiedź na podstawie tego, co dostał, a nie tego, co "pamięta".
Techniczny przepływ RAG wygląda tak: zapytanie użytkownika zamieniane jest na wektor embeddingiem (reprezentacja numeryczna znaczenia), następnie ten wektor porównywany jest z wektorami dokumentów w bazie przez podobieństwo cosinusowe, najbardziej zbliżone fragmenty trafiają do kontekstu LLM razem z zapytaniem. Dobry RAG łączy wyszukiwanie wektorowe z pełnotekstowym (BM25) dla lepszego pokrycia zarówno semantyki jak i słów kluczowych.
RAG to jedyny sensowny wybór gdy potrzebujesz, żeby LLM odpowiadał na pytania o Twoje dane wewnętrzne i nie chcesz fine-tunować modelu co tydzień przy każdej zmianie dokumentacji.
W praktyce
Chatbot marki na workinflows.pl używa RAG Engine w Vertex AI z corpus workinflows-marketing. Dokumenty z opisu usług, case studies i FAQ są podzielone na fragmenty, zamienione na embeddingi przez text-multilingual-embedding-002 i zapisane w Vertex AI. Gdy użytkownik pyta o wdrożenia n8n, agent najpierw przeszukuje ten corpus, pobiera 3-5 najbardziej relewantnych fragmentów i dopiero wtedy generuje odpowiedź z Gemini Flash. Jeśli w bazie nie ma informacji, agent odpowiada "brak danych w bazie" zamiast zmyślać.
To drugie jest kluczowe. Fallback "nie wiem" jest zawsze lepszy od halucynacji w kontekście produkcyjnym.
Powiązane
Chcesz zbudować RAG na swoich danych?
Wdrażam RAG z Vertex AI RAG Engine, pgvector i n8n jako orkiestratorem dla agenta.
RAG i Vertex AI