Question 1

Ile dokumentów muszę mieć, żeby RAG miał sens?

Accepted Answer

Dolny próg to około 20 dokumentów z prawdziwą informacją (nie powtórzenia tego samego). Jeśli masz 5 dokumentów, wrzuć je wprost do promptu. Górny próg praktycznie nie istnieje, pgvector obsłuży setki tysięcy chunków, Vertex AI Vector Search miliony.

Question 2

Czy pgvector wystarczy, czy potrzebuję dedykowanej bazy wektorowej?

Accepted Answer

pgvector wystarczy do około miliona chunków i około 50 queries na sekundę. Powyżej (duże enterprise, masowe wdrożenia) rozważam Vertex AI Vector Search albo Pinecone. Dla 90 procent klientów pgvector to optymalny wybór: jedna baza Postgres dla wszystkiego, prosty deploy, znany operacyjnie.

Question 3

Jaki model embeddingowy wybrać dla polskiego tekstu?

Accepted Answer

Vertex AI textembedding-gecko-multilingual ma solidną obsługę polskiego i jest szybki. Dla self-hosted polecam sentence-transformers z modelem paraphrase-multilingual-mpnet-base-v2. Unikałbym modeli anglocentrycznych (text-embedding-ada-002 w starszej wersji), które gubią niuanse polskich deklinacji.

Question 4

Jak często muszę re-embedować dokumenty?

Accepted Answer

Tylko zmienione dokumenty. Ustawiam incremental sync: cron co 1-4 godziny sprawdza updated_at albo hash treści, re-embed tylko dla zmodyfikowanych chunków. Pełny re-embed bazy (po zmianie modelu embeddingowego albo strategii chunkingu) robiony manualnie, raz na pół roku albo rzadziej.

Question 5

Co jeśli dokumenty zawierają dane osobowe?

Accepted Answer

Wybór między: (a) embed w regionie EU z umową powierzenia dostawcy modelu (Vertex AI EU), (b) self-hosted embedding model na infrastrukturze klienta, (c) maskowanie PII przed embedem (pseudonimizacja nazwisk, adresów, numerów kart). Wybieramy na warsztacie w zależności od kategorii danych i wymogów compliance.