Question 1

Który model wybrać na start wdrożenia?

Accepted Answer

Zwykle zaczynamy od mid-tier model dostawcy, którego klient już używa albo planuje używać (Vertex AI dla klientów na GCP, OpenAI dla klientów używających Azure). Na warsztacie weryfikujemy czy mid-tier wystarcza, albo czy potrzebujesz frontier model. Dla większości biznesowych zadań mid-tier daje 90-95 procent accuracy za rozsądny koszt.

Question 2

Czy możemy użyć LLM self-hosted zamiast płacenia API?

Accepted Answer

Tak dla dużych wolumenów (setki tysięcy execution miesięcznie) albo szczególnych wymagań compliance (tajemnica zawodowa, sektor regulowany). Koszt: GPU infrastruktura (cloud albo on-prem), dostrajanie modeli open-source, utrzymanie. Dla mniejszych wolumenów API jest tańsze mimo marży dostawcy.

Question 3

Jak mierzymy sukces po wdrożeniu?

Accepted Answer

Trzy metryki minimum: accuracy (porównanie LLM z decyzjami człowieka na sample), automation rate (procent decyzji, które LLM podjął bez eskalacji), cost per task (realny koszt tokens plus overhead). Każda mierzona miesiąc do miesiąca, alert przy spadku accuracy o więcej niż 10 procent.

Question 4

Co jeśli model zaczyna źle odpowiadać po miesiącach?

Accepted Answer

Trzy najczęstsze przyczyny: (a) dostawca zmienił wersję modelu pod tym samym aliasem, (b) dane wejściowe się zmieniły (nowy typ maili, nowy format PDF), (c) prompt degraduje przez kolejne poprawki. Rozwiązania: pin konkretnej wersji modelu, eval na bieżących danych co tydzień, rollback prompta do ostatniej dobrej wersji.

Question 5

Czy możemy robić LLM bez Vertex AI albo OpenAI?

Accepted Answer

Możemy. Dla klientów preferujących EU-only jest Mistral AI (Francja), dla self-hosted open-source Llama albo Qwen. Dla prostych zadań klasyfikacyjnych model 7B-13B uruchomiony lokalnie wystarcza. Dobór zależy od wymagań compliance, wolumenu i skali accuracy, jaką klient akceptuje.