use case
Obsługa klienta: agent odciąża, człowiek zamyka.
Obsługa klienta to nie miejsce na pełną automatyzację (człowiek ciągle rozwiązuje edge case'y), ale 50-80 procent typowych zgłoszeń może obsłużyć agent AI. Zostaje więcej czasu dla trudnych przypadków i strategicznych klientów.
Architektura: ingestion, classification, action, handoff
Typowy workflow obsługi klienta składa się z czterech warstw:
- Ingestion: zgłoszenie trafia różnymi kanałami (email, formularz, chat na stronie, SMS, WhatsApp, social media DM). Workflow normalizuje to do jednego formatu: from, subject, body, attachments, context (czy klient zalogowany, historia).
- Classification: LLM klasyfikuje intencję ("pytanie o fakturę", "reklamacja produktu", "prośba o demo", "żądanie zwrotu"), priorytet (low/medium/high/urgent), sentyment (neutralny/frustrated/angry), sugerowany rozwiązanie.
- Action: dla prostych spraw auto-response z informacjami (status zamówienia, szczegóły faktury, link do dokumentacji). Dla trudniejszych draft odpowiedzi dla agenta, ticket w ticketing system.
- Handoff: jeśli AI nie ma wystarczającej pewności albo sprawa wymaga człowieka (emocjonalna, krytyczna, nietypowa), eskalacja do konsultanta z pełnym kontekstem (historia klienta, prośba, sugerowany kierunek).
Triage: jak klasyfikować, żeby nie zgubić trudnych
Klasyfikacja to krok, w którym łatwo się pomylić. Moja architektura:
- Kategorie z jednoznaczną akcją: "status zamówienia" → lookup w ERP i auto-reply. "Prośba o fakturę" → wysyłka z archiwum. Takie sprawy rozwiązujemy w 100 procentach.
- Kategorie z draft dla agenta: "reklamacja produktu" → LLM generuje draft przeproszeniowy plus zaproponowane rozwiązanie (zwrot, wymiana, zniżka). Agent zatwierdza albo edytuje. 80-90 procent draftów przechodzi bez większych zmian.
- Kategorie wymagające człowieka od razu: "groźba prawna", "żądanie usunięcia danych RODO", "zgłoszenie fraudowe", "klient VIP top 20 procent". Te zgłoszenia omijają auto-response i od razu trafiają do dedicated zespołu.
- Kategoria niepewna: gdy LLM ma konfidencję poniżej 70 procent, ticket idzie do generalnego zespołu obsługi (nie auto-response, nie eskalacja, środek). Agent ocenia co dalej.
Mierzymy: accuracy klasyfikacji (po tygodniu sample 100 zgłoszeń, porównanie z ręcznym labelem), false positive rate (ile zgłoszeń otrzymało auto-reply a wymagały człowieka, te to koszt), false negative rate (ile zgłoszeń trafiło do człowieka a LLM by je rozwiązał, koszt minimalizowany).
RAG nad bazą wiedzy: jak LLM zna Twój produkt
LLM bez kontekstu Twojego produktu zmyśla. RAG (Retrieval Augmented Generation) daje mu wiedzę bez fine-tuningu.
Co trafia do bazy wiedzy:
- Dokumentacja produktu (FAQ, user manual, release notes).
- Wewnętrzne playbooks obsługi (jak rozwiązać zgłoszenia typu X, kiedy eskalować).
- Historia poprzednich rozwiązań (co zadziałało dla podobnego zgłoszenia w przeszłości).
- Polityki firmy (zwroty, reklamacje, warunki gwarancji).
Implementacja:
- Embed dokumenty do pgvector (jak na stronie o RAG).
- Przy zgłoszeniu embed pytanie, znajdź top-5 relevantnych fragmentów.
- LLM odpowiada cytując konkretne dokumenty ("według polityki zwrotów, pkt 3.2...").
- Agent weryfikuje cytaty przed wysłaniem (szczególnie przy sprawach prawnych albo finansowych).
Update bazy: incremental sync codziennie (dokumenty z Confluence, Notion, SharePoint synchronizowane), manualny re-embed raz na kwartał.
SLA tracking i alerting
Automatyzacja nie wystarczy, musi być monitorowana. Metryki, które track'uję:
- Time to first response: od wpłynięcia zgłoszenia do pierwszej odpowiedzi (czy to auto-reply czy człowiek). Target zwykle pod 1 godzinę w godzinach pracy, pod 4 godzin po godzinach.
- Time to resolution: od wpłynięcia do zamknięcia. Target per priorytet: high pod 4h, medium pod 24h, low pod 72h.
- Automation rate: procent zgłoszeń rozwiązanych bez człowieka. Typowo 40-60 procent na starcie, z czasem rośnie do 70-80 procent.
- Customer Satisfaction (CSAT): po zamknięciu zgłoszenia mail z prośbą o ocenę 1-5. Agent dobry: CSAT powyżej 4.3. Spadek poniżej 4.0 = alarm, review workflow.
- Reopen rate: procent zgłoszeń, które klient otworzył ponownie w ciągu 14 dni. Wysoki rate = rozwiązanie nie było realne.
Alerting: SLA breach (odpowiedź opóźniona powyżej 150 procent SLA), eskalacja do managera. CSAT spadek (trend 5 dni w dół), review przez team lead.
Human-in-the-loop jako feature, nie bug
Pełna automatyzacja obsługi klienta to mit marketingowy. W praktyce cel to "AI obsługuje 70 procent, ludzie obsługują 30 procent z większym skupieniem na tych 30".
Scenariusze, w których człowiek jest zawsze lepszy:
- Klient emocjonalny: frustracja, złość, płacz (tak, zdarza się). AI może podawać fakty, ale ludzka empatia zamyka sprawę. LLM klasyfikuje sentyment, eskaluje angry ticketów do senior agenta.
- Decyzje niestandardowe: klient prosi o zniżkę poza polityką, kompensatę powyżej pułapu, modyfikację umowy. Agent z uprawnieniami podejmuje decyzję w granicach, dyrektor w przypadkach szczególnych.
- Budowanie relacji: VIP clients, strategicznych partnerów, klientów z historią. LLM pomaga przygotowaniem, ale komunikacja zostaje w rękach dedicated account managera.
- Zgłoszenia prawne albo fraudowe: żądania RODO, podejrzenie oszustwa. Pełna odpowiedzialność człowieka, LLM tylko flaggowanie.
Mantra: AI robi nudne i powtarzalne, ludzie robią interesujące i wartościowe. Zespół obsługi po wdrożeniu ma lepsze rzeczy do roboty, nie traci pracy.
Najczęstsze pytania
Jakie kanały obsługi da się zautomatyzować?
Email najłatwiej (tekst, asynchroniczny, lookup w historii). Chat na stronie dobrze (real-time, ale wymaga szybkich odpowiedzi). WhatsApp i SMS OK dla prostych. Telefon najtrudniej: głos do tekstu plus LLM plus tekst do głosu działa dla simple (status zamówienia), ale dla złożonych dyskusji nie wystarcza.
Czy agent AI zastąpi nasz zespół obsługi?
Nie. Redukuje load o 40-60 procent, ale nie zastępuje całego zespołu. Zespół dalej obsługuje trudne, emocjonalne, strategiczne. Wiele firm po wdrożeniu nie zwalnia zespołu, ale skaluje biznes bez zatrudniania. Koszt jednostkowy obsługi spada, jakość rośnie, zespół ma lepsze rzeczy do roboty.
Jak długo trwa wdrożenie?
Podstawowy agent (klasyfikacja plus auto-reply dla top 5 scenariuszy): 3-4 tygodnie. Pełny flow z RAG, eskalacją i SLA tracking: 8-12 tygodni. Dla enterprise z wieloma kanałami i skomplikowanymi SLA 3-6 miesięcy z iteracjami.
Co jeśli LLM odpowie klientowi błędnie?
Zawsze robię guardrails: (1) prompt instruuje 'jeśli nie wiesz, nie zmyślaj, eskaluj do człowieka', (2) cytaty do dokumentacji są obowiązkowe, (3) dla spraw finansowych i prawnych obowiązkowy human review przed wysyłką. Plus audit log każdej odpowiedzi: jeśli coś poszło nie tak, łatwo zlokalizować i naprawić.
Czy możemy zacząć od małego zakresu?
Zalecam to wręcz. Pierwsza iteracja: jedna kategoria zgłoszeń (np. 'status zamówienia') plus auto-reply. Mierzymy accuracy i CSAT przez 2 tygodnie. Jeśli OK, dodajemy drugą kategorię. Tak po kolei, zamiast 'big bang' wdrożenia.
Chcesz pogadać o konkretnym projekcie?
Warsztat otwierający to 90 minut, zdalnie albo w Poznaniu, bez zobowiązań. Mówimy, czy Twój proces nadaje się do automatyzacji i w jakiej skali.
napisz do mnie → adi@workinflows.pl · LinkedIn