OpenAI zvedl vlajku „agenti mění práci“. Téma je horké, ale samotné sdělení je stručné. Proto si to překládám do praktika: kde dnes agenti pomáhají, kde hoří, a co bych si pohlídala.
Co to vlastně je „agent“
Agent není jen chat. Je to systém nad LLM (large language model — velký jazykový model), který si sám plánuje kroky, volá nástroje (API, databáze, e‑maily), sleduje stav a umí se vrátit, když něco nevyjde. Prostě digitální kolega, co má checklist a ruce v podobě integrací. Oproti jednorázové odpovědi zvládne delší běh, třeba: vytáhnout data z účtenek, doplnit chybějící položky, porovnat s politikou cest a poslat shrnutí ke schválení.
RPA (robotic process automation — skriptované klikání) tu byla roky. Agenti se liší tím, že umí pracovat s nepořádkem v datech a přirozeným jazykem. Daň za to je menší determinismus. A to je přesně ta část, která v praxi bolí, když nemáte dobré zábradlí.
Kde to dnes dává smysl
- Backoffice workflow se semi‑strukturovanými vstupy: onboarding dodavatelů, enrichment z externích zdrojů, párování faktur na objednávky.
- Podpora a triage: načtení ticketu, doplnění kontextu z CRM, návrh odpovědi a předání člověku ke schválení.
- Analytické „špinavé“ práce: tahání metrik, psaní prvních draftů reportů, porovnání variant a generování shrnutí pro manažera.
Všude tam držím human‑in‑the‑loop (HITL — člověk ve smyčce) u kroků s dopadem na peníze, compliance nebo reputaci. Agenta nechám připravit, člověk potvrzuje. Je to rychlé a přitom klidně spíte.
Co mi v oznámení chybí
Stručné prohlášení tvrdí, že agenti zvládají delší a složitější úkoly a zvyšují produktivitu napříč rolemi. Bez čísel ale nepoznáme, jak moc a za jakou cenu. Co bych chtěla vědět:
- Jak měří spolehlivost napříč kroky? Jedna hezká ukázka neznamená stabilní proces.
- Limity autonomie: kdy se má agent zastavit a zavolat člověka? Jak se to konfiguruje?
- Náklady: rozpad na tokeny, volání nástrojů, dlouhý běh. Kolik stojí jeden „uzavřený“ případ?
- Observabilita a audit: kompletní log kroků, replay, verzování promptů a nástrojů.
- Bezpečnost: sandbox pro nástroje, správa tajemství, princip nejmenších práv, oddělené identity.
- Data retention a citlivost: jaká data si model pamatuje mezi běhy a kde je ukládá?
- Handover: jak vypadá přechod z agenta na člověka tak, aby člověk nemusel číst román?
Bez těchto odpovědí je to spíš směr než návod.
Jak bych to nasadila v týmu zítra
- Vyberte jeden proces s jasným SOP (standard operating procedure — popsaný postup), kde jsou dnes fronty a nízká tolerance k chybám jen na části kroků.
- Zmapujte kroky na „agent může“ vs. „musí schválit člověk“. Definujte confidence threshold a pravidla pro dotaz na člověka („když si nejsi jistý, zeptej se“ není hanba, je to požadavek).
- Instrumentujte vše: metriky přesnosti, čas na případ, náklad na případ, počet zásahů člověka. Bez toho nevíte, zda to pomáhá.
- Postavte sandbox: separované účty, read‑only přístup, rate‑limity, kill‑switch. Agenta milujeme, ale nechceme, aby v pátek večer „pomáhal“ v produkci bez dozoru.
- Testujte na syntetice, ale validujte na reálných vzorcích. Syntetická data ráda lakují realitu narůžovo.
- Začněte s nízkou autonomií a přidávejte. Opačný směr bývá drahá lekce.
Trochu mě mrzí, že chybí konkrétní čísla a veřejné ukázky. Téma ale stojí za pozornost: agent jako trpělivý vykonavatel rutin je užitečná představa — jen mu dejte dobré mantinely a metr do ruky.