Blog

Agenti od OpenAI: sliby o produktivitě a otázky z provozu

25. 6. 2026AI

OpenAI píše, že AI agenti mění práci a zvládnou delší a složitější úkoly. Z oznámení ale moc detailů neplyne, tak přidávám, kde to dává smysl a na co se ptát dřív, než to pustíte do firmy.

OpenAI zvedl vlajku „agenti mění práci“. Téma je horké, ale samotné sdělení je stručné. Proto si to překládám do praktika: kde dnes agenti pomáhají, kde hoří, a co bych si pohlídala.

Co to vlastně je „agent“

Agent není jen chat. Je to systém nad LLM (large language model — velký jazykový model), který si sám plánuje kroky, volá nástroje (API, databáze, e‑maily), sleduje stav a umí se vrátit, když něco nevyjde. Prostě digitální kolega, co má checklist a ruce v podobě integrací. Oproti jednorázové odpovědi zvládne delší běh, třeba: vytáhnout data z účtenek, doplnit chybějící položky, porovnat s politikou cest a poslat shrnutí ke schválení.

RPA (robotic process automation — skriptované klikání) tu byla roky. Agenti se liší tím, že umí pracovat s nepořádkem v datech a přirozeným jazykem. Daň za to je menší determinismus. A to je přesně ta část, která v praxi bolí, když nemáte dobré zábradlí.

Kde to dnes dává smysl

Backoffice workflow se semi‑strukturovanými vstupy: onboarding dodavatelů, enrichment z externích zdrojů, párování faktur na objednávky.
Podpora a triage: načtení ticketu, doplnění kontextu z CRM, návrh odpovědi a předání člověku ke schválení.
Analytické „špinavé“ práce: tahání metrik, psaní prvních draftů reportů, porovnání variant a generování shrnutí pro manažera.

Všude tam držím human‑in‑the‑loop (HITL — člověk ve smyčce) u kroků s dopadem na peníze, compliance nebo reputaci. Agenta nechám připravit, člověk potvrzuje. Je to rychlé a přitom klidně spíte.

Co mi v oznámení chybí

Stručné prohlášení tvrdí, že agenti zvládají delší a složitější úkoly a zvyšují produktivitu napříč rolemi. Bez čísel ale nepoznáme, jak moc a za jakou cenu. Co bych chtěla vědět:

Jak měří spolehlivost napříč kroky? Jedna hezká ukázka neznamená stabilní proces.
Limity autonomie: kdy se má agent zastavit a zavolat člověka? Jak se to konfiguruje?
Náklady: rozpad na tokeny, volání nástrojů, dlouhý běh. Kolik stojí jeden „uzavřený“ případ?
Observabilita a audit: kompletní log kroků, replay, verzování promptů a nástrojů.
Bezpečnost: sandbox pro nástroje, správa tajemství, princip nejmenších práv, oddělené identity.
Data retention a citlivost: jaká data si model pamatuje mezi běhy a kde je ukládá?
Handover: jak vypadá přechod z agenta na člověka tak, aby člověk nemusel číst román?

Bez těchto odpovědí je to spíš směr než návod.

Jak bych to nasadila v týmu zítra

Vyberte jeden proces s jasným SOP (standard operating procedure — popsaný postup), kde jsou dnes fronty a nízká tolerance k chybám jen na části kroků.
Zmapujte kroky na „agent může“ vs. „musí schválit člověk“. Definujte confidence threshold a pravidla pro dotaz na člověka („když si nejsi jistý, zeptej se“ není hanba, je to požadavek).
Instrumentujte vše: metriky přesnosti, čas na případ, náklad na případ, počet zásahů člověka. Bez toho nevíte, zda to pomáhá.
Postavte sandbox: separované účty, read‑only přístup, rate‑limity, kill‑switch. Agenta milujeme, ale nechceme, aby v pátek večer „pomáhal“ v produkci bez dozoru.
Testujte na syntetice, ale validujte na reálných vzorcích. Syntetická data ráda lakují realitu narůžovo.
Začněte s nízkou autonomií a přidávejte. Opačný směr bývá drahá lekce.

Trochu mě mrzí, že chybí konkrétní čísla a veřejné ukázky. Téma ale stojí za pozornost: agent jako trpělivý vykonavatel rutin je užitečná představa — jen mu dejte dobré mantinely a metr do ruky.

Zdroje

https://openai.com/index/how-agents-are-transforming-work