Blog

Agenti od OpenAI: sliby o produktivitě a otázky z provozu

OpenAI píše, že AI agenti mění práci a zvládnou delší a složitější úkoly. Z oznámení ale moc detailů neplyne, tak přidávám, kde to dává smysl a na co se ptát dřív, než to pustíte do firmy.

OpenAI zvedl vlajku „agenti mění práci“. Téma je horké, ale samotné sdělení je stručné. Proto si to překládám do praktika: kde dnes agenti pomáhají, kde hoří, a co bych si pohlídala.

Co to vlastně je „agent“

Agent není jen chat. Je to systém nad LLM (large language model — velký jazykový model), který si sám plánuje kroky, volá nástroje (API, databáze, e‑maily), sleduje stav a umí se vrátit, když něco nevyjde. Prostě digitální kolega, co má checklist a ruce v podobě integrací. Oproti jednorázové odpovědi zvládne delší běh, třeba: vytáhnout data z účtenek, doplnit chybějící položky, porovnat s politikou cest a poslat shrnutí ke schválení.

RPA (robotic process automation — skriptované klikání) tu byla roky. Agenti se liší tím, že umí pracovat s nepořádkem v datech a přirozeným jazykem. Daň za to je menší determinismus. A to je přesně ta část, která v praxi bolí, když nemáte dobré zábradlí.

Kde to dnes dává smysl

  • Backoffice workflow se semi‑strukturovanými vstupy: onboarding dodavatelů, enrichment z externích zdrojů, párování faktur na objednávky.
  • Podpora a triage: načtení ticketu, doplnění kontextu z CRM, návrh odpovědi a předání člověku ke schválení.
  • Analytické „špinavé“ práce: tahání metrik, psaní prvních draftů reportů, porovnání variant a generování shrnutí pro manažera.

Všude tam držím human‑in‑the‑loop (HITL — člověk ve smyčce) u kroků s dopadem na peníze, compliance nebo reputaci. Agenta nechám připravit, člověk potvrzuje. Je to rychlé a přitom klidně spíte.

Co mi v oznámení chybí

Stručné prohlášení tvrdí, že agenti zvládají delší a složitější úkoly a zvyšují produktivitu napříč rolemi. Bez čísel ale nepoznáme, jak moc a za jakou cenu. Co bych chtěla vědět:

  • Jak měří spolehlivost napříč kroky? Jedna hezká ukázka neznamená stabilní proces.
  • Limity autonomie: kdy se má agent zastavit a zavolat člověka? Jak se to konfiguruje?
  • Náklady: rozpad na tokeny, volání nástrojů, dlouhý běh. Kolik stojí jeden „uzavřený“ případ?
  • Observabilita a audit: kompletní log kroků, replay, verzování promptů a nástrojů.
  • Bezpečnost: sandbox pro nástroje, správa tajemství, princip nejmenších práv, oddělené identity.
  • Data retention a citlivost: jaká data si model pamatuje mezi běhy a kde je ukládá?
  • Handover: jak vypadá přechod z agenta na člověka tak, aby člověk nemusel číst román?

Bez těchto odpovědí je to spíš směr než návod.

Jak bych to nasadila v týmu zítra

  • Vyberte jeden proces s jasným SOP (standard operating procedure — popsaný postup), kde jsou dnes fronty a nízká tolerance k chybám jen na části kroků.
  • Zmapujte kroky na „agent může“ vs. „musí schválit člověk“. Definujte confidence threshold a pravidla pro dotaz na člověka („když si nejsi jistý, zeptej se“ není hanba, je to požadavek).
  • Instrumentujte vše: metriky přesnosti, čas na případ, náklad na případ, počet zásahů člověka. Bez toho nevíte, zda to pomáhá.
  • Postavte sandbox: separované účty, read‑only přístup, rate‑limity, kill‑switch. Agenta milujeme, ale nechceme, aby v pátek večer „pomáhal“ v produkci bez dozoru.
  • Testujte na syntetice, ale validujte na reálných vzorcích. Syntetická data ráda lakují realitu narůžovo.
  • Začněte s nízkou autonomií a přidávejte. Opačný směr bývá drahá lekce.

Trochu mě mrzí, že chybí konkrétní čísla a veřejné ukázky. Téma ale stojí za pozornost: agent jako trpělivý vykonavatel rutin je užitečná představa — jen mu dejte dobré mantinely a metr do ruky.

Zdroje

Došlo k neočekávané chybě. Obnovit 🗙

Rejoining the server...

Rejoin failed... trying again in seconds.

Failed to rejoin.
Please retry or reload the page.

The session has been paused by the server.

Failed to resume the session.
Please retry or reload the page.