Blog

Agenti, hlas a peníze: co se teď děje mezi deployem a regulací

Poslední dny přinesly vlnu oznámení o hlasových modelech, agentních loopách a velkých investicích do enterprise adopce — a hned vedle toho i připomenutí, že modely mohou zmizet kvůli geopolitice.

Trochu mě zarazilo, jak rychle se témata agentů a enterprise nasazení propojila: same-day technické novinky (realtime hlas, autonomní smyčky) tučně stojí vedle velkých byznys kroků a dokonce i vládních zásahů. Tohle není jen další série feature releaseů — je to obrázek, jak se AI dostává z laboratoří do provozu, s důsledky technickými, organizačními i politickými.

Agenti, bezpečnost a hlas

OpenAI představil realtime hlasové modely

OpenAI vypustil do API realtime hlasové modely, které umějí mluvit, přepisovat, překládat a „rozumět“ kontextu v hovoru — tedy něco víc než jen jednoduchý STT/TTS. Mně přijde zajímavé, že teď oficiálně balí reasoning přes hlasové kanály, což otevírá aplikace od call center po asistenty v autě.

Co mi chybí v oznámení: detaily o latenci, ceně a ochraně soukromí (jak dlouho se audio ukládá, kde se zpracovává). Realtime a low-latency hlasové služby mají jednu obvyklou bolest — když tempo padne, uživatel si toho okamžitě všimne.

(OpenAI — realtime voice models)

Agentní smyčky: jak se bezpečně automatizuje kódování

Anthropic přidal do Claude Code příkaz /goal, který spouští autonomní smyčku: model pracuje, dokud externí evaluátor (malý rychlý model, Haiku) neoznačí cíl za splněný. To je praktické pro úlohy typu „dokud testy neprojdou“, a oceňuju, že evaluátor není hlavní model hodnotící sám sebe — oddělení role rozhodčího je obvykle lepší cesta.

Ale /goal má jasná omezení: evaluátor nevolá nástroje, takže musí být schopný posoudit výsledek jen z toho, co Claude napíše do transkriptu; bez "fuse" (max počet iterací) hrozí nekonečná smyčka a účty za tokeny. Mně se líbí, že je to pragmatické řešení — pořád mi ale chybí robustní nástroje pro tichá selhání, kdy session technicky doběhne, ale výsledek je špatný.

(Anthropic — Claude Code /goal)

Jak OpenAI provozuje Codex bezpečně

OpenAI popisuje, jak běží Codex interně: sandboxing, schvalovací toky, síťové politiky a telemetry na úrovni agentů. To není sexy čtení, ale je to nutné — pokud chcete deployovat kódovací agenty ve firmě, bez těchto pilířů to většinou nedopadne dobře.

Z mé zkušenosti platí, že bezpečnostní vrstvy bývají tím, co nasazení prodraží a zkomplikuje, ale zároveň to jsou věci, bez kterých enterprise adopce nemůže fungovat.

(OpenAI — Running Codex safely)

Byznys: kdo platí a kdo nasazuje

OpenAI Partner Network a $150M investice

OpenAI spouští Partner Network a k tomu dává $150M na urychlení enterprise adopce přes globální partnery. To je zřejmý tah, jak přesunout zodpovědnost za nasazení a integraci blíž k systémovým integrátorům a VAR partnerům — firmy tak mohou získat kapacitu, ale taky ztratit kontrolu nad vendor lock-in.

Důležité je sledovat, jak budou partneři vybíráni a jaký business model OpenAI tlačí: konzultace a implementace často znamenají další provozní závazky pro zákazníky.

(OpenAI — OpenAI Partner Network)

DeployCo a další služby pro nasazení

OpenAI zároveň uvedl DeployCo, specializovanou entitu, která má pomoci firmám převést frontier AI do produkce a měřit obchodní dopad. To spolu s Partner Network dává jasný signál: OpenAI chce nejen dodávat API, ale převzít část zodpovědnosti za delivery.

Osobně mě zajímá, jak se to bude lišit od klasických konzultačních modelů — jestli to bude levnější a rychlejší, nebo spíš jednodušší marketing pro už existující SI firmy.

(OpenAI — DeployCo)

B2B Signals a případ LSEG

OpenAI zveřejnil výzkum B2B Signals, který mapuje, jak „frontier“ firmy zintenzivňují adopci AI a staví agentní workflowy — a ukázal případ LSEG, kde OpenAI pomáhá zrychlit insighty napříč 4 000 zaměstnanci. To potvrzuje, že velké organizace hledají centralizované způsoby, jak škálovat inteligentní asistenty napříč týmy.

Co tu chybí: konkrétní metriky ROI nebo přesné ukazatele úspor. Výzkumy často ukazují benefity, ale firmy potřebují tvrdá čísla pro investiční rozhodnutí.

(OpenAI — B2B Signals; OpenAI — LSEG case)

Infrastruktura, fine-tuning a akcelerátory

AWS + Hugging Face: celý stack pro foundation models

AWS a Hugging Face zveřejnili referenční architekturu pro komplet stack — od P6 Blackwell instancí s NVLink až po orchestraci přes SageMaker HyperPod a inference nástroje jako vLLM a NVIDIA Dynamo. Je to přesně ten druh dokumentace, který enterprise architekti potřebují: všechny vrstvy pohromadě, včetně observability.

Mně přijde důležité, že se posunuje pozornost z „jak trénovat model“ na „jak to provozovat spolehlivě v produkci“.

(AI Feed — AWS and Hugging Face model stack)

Fine-tuning Cosmos Predict pro robotické video

Na Hugging Face se objevil návod, jak jemně dolaďovat NVIDIA Cosmos Predict 2.5 pomocí LoRA/DoRA pro generování video dat pro robotiku. To je praktický signál: generativní modely obrazu a videa se dostávají do pipeline pro simulační data a řízení robotů.

Technicky zní zajímavě, reálný přínos v produkci ale závisí na kvalitě simulovaných scén a schopnosti modelu přenést to na reálný hardware.

(Hugging Face — Cosmos fine-tuning)

DeepMind Accelerator v APAC pro klima

Google DeepMind spouští tří měsíční akcelerátor v Asii‑Pacifiku zaměřený na „AI for the Planet“, s bootcampem v Singapuru. Program má pomoct startupům a výzkumným týmům škálovat řešení pro klima, zemědělství a energii — to je potřeba.

Podpora vývojářů v regionech, které jsou klimaticky nejzranitelnější, má smysl; otázka je, jak se projekty dostanou z prototypu do reálného nasazení.

(Google DeepMind — Accelerator APAC)

Regulace, geopolitika a dodavatelské řetězce

Fable 5, Mythos 5 a exportní kontrola

Anthropic má jeden nepěkný moment: tři dny po uvedení modelů Fable 5 a Mythos 5 US Department of Commerce podřadil oba modely exportní kontrole a firma proto služby na chvíli vypnula. To je připomínka, že nejsme jen u technických rizik — modely mohou zmizet z trhu politickým rozhodnutím přes noc.

Autorsky mi to přijde jako varování pro evropské firmy: závislost na jednom frontier modelu od amerického dodavatele je teď i geopolitické riziko. Kdo očekává, že mu model poběží vždy a všude bez omezení, by si měl přehrát scénáře „co když nám přístup zítra zhasnou”.

(VibeCoding / Hypata — Fable 5 export control)

Co si z toho odnáším

Ecosystém se posouvá z experimentů do provozu: hlasové modely, autonomní smyčky a velká partnerství ukazují cestu k nasazení, ale zároveň se ukazují nové slabiny — provozní, bezpečnostní i geopolitické. Budu sledovat dvě věci: jak rychle se objeví robustní vzorce pro monitorování a audit agentních populací, a jak firmy řeší dodavatelská rizika, když modely mohou být staženy regulačním rozhodnutím.

Zdroje

Došlo k neočekávané chybě. Obnovit 🗙

Rejoining the server...

Rejoin failed... trying again in seconds.

Failed to rejoin.
Please retry or reload the page.

The session has been paused by the server.

Failed to resume the session.
Please retry or reload the page.