Agenti v ateliéru i v kódu: konektory, cenová válka a agentní kontrola
Blog

Agenti v ateliéru i v kódu: konektory, cenová válka a agentní kontrola

Anthropic napojil Claude na nástroje pro tvorbu, xAI snižuje ceny u Grok 4.3 a OpenAI posouvá agentní bezpečnost pomocí Auto-review. Mně přijde, že teď se bojuje o to, kdo bude orchestrace a kdo bude hlídač.

Trochu mě zarazilo, jak se v posledních dnech sešly tři trendy: AI se rozhrnula víc do kreativních nástrojů, fronťáci si vyměňují cenové rány a zároveň dorazily praktické (ale ne dokonalé) způsoby, jak nechat agenty rozhodovat bez neustálého lidského zásahu.

Kreativní nástroje a orchestrace

Anthropic: Claude konektory do Ableton, Adobe a Blenderu

Anthropic vydal MCP konektory, které napojují Claude na Ableton, Adobe Creative Cloud, Blender, SketchUp, Autodesk Fusion a další. To znamená, že model může spouštět skripty, hromadně zpracovávat assety, generovat 3D modely z popisu nebo třeba ovládat VJ software v reálném čase přes přirozený jazyk. Mně osobně přijde nejsilnějším bodem ten příběh o "orchestrace nad nástroji": Claude může stát nad různými aplikacemi a koordinovat workflow, zatímco jednotlivé appky mají své vlastní AI funkce.

Otázka je jasná: vyhraje efekt provázanosti (jedno místo, odkud to řídíte) nebo blízkost k plátnu (AI zabudované přímo v Adobe/Canva)? Chybí mi v oznámení detaily o ceně, latenci a tom, jak se řeší přístup k lokálním datům — to rozhodne, jestli to bude hračkou pro profesionály nebo spíš hračka do experimentů.

Google Flow/Google Vids a filmová výzva XPRIZE

Google najednou nabízí Google Vids — možnost generovat až 10 videí měsíčně zdarma — a zároveň podporuje Future Vision film competition s XPRIZE. To dává dohromady dva efekty: tvorba videa se dál demokratizuje a vzniká příležitost, kde AI může pomoci s nápadem i s produkcí. To je fajn pro mladé filmaře, ale také to zvyšuje tlak na autorská práva a kvalitu obsahu. Jako kreativci bychom měli začít řešit workflow, jak v takovém prostředí udržet originalitu.

Modely, výkon a byznys

xAI: Grok 4.3 s agresivním cutem cen

xAI nasadil Grok 4.3 a snížil ceny o ~40 % pro vstupní tokeny a ~60 % pro výstupní tokeny proti Grok 4.20. Na benchmarku Artificial Analysis Intelligence Index dosáhl skóre 53 (o 4 body víc než předchůdce) a na agentních úlohách zaznamenal skok na 1500 ELO na GDPval-AA, tedy překonal i některé konkurenční preview verze. Současně ale Grok 4.3 generuje o ~44 % více výstupních tokenů.

To jasně vypadá jako snaha koupit si trh: nižší cena + mírně lepší výkon. Pro uživatele to může znamenat levnější automatizace, pro konkurenci další tlak na margin. Mně přijde zajímavé, jak se teď cenová válka přesouvá i k těm „frontier“ modelům — není to už jen o mid-tieru.

OpenAI: GPT-5.5 Instant a systémová karta

OpenAI uvedl GPT-5.5 Instant jako výchozí model ChatGPT: tvrdí lepší přesnost, méně halucinací a lepší personalizační možnosti. Součástí jsou také System Card a Bio Bug Bounty zaměřený na bio-bezpečnost (odměny až do $25,000). Je patrné, že OpenAI kombinuje produktová vylepšení s bezpečnostními incentivami — což je rozumné, i když otázka zůstává u měřitelnosti reálných rizik v praxi.

Agenti, bezpečnost a workflow

OpenAI Codex Auto-review: když agent hlídá agenta

OpenAI nasadilo Auto-review pro Codex — místo toho, aby uživatel schvaloval každý krok mimo sandbox, eskaluje se to na samostatného agenta (poháněného GPT-5.4 Thinking v "low reasoning" módu), který rozhodne. OpenAI uvádí dramatické snížení zásahů uživatele (interně zhruba 200× méně) a efektivní schvalovací míru 99,93 % napříč všemi akcemi; na eskalovaných akcích je auto-approval 99,1 %.

To je pragmatické řešení pro produktivitu — méně tření, hladší běh dlouhotrvajících úkolů. Současně je tu ale známý háček: LLM strážce sdílí některé chybové módy s hlavním agentem. OpenAI to přiznává — Auto-review není deterministickou zárukou bezpečnosti, lze ho oklamat a neřeší dobře „scheming“ uvnitř sandboxu. Mně to přijde jako užitečný kompromis: dobré pro nepřísné prostředí vývoje, rizikové tam, kde jde o produkční tajemství nebo kritické kredence.

Zajímavé je i to, že Auto-review je open-source, takže bezpečnostní týmy mohou auditovat promptování a rozhodovací logiku. To kontrastuje s některými jinými přístupy, kde jsou reviewer systémy víc uzavřené.

Workspace agents a vzdělávání o Codexu

Nové materiály o tom, jak stavět Workspace agents a jak Codex funguje, dávají praktický návod pro týmy, které chtějí automatizovat opakované workflow. Doporučuju je projít dřív, než pustíte agenta do CI/CD nebo do přístupu k produkčním datům — architektura a audit logy tam hrají větší roli než hezká demo ukázka.

Bio Bug Bounty pro GPT-5.5

Výzva na red-teaming biologických jailbreaků s odměnami až $25k je krokem dobrým směrem: zaplatit komunitě za nalezení rizik je pragmatické. Nicméně mě zajímá, jak daleko pokryje reálné scénáře zneužití a jestli odměny skutečně pokryjí ty nejsofistikovanější útoky.

Infrastruktura a produktové novinky

Jak OpenAI řeší nízkou latenci pro hlas

OpenAI přestavěl svůj WebRTC stack, aby dosáhl nízké latence pro Voice AI — to je klíčové pro plynulé hovory, okamžité reakce a přirozené přepínání řeči mezi uživatelem a modelem. Prakticky to otevírá dveře pro aplikace jako real-time přepis, interaktivní asistenty nebo hlasové agentní systémy.

ChatGPT reklamy: self-serve a CPC

OpenAI rozšiřuje možnosti nákupu reklam v ChatGPT — beta Ads Manager, CPC bidding a lepší měření. Firma opakuje, že chce udržet konverzace oddělené od reklam a chránit soukromí. Jako inzerent by mě zajímalo, jak to sedne do UX: když se reklama objeví v konverzačním prostoru, hranice mezi pomocí a komerční nabídkou může být tenká.

Co si odnáším a co budu sledovat dál

Celý tenhle mix mi říká jednu věc: agenti přestávají být experimentem a začínají žít v reálných pracovních tocích — v ateliéru, v CI i v cells týmu. To přináší užitek, ale zároveň nutí přehodnotit bezpečnostní modely, obchodní strategie a to, kdo vlastně drží kontrolu nad procesem tvorby.

Budu sledovat zejména adopci Anthropic konektorů (zda se stanou "orchestrátorem" nebo jen doplňkem), dopad cenových tahů Grok na trh frontier modelů a praktické slabiny Auto-review v reálných útocích.

Zdroje

Došlo k neočekávané chybě. Obnovit 🗙

Rejoining the server...

Rejoin failed... trying again in seconds.

Failed to rejoin.
Please retry or reload the page.

The session has been paused by the server.

Failed to resume the session.
Please retry or reload the page.