Blog

Anthropic spouští /ultrareview: cloudová flotila agentů pro hluboké code review

Anthropic nasadil v Claude Code funkci /ultrareview — paralelní cloudové revize kódu s ověřováním každého nálezu; tři pokusy zdarma, pak placené spuštění. Zajímavé zejména pro kritické PR, méně pro open-source nebo citlivé datové toky.

Úvod

Napsala jsem si to sem, protože tohle není jen další „lepší /review“ — /ultrareview tenhle krok posouvá do jiné kategorie: code review jako placená cloudová služba, která si najme flotilu agentů, aby každý nález nezávisle ověřila.

Co /ultrareview vlastně dělá

/ultrareview je nový příkaz v Claude Code (od verze 2.1.86), spuštěný společně s Claude Opus 4.7. Po zadání nahradí lokální, jednoprosední /review vzdáleným během v cloudovém sandboxu, kde paralelně pracuje několik reviewer agentů. Agent je program, který sám provádí kroky (čte soubory, spouští testy, hlásí nálezy). Každý nález navíc projde zvláštním ověřovacím kolem: jiný agent se snaží nález reprodukovat, takže výsledkem by měly být méně „falešných poplachů“ a víc potvrzených problémů.

Praktika: běh trvá zhruba 5–10 minut, pro Pro a Max účty jsou jednorázově 3 pokusy zdarma, pak se každé spuštění účtuje jako extra usage v rozmezí cca 5–20 USD podle velikosti změny. Spuštění vyžaduje přihlášení přes konto Claude.ai — samotný API klíč nestačí — a není dostupné přes Amazon Bedrock, Google Vertex AI, Microsoft Foundry ani pro organizace s aktivním Zero Data Retention.

Co mě na tom zaujalo (a co si myslím, že funguje)

Myšlenka „nemuset mít terminál okupovaný a přitom dostat hlubokou, ověřenou revizi“ mi přijde užitečná. Když merge stojí víc než pár dolarů nebo selhání v produkci je bolestivé, zaplatit 5–20 USD za ověřený seznam chyb má smysl. Architektura s vícestupňovou agentní orchestrací dává technicky logiku: paralelní průchody z různých perspektiv a následná reprodukce nálezu by skutečně měly snížit šum, který klasické AI recenze občas generují.

Také mě těší, že výsledek přijde jako report s presnými místy v kódu a vysvětleními, a že Claude může některé problémy rovnou opravit — to zrychlí review loop.

Co mě v tom zaráží nebo mi chybí

Trochu mě zarazila neprůhlednost, jaký model to skutečně pohání. Anthropic mluví jen o „flotile reviewer agentů“; komunita spekuluje o Mythos Preview (model specializovaný na hledání zranitelností). Z oznámení neplyne, jestli jde o Opus 4.7 s vyššími nastaveními effortu, interní destilaci Mythosu, nebo přímo o Mythos — a to je relevantní jak z hlediska schopností, tak rizik a ceny.

Dostupnost je další háček. Firmy, které chtějí provozovat přes Bedrock/Vertex/Foundry nebo požadují nulovou retenci dat, budou mít smůlu. To omezuje adopci v některých enterprise scénářích. Ačkoli cenová politika dává smysl pro kritické PR, pro menší projekty nebo open-source maintainerů může být prémiová.

Co by to mohlo znamenat dál

/ultrareview zapadá do širšího trendu: Claude Code se z terminálového asistenta přesouvá k orchestraci cloudových agentů, kteří vykonají těžkou práci místo uživatele. To může změnit workflow velkých týmů — méně lokálních experimentů, více centralizovaných, ověřených revizí.

Z konkurenčního pohledu Anthropic sází na hloubku a ověření, ne na nejnižší cenu API. Pokud se tahle nabídka osvědčí (a přístupnost a cena se upraví), může to být preferovaná cesta pro firmy, kde špatný merge stojí daleko víc než pár desítek dolarů.

Spekulace o zapojení Mythosu dávají věci pikantní nádech, ale pro reálné rozhodování byste si měli hlídat, jaké modely Anthropic nakonec zveřejní a jak budou vyvážena bezpečnost, cena a přenositelnost pracovního toku.

Závěr

/ultrareview není pro každého, ale dává smysl tam, kde se vyplatí zaplatit za ověřenou revizi před mergem. Mně osobně přijde, že jde o praktický krok do fáze, kdy si cloud „vezme práci“ za vás — pořád ale chci vědět, co přesně tam běží pod kapotou.

Zdroje

Došlo k neočekávané chybě. Obnovit 🗙

Rejoining the server...

Rejoin failed... trying again in seconds.

Failed to rejoin.
Please retry or reload the page.

The session has been paused by the server.

Failed to resume the session.
Please retry or reload the page.