Blog

Anthropic vypnul Fable 5 a Mythos 5 — co se vlastně stalo a proč to zaráží

Po spuštění Fable 5 a Mythos 5 9. června přišla 12. června vládní instrukce o zablokování zahraničního přístupu; Anthropic nakonec modely stáhl úplně. Tahle epizoda otevírá víc otázek než odpovědí.

Zaujalo mě to, protože jde o ránu pod pás mezi bezpečností, komerční dostupností a geopolitií — a dost možná i o precedens.

Krátké shrnutí toho, co se stalo

Anthropic 9. června vydal Fable 5 a Mythos 5; firma tvrdila, že Fable 5 „překonává všechny modely, které dosud veřejně zpřístupnila“, a že Mythos 5 je tentýž základní model „ale s někdy zmírněnými bezpečnostními opatřeními“ (to je běžné označení pro filtry a omezení, které zabraňují generování škodlivého obsahu). 12. června přišla podle reportů instrukce blokovat zahraniční přístup k těmto modelům — údajně po tom, co Amazonův bezpečnostní výzkum ukázal, že Fable 5 lze donutit vydat informace, které by šly použít pro kyberútoky.

Anthropic na to zareagoval radikálně: „We are complying with the government’s legal directive and are removing access to Fable 5 and Mythos 5 for all users. However, we disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people.“ Jinak řečeno: dodržíme příkaz, ale nesouhlasíme, že jde o dostatečný důvod k úplnému stažení.

Proč mě to zaujalo (a proč byste měli být ostražití taky)

Jde o tři propletené věci — techniku (jailbreak), bezpečnost (možnost zneužití), a právní-politickou moc státu. Jailbreak je v praxi trik nebo posloupnost vstupů, která obejde ochrany modelu a donutí ho říct věci, které by normálně odmítl. Když někdo řekne, že model jde „jailbreaknout“ tak, aby poskytl návod na kyberútok, zní to závažně — ale záleží na detailech: jde o reprodukovatelný, snadno automatizovatelný postup, nebo o specifický experiment, který nedává útočníkovi praktickou výhodu?

Taky je pozoruhodné, že místo lokálního omezení vládní instrukce vedla k úplnému stažení pro všechny zákazníky. To mě nutí ptát se, kdo v praxi rozhoduje o dostupnosti modelů: firma, bezpečnostní tým, nebo stát? A co to udělá pro firmy, které chtějí nabízet služby globálně, když by jim vláda mohla s jedním příkazem zúžit trh či vynutit stažení?

Co mi v téhle zprávě chybí — a proč to není jen technická debata

Není jasné, která přesně právní autorita ten příkaz vydala, jaký je právní základ, a jestli jde o dočasné opatření nebo dlouhodobý zákaz exportu. Nevíme podrobnosti o tom „narrow potential jailbreak“ — jak snadno napodobitelný je, kdo ho testoval a jaké konkrétní informace model měl vydávat. Spekulace o tom, že Čína mohla mít přístup k Mythos, se objevily, ale potvrzení chybí.

Také chybí transparentní roadmapa opravy: plánuje Anthropic bezpečnostní záplatu, novou verzi modelu, nebo testovací audit třetí stranou? A jak se do toho zapojí další hráči — poskytovatelé cloudů, partneři, bezpečnostní výzkumníci?

Co by to mohlo znamenat dál

Případ může vyústit v tvrdší regulační praxi vůči modelům považovaným za „riskantní“ — buď formou exportních omezení, nebo povinných bezpečnostních auditů. To může podnítit zájem o „non‑American“ řešení, jak už se psalo — firmy mimo USA mohou v očích některých zákazníků vypadat jako méně náchylné k americkým zásahům. Na druhou stranu to posiluje tlak na producenty modelů, aby měly robustnější interní bezpečnostní testy a transparentní komunikaci o rizicích.

Mně osobně přijde, že přístup „stažení pro všechny“ je pohodlný krok dočasně, ale stěží udržitelný jako precedens — potenciálně to pošle signál k rychlým, širokým výpadkům služby místo k cíleným opravám a lepší koordinaci bezpečnostního výzkumu.

Dát pozor: budu sledovat, jestli se objeví technický detail jailbreaku, jakou právní cestou šla instrukce a kdy (nebo jestli) se modely vrátí do provozu s opravami.

Zdroje

Došlo k neočekávané chybě. Obnovit 🗙

Rejoining the server...

Rejoin failed... trying again in seconds.

Failed to rejoin.
Please retry or reload the page.

The session has been paused by the server.

Failed to resume the session.
Please retry or reload the page.