Blog

GLM-5.2: otevřené váhy a ambice dorovnat Mythos v hledání chyb

Zhipu AI vypustila GLM-5.2 s otevřenými váhami a někteří výzkumníci tvrdí, že v některých scénářích dorovnává Mythos od Anthropic. Zaujalo mě to hlavně tím, jak se tu potkává technika s politikou.

Čínská Zhipu AI (Z.ai) vypustila GLM-5.2 s otevřenými váhami a kolem modelu se objevilo tvrzení, že v určitých bezpečnostních úlohách dorovnává Mythos od Anthropic. To je kombinace, která dráždí jak techniky, tak regulátory.

Co přesně Zhipu uvádí

GLM-5.2 je „open-weight“ model — otevřené váhy znamenají, že si můžete stáhnout samotné parametry modelu a spustit ho lokálně, často i na běžně dostupném hardwaru. Mythos je bezpečnostní model od Anthropic zaměřený na vyhledávání zranitelností v software, tedy hledání chyb, které lze zneužít.

Někteří výzkumníci podle článku říkají, že GLM-5.2 v určitých scénářích ladí s Mythos při hledání bugů. Zároveň platí, že v obecných úlohách (typicky konverzace, znalostní otázky) GLM stále zaostává za Anthropic a OpenAI. To dává smysl: specializace často vyhraje v úzkém pruhu disciplíny, ale mimo něj není důvod čekat zázrak.

Politika potkává modelové karty

Administrativa Donalda Trumpa vnímá schopné modely typu Mythos nebo Fable jako bezpečnostní riziko a omezuje přístup k nim i k hardwaru pro jejich trénink a provoz. OpenAI zároveň u GPT-5.6 zvedla varovný prst a přístup k němu omezila.

Otevřené váhy do téhle rovnice hází vidle. Když jde model stáhnout a spustit bez dohledu poskytovatele, získávají obránci možnost nasadit ho uvnitř firemní sítě bez sdílení kódu ven — a útočníci zase nástroj, který jim nikdo nevypne přepnutím na straně cloudu. Tohle napětí mezi kontrolou rizik a praktickou použitelností je podle mně nejzajímavější část příběhu.

Co mi v oznámení chybí

Metodika. Nevidím, na jakých datasetech nebo soutěžních úlohách bylo „dorovnání Mythosu“ měřeno, ani jak vypadalo nastavení (prompting, nástroje, čas). Věta „v některých scénářích“ může znamenat cokoliv od CTF úloh po statickou analýzu repozitářů. Bez téhle informace si netroufnu hodnotit, jestli jde o robustní výsledek, nebo šikovně zvolené demo.

Licenci také neznám; „open-weight“ nemusí nutně znamenat otevřený kód nebo volné komerční použití. Pokud o nasazení uvažujete, bude dobré si podmínky pečlivě přečíst.

Co z toho může být prakticky

Menší bezpečnostní týmy dostanou do ruky nástroj, který lze spustit lokálně a integrovat do CI pipeline bez citlivých dat putujících do cizího cloudu. To je plus. Stejně snadno si ale model stáhne i někdo, kdo hledá zneužitelné chyby rychleji než vy je stihnete zalátat — a to je důvod, proč americké regulace sázejí na omezení přístupu k nejlepším vahám a k výkonnému hardwaru.

Osobně beru zprávu hlavně jako signál, že „mezera“ mezi americkými a čínskými modely se v některých užších doménách zmenšuje, i když v obecné inteligenci to zatím neplatí. Benchmarky jsou fajn, ale ráda uvidím realitu v produkčních nástrojích: kolik nových, dosud neznámých zranitelností takový model skutečně odhalí a jak moc práce ušetří lidem na druhé straně klávesnice.

Zajímavý týden pro všechny, kdo si hrají s bezpečností a modely — a trochu neklidný pro ty, kdo píšou exportní regulace.

Zdroje

Došlo k neočekávané chybě. Obnovit 🗙

Rejoining the server...

Rejoin failed... trying again in seconds.

Failed to rejoin.
Please retry or reload the page.

The session has been paused by the server.

Failed to resume the session.
Please retry or reload the page.