Blog

OpenAI ukázal GPT‑5.6: Sol, Terra, Luna a politika v zádech

OpenAI pustil limitované preview GPT‑5.6 a k technickým novinkám přibalil nezvyklé ladění s americkou administrativou. Ceny, „max/ultra“ režimy i důraz na bezpečnost jsou tentokrát pod drobnohledem.

Tohle spojení nové řady modelů a dohledu Bílého domu jsem si nemohla nechat ujít. OpenAI ukázal GPT‑5.6 v limitovaném preview a k technice přidal nezvykle dlouhou kapitolku o bezpečnosti a spolupráci s vládou.

Co vlastně přibylo a za kolik

Trojice modelů má jednoduchá jména: Sol (vlajková loď), Terra (střední třída pro „vysoký objem práce“) a Luna (rychlý a levný každodenní model). OpenAI říká, že se hodí hlavně na kódování, kyberbezpečnost a biologii a že udrží fokus při dlouhodobých „agentních“ úlohách — agentní AI jsou systémy, které samostatně plánují kroky a jednají v čase.

Cenovka je konkrétní alespoň u Sol: 5 \(za vstupní a 30\) za výstupní milion tokenů. To je zhruba polovina proti Anthropic Claude Fable 5 (10 \(/ 50\)). Terra má stát polovinu Sol a Luna méně než polovinu Terry. Na detailní tabulku si ale budeme muset počkat, preview je limitované.

Zajímavostí jsou dva módy Sol: „max“ pro hlubší uvažování a „ultra“ pro využití sub‑agentů. To evokuje projekt OpenClaw a může naznačovat práci Petera Steinbergera uvnitř OpenAI. Jestli to bude prakticky znát v náročných workflow, ukáže až praxe.

Bezpečnost přes celé oznámení

Text k vydání působí, jako by vznikal s vědomím washingtonské nervozity. Padá příslib, že GPT‑5.6 odmítá zakázanou kyber asistenci i při pokusu o „jailbreak“ — jailbreak je metoda, jak přimět model obcházet pravidla. OpenAI také tvrdí, že Sol lépe pomáhá hledat a opravovat zranitelnosti, než že by spolehlivě zvládal end‑to‑end útoky.

Zaznělo, že Sol nepřekračuje „cyber‑critical“ práh v rámci firemního preparedness frameworku — to je interní rámec na hodnocení rizik a připravenosti. Trochu mě zarazilo, že tento rámec byl v dubnu přepracován a některé oblasti z něj zmizely; posoudit laťku je tím pádem těžší.

OpenAI zmiňuje „nejrobustnější safety stack dosud“, posílené ochrany u rizikových aktivit a 700 000 A100e GPU hodin věnovaných automatizovanému red‑teamingu — red‑teaming je systematické testování systému simulovanými útoky. Přizvaní třetí strany budou model podle plánu ještě dva týdny testovat.

Politika jako strážce preview

Méně než den po zprávách o požadavku administrativy Donalda Trumpa na rozfázování releasu přišlo preview s individuálním schvalováním zákazníků. OpenAI píše, že jde o krátkodobý krok a nechce z toho mít normu, protože to podle nich zbytečně zdržuje přístup pro vývojáře, firmy i obránce sítí. Zároveň mluví o práci s administrativou na exekutivním rámci pro kyber oblast a „opakovatelném procesu“ pro další vydání.

Mně osobně přijde, že tohle je nová verze známého tension: tlak na rychlé uvedení versus reputační a regulatorní riziko. Pokud bude „case‑by‑case“ schvalování trvat déle než ty slibované týdny, dopadne to hlavně na týmy, co potřebují plánovat náklady a kapacity teď hned.

Co ještě nemáme v ruce

Chybí jasné metriky výkonu mimo marketingové oblasti použití. Bez čísel z běžných benchmarků se těžko porovnává, zda Sol opravdu posouvá kódování a bezpečnost, nebo „jen“ lépe balancuje odmítání rizikových požadavků. Detaily o přesných cenách Terry a Luny také nejsou, máme jen poměrové tvrzení.

Pro vývojáře je to zatím jednoduché: pokud vás zajímá rychlost a cena, vyhlížejte Lunu; pokud náročnější reasoning, sledujte Sol s „max/ultra“ módy. Do doby obecné dostupnosti si ale dejte rezervu v roadmapě — zejména u kybernetických use‑casů mohou ochrany zasahovat i legitimní práci, což OpenAI samo přiznává.

Shrnuto: nový stack dává smysl a vypadá konkurenceschopně cenou i režimy, ale preview pod dohledem vlády je minimálně neobvyklé. Pokud z toho vznikne transparentní a rychlý proces, můžeme si nakonec všichni oddechnout.

Zdroje

Došlo k neočekávané chybě. Obnovit 🗙

Rejoining the server...

Rejoin failed... trying again in seconds.

Failed to rejoin.
Please retry or reload the page.

The session has been paused by the server.

Failed to resume the session.
Please retry or reload the page.