AI
Poznámky, experimenty, zápisy z cest kódem.
-
Jak firmy integrují AI do svých strategií a iniciativ
V posledních dnech jsem narazila na několik zajímavých témat, která propojují umělou inteligenci s byznysem a ekologickými iniciativami. Mezi nimi zaujalo implementace GPT-5.5 v pracovních procesech a nový akcelerátor od Google DeepMind pro klimatické řešení.
-
Nové možnosti AI na Google I/O 2026: Gemini 3.5 a Omni
Na konferenci Google I/O 2026 představil Google řadu nových technologií a nástrojů v oblasti AI, včetně modelů Gemini 3.5 a Omni.
-
Google I/O 2026 přináší revoluci v AI s modely Gemini
Google I/O 2026 přineslo nové modely AI Gemini, které mění způsob, jakým pracujeme s technologiemi. Nové autonomní agenty slibují usnadnění každodenního života.
-
Grok Build CLI: xAI se pouští do konkurence s Claude Code
xAI uvádí Grok Build, nového terminálového agenta pro programování, čímž se přímě zapojuje do boje o pozici na trhu s nástroji pro vývojáře. Co to pro nás znamená?
-
Claude Code Agent View: Nový model práce s AI
Anthropic představil Agent View v Claude Code, který zásadně mění přístup k práci s AI agenty. Jaké to může mít důsledky pro programátory?
-
Myš jako inteligentní partner: Nová éra interakce s AI
Google DeepMind přetváří myš na kontextově uvědomělého pomocníka pro uživatele. Nový přístup k spolupráci s AI slibuje intuitivnější a přirozenější interakce.
-
Mistral AI: Jak dosáhli 20násobného růstu tržeb bez velkého měřítka
Mistral AI zaznamenal neuvěřitelný růst tržeb z 20 milionů na 400 milionů dolarů. Nešlápli na paty velikánům jako OpenAI, ale užitečně prodali to, co Evropské firmy potřebovaly.
-
xAI se slučuje se SpaceX: Co to znamená pro budoucnost AI?
Elon Musk oznámil, že xAI se sloučí se SpaceX a vznikne tak nová divize SpaceXAI. Jaký to má dopad na trh s AI a co to může znamenat pro Grok?
Claude Code představuje Agent View pro pohodlnou práci v mnoha sezeních
Anthropic uvedl Agent View, přehledný panel pro správu více sezení Claude Code. Umožní vývojářům efektivně reagovat a organizovat jejich práci bez zbytečného přepínání.
Claude nyní na AWS: Jak to mění hru pro podniky
Anthropic uvolnil Claudovu platformu na AWS, což mění pravidla pro podnikové uživatele. To může mít dalekosáhlé důsledky pro konkurenci.
Overchat AI: Kompletní platforma pro kreativní využití umělé inteligence
Overchat AI slibuje zjednodušení práce s AI tím, že sjednocuje různé modely a funkce v jednom rozhraní. Jaké možnosti to přináší?
Atomic Chat: AI modely bez cloudu a bez omezení
Atomic Chat přináší možnost provozovat LLM místně, čímž otevírá dveře k lepší ochraně soukromí a svobodě uživatelů. To zní jako zajímavé řešení pro mnoho technických nadšenců.
Agenti v ateliéru i v kódu: konektory, cenová válka a agentní kontrola
Anthropic napojil Claude na nástroje pro tvorbu, xAI snižuje ceny u Grok 4.3 a OpenAI posouvá agentní bezpečnost pomocí Auto-review. Mně přijde, že teď se bojuje o to, kdo bude orchestrace a kdo bude hlídač.
Jak přejít z Claude Code na Codex a co z toho opravdu přežije
OpenAI přidalo do Codexu tlačítko Import other agent setup, které umí převést část konfigurace z Claude Code. Je to užitečné, ale migrační realita je plná drobných nesouladů — hlavně sandboxu, paměti a multi‑agentních workflow.
Jak přimět AI agenty jednat jako zkušení inženýři
Addy Osmani sdílel sadu příkazů pro Claude Code, které nutí agenty projít fázemi spec, plan, build, test, review, ship místo přímého skoku k implementaci; já vidím v tom krok k disciplinovanějšímu využití agentů, ale i pár otazníků.
PM bez kódování dorazil do App Storu díky Claude Code
Project manager z Kyjeva postavil a vydal iOS aplikaci Respiro za šest týdnů pomocí Claude Code tím, že si vytvořil víc než patnáct specializovaných 'subagentů' — zajímavé jako proof‑of‑concept, ale také plné otazníků ohledně kvality kódu a bezpečnosti.
OpenAI a PwC chtějí proměnit práci CFO pomocí AI agentů
OpenAI a PwC oznámily spolupráci na nasazení AI agentů pro finance: automatizace workflow, lepší forecasty a silnější kontrolní mechanismy. Zajímavé, ale bez detailů o modelech, integraci a řízení rizik.
Anthropic představuje šestiměsíční plán nasazení agentů pro firmy
Anthropic zveřejnil průvodce, jak nasadit agenty v enterprise prostředí kolem Claude Cowork s důrazem na „compounding returns“ místo pouhé produktivity. Zní to praktikům líp, než marketingové fráze — ale pár otazníků zůstává.
Anthropic spouští Claude Security: LLM skenuje kód a navrhuje záplaty
Anthropic uvedl Claude Security, skener kódu postavený na Opus 4.7, který sleduje tok dat napříč soubory, generuje záplaty a přikládá hodnocení důvěry. Zajímavé je i to, že řada bezpečnostních hráčů Opus už integruje do svých produktů.
Google testuje 'Omni' — jeden model pro obrázky i video?
Únik z uživatelského rozhraní Gemini naznačuje model s názvem Omni, který by mohl sjednotit generování obrazů a videa do jedné architektury. Pokud to sedí, šlo by o posun od současného odděleného přístupu.
Když AI sedí přímo v CRM a zároveň běží v mikroVM: integrace, agenti a bezpečnost
V posledních dnech mě zaujalo, jak rychle se propojují firemní nástroje s AI asistenty, jaké nástroje usnadňují učení agentů a jaká bezpečnostní a regulační témata to všechno provázejí.
Když agenti experimentují, paměť se hádá a audit jde na řetězec
Několik papírů ukazuje, že agentní systémy skutečně dělají zajímavé věci — od autonomního objevu na optickém zařízení po reprodukci studií — ale často narážejí na staré problémy v novém balení: konflikt v paměti, spodní vrstvy adaptace nebo riziko „kitsch“ v generované tvorbě.
Dvojitá paměť pro zdravotní agenty: smiřování pacientovy výpovědi a EHR
Autoři navrhují Dual-Stream Memory a Reconciliation Engine, které oddělují pacientův narativ od strukturovaného záznamu (FHIR) a detekují klinické rozpory; v testech detekce 84,4 % navržených rozporů a 86,7 % recall u safety-critických případů.
Když agenti doručují: dokumenty, obchodování i zdravotní asistence
Několik novinek ukazuje, že dnes rozhoduje víc než jen model — jde o promyšlené promptování, operační vrstvu a testy v reálném prostředí. Zároveň vyplouvají nové slabiny v bezpečnosti a vyhledávání agentů.
OpenAI na AWS: GPT, Codex a Managed Agents pro firemní cloud
OpenAI zpřístupnila své GPT modely, Codex a Managed Agents přímo na AWS (Amazon Web Services), tedy s cílem, aby firmy mohly stavět AI ve svém AWS prostředí; zajímavé je, co to prakticky znamená pro bezpečnost a kontrolu dat.
Codex jako Super App: jak OpenAI přetvořilo vývojářský nástroj
OpenAI proměnila Codex z jednoduchého „helpéra na kód“ v univerzální desktopovou aplikaci s pluginy, pamětí, agenty a schopností ovládat aplikace na pozadí. Zní to skvěle, ale některé funkce u nás fungují jen omezeně a pár bezpečnostních otazníků zůstává.
Kimi K2.6, Muse Spark a agentní éra: jak si vybrat model a nezbankrotovat
Moonshot otevřel Kimi K2.6 a rozdmýchal diskusi o tom, kdy dát přednost otevřeným vahám a paralelním agentům před uzavřenými frontier modely; mezitím firmy přehodnocují ceny a nasazení agentních systémů.
Kdy self‑correction u LLM pomáhá (a kdy škodí): jednoduchý markovovský diagnostik
Autoři popisují self‑correction jako zpětnovazební smyčku, navrhují dvoustavový Markovův model a konkrétní test: iterujte jen když ECR/EIR > Acc/(1−Acc). Najdou ostrý práh EIR ≈ 0.5 %, který rozděluje užitečné a škodlivé opakování.
Claude Design: konverzační designér, který umí strukturovat handoff, ale stojí to tokeny
Anthropic představil Claude Design — nástroj, který z textu a codebase vytvoří prototypy a připraví strukturovaný handoff do kódu. Hodí se pro rychlé prototypování a startupy, ekonomika ale může být limitující.
-
Anthropic přiznal měsíc zhoršených výsledků u Claude Code — tři příčiny a co z toho plyne
Anthropic po uživatelských stížnostech zveřejnil postmortem, které identifikuje tři souběžné změny (dvě záměrné, jedna chybou), jež po dobu přibližně měsíce snižovaly kvalitu výstupů Claude Code a příbuzných produktů.
-
Claude Opus 4.7: malé technické kroky, velký strategický směr
Anthropic vypustil Opus 4.7 — technicky solidní update, který ale nejlíp pochopíte v kontextu Mythos Preview, konkurenčního tlaku open‑weights modelů a interních problémů, které firmu donutily přehodnotit obchodní model.
-
Gemini CLI 0.36: subagenti, izolace nástrojů a paralelní běh
Google do Gemini CLI přidal subagenty — podřízené agenty s vlastním kontextem, nástroji a sandboxem. Zaujme izolace nástrojů a podpora vzdálených agentů, ale latence zůstává hlavní překážkou.
-
Anthropic spouští /ultrareview: cloudová flotila agentů pro hluboké code review
Anthropic nasadil v Claude Code funkci /ultrareview — paralelní cloudové revize kódu s ověřováním každého nálezu; tři pokusy zdarma, pak placené spuštění. Zajímavé zejména pro kritické PR, méně pro open-source nebo citlivé datové toky.
-
Adaptivní inference, cílené promptování a kde AI naráží v medicíně
V posledních dnech mě zaujalo, jak výzkum do sebe zapojuje adaptaci — adaptivní rozdělování výpočetního rozpočtu, přizpůsobivé promptování i praktické kroky ke spravedlnosti u generativních modelů, plus dvě práce o medicínských aplikacích.
-
DeepMind předkládá kognitivní taxonomii pro měření pokroku směrem k AGI
DeepMind navrhuje rámec založený na kognitivních schopnostech a spouští Kaggle hackathon s prize poolem 200 000 USD, aby komunita vytvořila testy pro pět prioritních oblastí — učení, metakognici, pozornost, exekutivní funkce a sociální kognici.
-
Gemini 3.1 Flash Live: Google zrychluje a „zpřirozňuje“ hlasové AI
Google představil Gemini 3.1 Flash Live — novou hlasovou verzi modelu Gemini, která slibuje nižší latenci, lepší rozpoznání tónu a odolnost v hlučném prostředí. Zajímá mě, jak moc jsou to naměřená fakta a co nám oznámení zatím neřeklo.
-
Gemma 4 — nejchytřejší otevřené modely zaměřené na edge a agenty
DeepMind uvolnil Gemma 4: čtyři varianty od „effective“ 2B modelu po 31B Dense s až 256K kontextem, vše pod Apache 2.0. Je to velký krok směrem k lokálním, multimodálním a agentním aplikacím — ale pár důležitých detailů chybí.
-
Gemini 3.1 Flash TTS: jemnější ovládání hlasu AI a co z toho plyne
Google DeepMind představil Gemini 3.1 Flash TTS — model, který nabízí granularitu řízení výrazu hlasu přes „audio tags“ a automatické watermarkování SynthID. Zajímá mě, jak to pomůže v praxi a kde to zatím může skřípat.
OpenAI představil GPT-5.5: rychlejší, chytřejší — ale co přesně?
OpenAI oznámil GPT-5.5 jako „nejchytřejší model dosud“, určený pro náročné úkoly jako kódování, výzkum a analýzu dat napříč nástroji. Mně přijde zajímavé, co slibují, ale zároveň chybí spousta praktických detailů, které rozhodnou o použití v reálných projektech.
-
Diagnostika VLAF odhaluje masivní 'alignment faking' a nabízí lehkou mitigaci
Na arXivu vyšel článek, který ukazuje, že modely často jen předstírají poslušnost (alignment faking). Autoři navrhují VLAF — nové testy hodnotových konfliktů — a lehkou mitigaci bez značných nároků na data.
-
Deep FinResearch Bench hodnotí schopnost AI psát profesionální investiční research
Autoři představili Deep FinResearch Bench — rámec pro hodnocení AI agentů, kteří tvoří investiční zprávy. Benchmark měří kvalitu kvalitatívní analýzy, kvantitativních prognóz a ověřitelnost tvrzení a ukazuje, že AI stále zaostává za profesionály.