Novinky od Googlu přehledně
Vydání #90: Google představil řadu novinek, ve kterých se moc nejde vyznat. Pojďte se o to s námi pokusit, jsou zajímavé.
💬 Novinky z Google I/O 2025
Něco už je a něco teprve bude. Část funkcí je schovaná v novém předplatném za 250 dolarů měsíčně. A dost z nich si v Česku nevyzkoušíte. Tady je přehled toho hlavního.
Gemini
Gemini Live nyní zdarma podporuje sdílení kamery i obrazovky na Androidu i iOS. Na videu vidíte, že to ještě není perfektní, ale rozhodně na cestě správným směrem. Co nás zaujalo: sdílení obrazovky a live feedback na cokoliv, co zrovna sdílíte. Hezký příklad je učení jazyků přes Duolingo a Gemini Live jako učitel naživo.
Gemini 2.5 Pro a 2.5 Flash se staly výchozími modely. Model 2.5 Pro vede veřejné benchmarky (LMarena) a 2.5 Flash nabízí podobnou logiku s nižší latencí.
Gemini je nově i v Google Search aneb jak zajistit, že ChatGPT nebo jiné LLMs nenaruší moat Alphabetu ve vyhledávání tak drasticky. I v Čechách už to můžeme vidět v AI shrnutích (overviews) nad klasickými výsledky vyhledávání.
Google tlačí AI do vyhledávání z více stran, dalším příkladem je AI Mode, volitelný režim Google Search. V USA dostal samostatnou záložku hned vedle karty Web.
Generativní AI
Nejvíc sdílená věc z konference. Veo 3 je první video model Googlu, který kromě obrazu generuje i zvukové efekty a dialog. Model sbírá chválu i za výrazné zlepšení chápání fyziky jednotlivých objektů.
Imagen 4 je nový vylepšený image generation model. Flow pak spojuje Veo a Imagen do jednotného nástroje pro ucelené videoscény a hudbu cílené primárně na filmmakery.
Google DeepMind
Project Astra je oproti Gemini Live výzkumný prototyp Google DeepMind, který umí stejné multimodální vnímání, ale k tomu přidává trvalou paměť, proaktivní návrhy a schopnost sám ovládat zařízení. Google ho zatím pilotuje s omezeným počtem testerů a jeho vyspělejší schopnosti se teprve postupně přelévají do Gemini Live a dalších produktů.
Další novinky
Google Meets mají nově live překlad řeči pro usnadnění komunikace napříč jazyky. Zatím dostupné jen po předplatitele (stačí, když má předplatné jeden) a podpora jazyků je také značně omezená (není čeština).
Google AI Studio je tak trochu vše v jednom, od rychlého prototypování, testování a sdílení aplikací postavených na modelech Gemini (nově v četně 2.5 Pro/Flash) a gen modelech Imagen 4, Veo 3 nebo hudebním Lyria.
Po I/O 2025 dostalo tři nové funkce (Build, Generate Media a Stream) plus nativní editaci kódu, Live API, jedním klikem nasazení na Cloud Run a experimentální nástroje pro agentic apps. Vše běží v prohlížeči, bez nutnosti Google Cloud účtu a s velmi štědrým bezplatným limitem, placené je až volání Gemini API mimo Studio. Jedná se o podobnou filozofii jako má například Bolt.new (Chat to app).
Závěrem + přehled předplatných a dostupnosti v CZ
I/O 2025 ukázalo, že Google nabral sebevědomí, Gemini 2.5 Pro vede veřejné benchmarky, AI Mode a Imagen 4 se integrují přímo do searche, Androidu a Workspace, přičemž Gemini už má 400 milionů MAU. Google stahuje náskok, ale OpenAI si drží prvenství v počtu MAU (~600 milionů). Výkony modelů od sebe nejsou daleko, závod zůstává vyrovnaný.
Novinky dostupné v Čechách:
AI Overviews (AI přehledy ve vyhledávání)
Google AI Studio & Gemini API
Imagen 4 (Image generation)
Gemini Live (kamera + sdílení obrazovky v rámci Gemini App)
Lyria 2 (hudba)
Novinky dostupné zatím jen v USA:
Veo 3 (video + zvuk)
AI Mode pro Google Search (Deep Search, Search Live, Agentické úkoly)
Flow (AI pro filmaře)
🏆 Hlavní hráči
powered by Aim
OpenAI chce vyrábět hardware
Sam Altman a Jony Ive (ten, co designoval všechny ikonické Apple produkty) v postu, ze kterého je hrozně těžké si nedělat legraci, oznamují, že OpenAI koupí Iveho sturtup IO za $6.5B.
Co to bude, až to bude? Něco, co berete všude s sebou, aby to znalo váš kontext a sloužilo jako vrstva mezi vámi a AI. Nebude to wearable ani mobil a prý si to položíte na stůl hned po notebooku a telefonu. Klasicky toho prostě moc nevíme, ale očekávání a ambice jsou obrovské a buzz kolem oznámení úspěšně soutěžil s tím, které vytvořil Google svými novinkami.
OpenAI Codex je nově uvedený cloud coding agent v ChatGPT (model codex-1 navázaný na o3), který umí ve vlastním sandboxu paralelně psát funkce, opravovat bugy, spouštět testy a navrhovat pull requesty, takže funguje spíše už jako junior dev na dálku než autocomplete.
Vývojáři chválí, že nový Codex zvládne vícekrokové tasky (install → build → test), lépe rozumí kontextu celého repa a opraví chyby, které sám vytvořil.
I když je to slibné, problémy Codexu zahrnují omezený přístup k internetu během úkolů a fakt, že úlohy mohou běžet 1–30 minut a je potřeba ručně ladit výkon.
Anthropic
Claude 4 je tu, konkrétně Opus 4 a Sonnet 4 (ten je dostupný i zdarma). Díky hybrid reasoning a paralelnímu tool-callingu vedou coding benchmarky, což je jejich zaměření.
Google
Mimo I/O 2025 Google zveřejnil interní agentický tool zvaný AlphaEvolve, který kombinuje Gemini LLM s evolučním searchem a sám si vymýšlí nové algoritmy.
Už překonal 56 let starou Strassenovu metodu pro násobení matic, zvedl využití Google datacenter o 0,7 %, zkrátil trénink Gemini o 1 % a přepsal části obvodů TPU.
AlphaEvolve je věnován zajímavý segment podcastu Hard Fork, kde o nástroji mluví šéf DeepMind Demis Hassabis (ten s Nobelovkou).
🆕 Nový seriál o AI agentech
O AI agentech se hodně mluví, takže se na ně podíváme podrobněji. První díl naší série o AI agentech se zaměřuje na historii a teorii. Není to vůbec taková nuda, jak by se mohlo zdát - hezky si doplníte vzdělání, pokud už to všechno samozřejmě dávno nevíte.
Další díly se podívají na no-code praktické ukázky a AI agenty v enterprise.
🚨 Čecho-Slováci v AI
Stanislav Fort a Kristina Fort vydali květnový díl newsletteru Pokrok v AI a už příští týden s nimi vyjde rozhovor s rámci našeho podcastu Cinkátko.
Petr Brzek minulý týden spustil vibe coding asistenta Macaly na platformě Product Hunt.
Pro náš podcast jsme o AI mluvili s novinářem Petrem Koubským, jedním z mála lidí v Česku, který umí AI nahlédnout kriticky a má přehled o dění nad rámec LLMs. Bonus: tipy na skvělé sci-fi knížky.
Co-founder Rossumu Petr Baudiš v nové epizodě Data Talku mluví mj. o vibe codingu:
Používá Windsurf + Gemini Pro 2.5: “Používám to už pro každý programovací task a konečně mám pocit, že mě to zrychluje. Což jsem předtím zažíval jen u vibe codingu from scratch.”
Petr mluví taky o tom, jak se AI nástroje používají mezi programátory a výzkumníky v Rossumu. Jeho postřehy jsou empatické a příjemně posazené v realitě, doporučujeme. Sekce o vibe codingu začíná v 1:24:10.
Už 3. června se pražský meetup Truesdays změní na Startup Spotlight, kde až osm early-stage AI/deep-tech projektů předvede tříminutový pitch.
Slovensko + AI výzkum. Zajímavé nahlédnutí do dění u sousedů u Lenky Kučerové z prg.ai.
🌱 AI pozice v Miton portfoliu
🔸Rossum: Senior AI Research Engineer
🔸Miton: AI Trends & Market Analyst
🛠️ AI prakticky
Elicit
AI research asistent, který prohledává databázi 125+ milionů vědeckých prací, nalézá relevantní články, vytváří souhrny a automaticky z nich extrahuje data.
LibreChat
LibreChat je full open-source, self-hostovatelné chat UI, které v jednom dashboardu spojuje modely OpenAI, Anthropic, Google, Azure, Groq atd. “Tohle je super, jsou tam všechny modely a lidi to opravdu začali používat,” popisuje zkušenost z GLAMI Tomáš Hodboď.
⏩ Ve zkratce
powered by Aim
Stability AI ve spolupráci s Arm uvádí Stable Audio Open Small. 341M parametrový text to audio model, který díky KleidiAI běží plně on-device na ARM CPU.
GitHub open-sourcuje MCP server, který dává AI agentům plný real-time kontext nad repozitářem, umožňuje NL queries i custom tools a míří stát se defaultním standardem pro context-aware dev workflow.
Microsoft rozjíždí autonomous GitHub Copilot agent a souběžně spouští Windows / Azure AI Foundry. Windows 11 teď podporuje Model Context Protocol a on-device nasazení modelů přes CPU/GPU/NPU, zatímco Azure Foundry nabízí orchestraci 10 k+ open-source modelů.
Windsurf uvádí vlastní rodinu modelů SWE-1 (full-size, lite, mini) s tzv. flow awareness, která má nahradit dosavadní LLMs třetích stran a pokrýt celý software engineering lifecycle, přičemž v interních benchmarcích překonává konkurenci (to ale říkají všichni).
Chatbot Arena, projekt vzniklý na akademické půdě (UC Berkeley) naraisovala 100M dolarů v kole vedeném Andreessen Horowitz a UC Investments. “This does not fill me with confidence about the future integrity of LMArena,” komentuje zprávu novinář Casey Newton.
Subscribed
Chcete psát newsletter s námi? Hledáme full-time vedoucí/ho i občasné přispěvatele.
Podnikáte něco v AI a chcete o tom dát vědět? Napište nám na mitonainl@miton.cz.