Novinky od Googlu přehledně

Vydání #90: Google představil řadu novinek, ve kterých se moc nejde vyznat. Pojďte se o to s námi pokusit, jsou zajímavé.

May 28, 2025

💬 Novinky z Google I/O 2025

Něco už je a něco teprve bude. Část funkcí je schovaná v novém předplatném za 250 dolarů měsíčně. A dost z nich si v Česku nevyzkoušíte. Tady je přehled toho hlavního.

Gemini

Gemini Live nyní zdarma podporuje sdílení kamery i obrazovky na Androidu i iOS. Na videu vidíte, že to ještě není perfektní, ale rozhodně na cestě správným směrem. Co nás zaujalo: sdílení obrazovky a live feedback na cokoliv, co zrovna sdílíte. Hezký příklad je učení jazyků přes Duolingo a Gemini Live jako učitel naživo.

Gemini 2.5 Pro a 2.5 Flash se staly výchozími modely. Model 2.5 Pro vede veřejné benchmarky (LMarena) a 2.5 Flash nabízí podobnou logiku s nižší latencí.

Gemini je nově i v Google Search aneb jak zajistit, že ChatGPT nebo jiné LLMs nenaruší moat Alphabetu ve vyhledávání tak drasticky. I v Čechách už to můžeme vidět v AI shrnutích (overviews) nad klasickými výsledky vyhledávání.

Google tlačí AI do vyhledávání z více stran, dalším příkladem je AI Mode, volitelný režim Google Search. V USA dostal samostatnou záložku hned vedle karty Web.

Google Introduces “AI Mode” in Search, Expanding AI Overviews with Gemini 2.0

Generativní AI

Nejvíc sdílená věc z konference. Veo 3 je první video model Googlu, který kromě obrazu generuje i zvukové efekty a dialog. Model sbírá chválu i za výrazné zlepšení chápání fyziky jednotlivých objektů.

Imagen 4 je nový vylepšený image generation model. Flow pak spojuje Veo a Imagen do jednotného nástroje pro ucelené videoscény a hudbu cílené primárně na filmmakery.

Google DeepMind

Project Astra je oproti Gemini Live výzkumný prototyp Google DeepMind, který umí stejné multimodální vnímání, ale k tomu přidává trvalou paměť, proaktivní návrhy a schopnost sám ovládat zařízení. Google ho zatím pilotuje s omezeným počtem testerů a jeho vyspělejší schopnosti se teprve postupně přelévají do Gemini Live a dalších produktů.

Další novinky

Google Meets mají nově live překlad řeči pro usnadnění komunikace napříč jazyky. Zatím dostupné jen po předplatitele (stačí, když má předplatné jeden) a podpora jazyků je také značně omezená (není čeština).

Google AI Studio je tak trochu vše v jednom, od rychlého prototypování, testování a sdílení aplikací postavených na modelech Gemini (nově v četně 2.5 Pro/Flash) a gen modelech Imagen 4, Veo 3 nebo hudebním Lyria.

Po I/O 2025 dostalo tři nové funkce (Build, Generate Media a Stream) plus nativní editaci kódu, Live API, jedním klikem nasazení na Cloud Run a experimentální nástroje pro agentic apps. Vše běží v prohlížeči, bez nutnosti Google Cloud účtu a s velmi štědrým bezplatným limitem, placené je až volání Gemini API mimo Studio. Jedná se o podobnou filozofii jako má například Bolt.new (Chat to app).

Závěrem + přehled předplatných a dostupnosti v CZ

I/O 2025 ukázalo, že Google nabral sebevědomí, Gemini 2.5 Pro vede veřejné benchmarky, AI Mode a Imagen 4 se integrují přímo do searche, Androidu a Workspace, přičemž Gemini už má 400 milionů MAU. Google stahuje náskok, ale OpenAI si drží prvenství v počtu MAU (~600 milionů). Výkony modelů od sebe nejsou daleko, závod zůstává vyrovnaný.

Novinky dostupné v Čechách:

AI Overviews (AI přehledy ve vyhledávání)
Google AI Studio & Gemini API
Imagen 4 (Image generation)
Gemini Live (kamera + sdílení obrazovky v rámci Gemini App)
Lyria 2 (hudba)

Novinky dostupné zatím jen v USA:

Veo 3 (video + zvuk)
AI Mode pro Google Search (Deep Search, Search Live, Agentické úkoly)
Flow (AI pro filmaře)

🏆 Hlavní hráči

OpenAI chce vyrábět hardware

Sam Altman a Jony Ive (ten, co designoval všechny ikonické Apple produkty) v postu, ze kterého je hrozně těžké si nedělat legraci, oznamují, že OpenAI koupí Iveho sturtup IO za $6.5B.
Co to bude, až to bude? Něco, co berete všude s sebou, aby to znalo váš kontext a sloužilo jako vrstva mezi vámi a AI. Nebude to wearable ani mobil a prý si to položíte na stůl hned po notebooku a telefonu. Klasicky toho prostě moc nevíme, ale očekávání a ambice jsou obrovské a buzz kolem oznámení úspěšně soutěžil s tím, které vytvořil Google svými novinkami.

OpenAI Codex je nově uvedený cloud coding agent v ChatGPT (model codex-1 navázaný na o3), který umí ve vlastním sandboxu paralelně psát funkce, opravovat bugy, spouštět testy a navrhovat pull requesty, takže funguje spíše už jako junior dev na dálku než autocomplete.

Vývojáři chválí, že nový Codex zvládne vícekrokové tasky (install → build → test), lépe rozumí kontextu celého repa a opraví chyby, které sám vytvořil.
I když je to slibné, problémy Codexu zahrnují omezený přístup k internetu během úkolů a fakt, že úlohy mohou běžet 1–30 minut a je potřeba ručně ladit výkon.

Anthropic

Claude 4 je tu, konkrétně Opus 4 a Sonnet 4 (ten je dostupný i zdarma). Díky hybrid reasoning a paralelnímu tool-callingu vedou coding benchmarky, což je jejich zaměření.

Google

Mimo I/O 2025 Google zveřejnil interní agentický tool zvaný AlphaEvolve, který kombinuje Gemini LLM s evolučním searchem a sám si vymýšlí nové algoritmy.

Už překonal 56 let starou Strassenovu metodu pro násobení matic, zvedl využití Google datacenter o 0,7 %, zkrátil trénink Gemini o 1 % a přepsal části obvodů TPU.
AlphaEvolve je věnován zajímavý segment podcastu Hard Fork, kde o nástroji mluví šéf DeepMind Demis Hassabis (ten s Nobelovkou).

🆕 Nový seriál o AI agentech

O AI agentech se hodně mluví, takže se na ně podíváme podrobněji. První díl naší série o AI agentech se zaměřuje na historii a teorii. Není to vůbec taková nuda, jak by se mohlo zdát - hezky si doplníte vzdělání, pokud už to všechno samozřejmě dávno nevíte.

AI agenti, 1. díl

Lukas Chudy

May 27

Read full story

Další díly se podívají na no-code praktické ukázky a AI agenty v enterprise.

🚨 Čecho-Slováci v AI

Stanislav Fort a Kristina Fort vydali květnový díl newsletteru Pokrok v AI a už příští týden s nimi vyjde rozhovor s rámci našeho podcastu Cinkátko.

✨ Pokrok v AI ✨

👋 Pokrok v AI – newsletter č. 33

Vítejte ve třicátém třetím vydání našeho newsletteru Pokrok v AI, ve kterém shrnujeme nejnovější poznatky a vývoj v oblasti používání umělé inteligence (AI), strojového učení (ML) a AI policy a regulace.Děkujeme, že čtete Pokrok v AI! Naši práci můžete podpořit odebíráním tohoto newsletteru přímo do vaší emailové schránky…

a month ago · 9 likes · Kristina Fort and Stanislav Fort

Petr Brzek minulý týden spustil vibe coding asistenta Macaly na platformě Product Hunt.

Pro náš podcast jsme o AI mluvili s novinářem Petrem Koubským, jedním z mála lidí v Česku, který umí AI nahlédnout kriticky a má přehled o dění nad rámec LLMs. Bonus: tipy na skvělé sci-fi knížky.

Co-founder Rossumu Petr Baudiš v nové epizodě Data Talku mluví mj. o vibe codingu:

Používá Windsurf + Gemini Pro 2.5: “Používám to už pro každý programovací task a konečně mám pocit, že mě to zrychluje. Což jsem předtím zažíval jen u vibe codingu from scratch.”
Petr mluví taky o tom, jak se AI nástroje používají mezi programátory a výzkumníky v Rossumu. Jeho postřehy jsou empatické a příjemně posazené v realitě, doporučujeme. Sekce o vibe codingu začíná v 1:24:10.

Už 3. června se pražský meetup Truesdays změní na Startup Spotlight, kde až osm early-stage AI/deep-tech projektů předvede tříminutový pitch.

Slovensko + AI výzkum. Zajímavé nahlédnutí do dění u sousedů u Lenky Kučerové z prg.ai.

🌱 AI pozice v Miton portfoliu

🔸Aim: AI Data Scientist

🔸Deepscout: Data Scientist

🔸Rossum: Senior AI Research Engineer

🔸Miton: AI Trends & Market Analyst

🛠️ AI prakticky

Elicit

AI research asistent, který prohledává databázi 125+ milionů vědeckých prací, nalézá relevantní články, vytváří souhrny a automaticky z nich extrahuje data.

LibreChat

LibreChat je full open-source, self-hostovatelné chat UI, které v jednom dashboardu spojuje modely OpenAI, Anthropic, Google, Azure, Groq atd. “Tohle je super, jsou tam všechny modely a lidi to opravdu začali používat,” popisuje zkušenost z GLAMI Tomáš Hodboď.

⏩ Ve zkratce

Stability AI ve spolupráci s Arm uvádí Stable Audio Open Small. 341M parametrový text to audio model, který díky KleidiAI běží plně on-device na ARM CPU.
GitHub open-sourcuje MCP server, který dává AI agentům plný real-time kontext nad repozitářem, umožňuje NL queries i custom tools a míří stát se defaultním standardem pro context-aware dev workflow.
Microsoft rozjíždí autonomous GitHub Copilot agent a souběžně spouští Windows / Azure AI Foundry. Windows 11 teď podporuje Model Context Protocol a on-device nasazení modelů přes CPU/GPU/NPU, zatímco Azure Foundry nabízí orchestraci 10 k+ open-source modelů.
Windsurf uvádí vlastní rodinu modelů SWE-1 (full-size, lite, mini) s tzv. flow awareness, která má nahradit dosavadní LLMs třetích stran a pokrýt celý software engineering lifecycle, přičemž v interních benchmarcích překonává konkurenci (to ale říkají všichni).
Chatbot Arena, projekt vzniklý na akademické půdě (UC Berkeley) naraisovala 100M dolarů v kole vedeném Andreessen Horowitz a UC Investments. “This does not fill me with confidence about the future integrity of LMArena,” komentuje zprávu novinář Casey Newton.

Subscribed

Chcete psát newsletter s námi? Hledáme full-time vedoucí/ho i občasné přispěvatele.

Podnikáte něco v AI a chcete o tom dát vědět? Napište nám na mitonainl@miton.cz.

Pro další novinky mrkněte na náš Twitter, LinkedIn či blog.

Miton AI Newsletter

AI agenti, 1. díl

Discussion about this post