Vydání #84:
Nové modely od OpenAI (GPT-4.5) a Anthopicu (Claude Sonnet 3.7)
Nový český AI startup od Tomáše Mikolova a Jaroslava Becka
Konverzační AI od Sesame je neskutečně lidská
Čtení o Deep Research a Karpathy 2x o LLMs
Robotické novinky od Figure či 1X
💬 Hlavní téma
Meta pracuje na vlastní AI appce – a v oblasti začíná být plno ..
Podle CNBC plánuje Meta spustit novou aplikaci jen pro AI – mohla by být venku ve druhém čtvrtletí letošního roku. Meta již své modely nasadila na Facebooku, Instagramu, Messengeru a WhatsAppu a taky na webu jako Meta AI.
Jak si budeme z AI aplikací vybírat?
ChatGPT, Gemini od Googlu, nebo Claude od Anthropicu jsou známá jména. Zatímco nejvíce funkcí a modelů nabízí ChatGPT, zejména v tech kruzích je díky nejlepšímu výkonu v programování i lidštějšímu způsobu komunikace oblíbenější Claude. Google plánuje brzy zlepšit svůj hlasový (live) mód a při své kvalitě modelů a talentu je tak nepochybně v top 3 s Anthropicem a OpenAI.
Na trhu dnes ale působí s vlastní aplikací i Microsoft (Copilot), Mistral (Le Chat), nebo Quora (Poe). Poe je zajímavý tím, že umožňuje práci s mnoha různými modely v rámci jedné platformy – má tak zajímavou agregační propozici. S tou si trochu hraje i Perplexity, jež je ale stále primárně o vyhledávání (byť umožňuje i chat bez něj). Velmi slušné řešení nabízí i You.com, jež se od AI vyhledávače posouvá k víc agentické platformě. A výčet míst, kde si může koncový zákazník povídat s AI nekončí: Pi od Inflection, Character AI od Googlu, DeepSeek …
To vše vede k otázce: kolik z těchto AI aplikací bude běžný člověk používat? Není to hra, kde vítěz bere vše? První pohled říká, že nikoli: budeme mít různé modely a řešení pro jiné případy užití. Proč by měl jeden AI asistent pomáhat s programováním i být osobním důvěrníkem? Druhý pohled: AI aplikace budou nejužitečnější, když zvládnou co nejvíc různých úloh v jednom produktu a budou mít co nejlepší kontext. A ten kontext nebudeme mít na několika místech zároveň. Bude se shromažďovat na jednom, dvou, třech .. a tam nás jako uživatele spolu s návykem uzamkne. Možná půjde vyexportovat a jednoduše přenést jinam, ale uživatelé spíš preferují pohodlí než možnost volby. A Meta AI? Rozhodně má šanci se stát jedním z top 5 hráčů; má uživatelská data, distribuci, ale i zdroje na výpočetní výkon modelů v obrovské škále.
🏆 Nejsledovanější zprávy
OpenAI vydala GPT-4.5
Dosud největší model společnosti, který místo uvažování využívá unsupervised learning, aby dosáhl hlubší znalosti světa a lepší emoční inteligence.
OpenAI tvrdí, že GPT 4.5 přináší přirozenější konverzaci, lepší porozumění lidským záměrům a vyšší emoční inteligenci.
Model méně halucinuje a poskytuje přesnější odpovědi než předchozí verze, přičemž testeři si jej oblíbili pro profesionální úkoly, kreativní práci i každodenní dotazy.
Přístup ke GPT-4.5 mají okamžitě pouze uživatelé Pro a vývojáři s placenými plány, uživatelé Plus a Team získají přístup příští týden.
=> ohledně oznámení se často objevovalo zklamání, že nejde o velký průlom. Nicméně, je třeba brát v potaz, že nejde o model uvažovací (jako o1 nebo o3). GPT-4.5. odpovídá okamžitě a jeho lepší výkon je založený na škále a množství dat z tréninku – a svými výsledky potvrzuje, že škálování nadále vede k progresu. Model je třeba brát jako setup/přípravný krok k vytvoření lepších modelů s pomocí jiných technik.
Anthropic uvedl na trh Claude 3.7 Sonnet
Hybridní model uvažování schopný rychlých reakcí i podrobného uvažování krok za krokem, určený pro řešení složitých problémů.
Má schopnost „rozšířeného myšlení“. Stejně jako o3-mini od OpenAI a R1 od DeepSeek dokáže Claude 3.7 Sonnet „uvažovat“ nad náročnými problémy.
Claude 3.7 Sonnet je nejlepší v oblasti programování a v testu SWE-bench Verified dosahuje špičkové přesnosti 70,3 %, čímž překonává modely o1 od OpenAI a DeepSeek R1 s přesností kolem 49 %.
Anthropic taky uvádí Claude Code, jejich první agentický programovací nástroj - v omezeném výzkumném náhledu. Claude Code je aktivní spolupracovník, který umí vyhledávat a číst kód, upravovat soubory, psát a spouštět testy, odevzdávat a odesílat kód na GitHub a používat nástroje příkazového řádku - v každém kroku vás udržuje v obraze.
Claude 3.7 Sonnet je nyní k dispozici ve všech plánech Claude včetně Free, Pro, Team a Enterprise a také v rozhraní API Anthropic, Amazon Bedrock a Vertex AI Google Cloud.
Česko má další nadějný AI startup: BottleCap AI (CzechCrunch)
V projektu BottleCap AI chtějí Beck, Mikolov a Herel vyvinout novou generaci velkých jazykových modelů s radikálně vyšší efektivitou. V první fázi však nebudou stavět další jazykový model, ale rádi by významně zlepšili ty existující.
„Dnešní jazykové modely jako ChatGPT vycházejí z architektury Transformer a jejich zlepšování se dosud opíralo hlavně o větší modely, více dat a silnější hardware. Softwarová stránka však v posledních letech stagnovala. Naše výzkumy ukazují, že existují zcela nové způsoby trénování modelů, které mohou přinést mnohonásobně vyšší efektivitu,“ vysvětluje Tomáš Mikolov.
⏩ Ve zkratce
Bývalá CTO OpenAI Mira Murati představuje Thinking Machines, startup zaměřený na multimodalitu a spolupráci mezi lidmi a AI.
OpenAI rozšiřuje Deep Research na uživatele ChatGPT Plus, Team, Edu a Enterprise, umožňující 10 dotazů měsíčně; Pro uživatelé nyní mají 120 dotazů měsíčně (dříve 100).
COO OpenAI Brad Lightcap oznámil, že OAI dosáhlo 400 milionů týdenních aktivních uživatelů v únoru 2025, což je nárůst o 33 % oproti 300 milionům v prosinci 2024. Počet platících firemních zákazníků dosáhl 2 milionů.
Poe od Quory nyní umožňuje uživatelům vytvářet a sdílet vlastní AI aplikace.
Google vydává bezplatnou verzi Gemini Code Assist pro individuální uživatele, nabízející 180 tisíc doplnění kódu měsíčně; GitHub Copilot ve free verzi nabízí pouze 2 tisíce.
Microsoft zavádí neomezený přístup k funkcím Voice a Think Deeper, poháněným modelem OpenAI o1, pro všechny Copilot uživatele zdarma.
Nové AI modely Microsoft Phi-4 přinášejí vysoký výkon v kompaktním provedení.
xAI vydává nový hlasový režim Grok 3, který obsahuje různé osobnosti, včetně 18+ varianty „Unhinged“ a „Sexy“, která simuluje erotické scénáře.
You.com představuje AI výzkumného agenta, který zpracovává více než 400 zdrojů najednou.
Model Scribe od ElevenLabs dokáže přepisovat řeč nejrychlejších světových mluvčích bez problémů.
Inception Labs představuje svou Mercury Series difuzních LLM modelů.
CEO Anthropicu Dario Amodei říká, že AI překoná nejlepší lidské programátory v roce 2026.
IBM představuje rodinu Granite 3.2 LLM, která nabízí volitelné schopnosti uvažování, nový model pro zpracování dokumentů a modely pro časové řady.
Hume uvádí Octave, model pro text-to-speech, který generuje AI hlasy s nastavitelnými emocemi a nabízí bezplatnou verzi s 10 000 znaky měsíčně.
Perplexity zavádí rychlejší, vylepšený hlasový režim, který umožňuje dlouhé konverzace na jakékoli téma, včetně aktuálních zpráv z webu.
Ideogram uvádí model 2a, významnou aktualizaci své text-to-image platformy, která výrazně snižuje čas a náklady na generování při zachování vysoké kvality výstupů, s optimalizacemi pro grafický design a úpravy fotografií.
Norská robotická společnost 1X uvádí NEO Gamma, humanoida nové generace určený pro domácnosti, s měkčím, přívětivějším vzhledem a pokročilými AI schopnostmi pro úkoly v domácnosti.
Figure oznamuje Helix, svůj nový generalistický model Vision-Language-Action (VLA). Společnost také ukázala demo video dvou humanoidních robotů, kteří se snaží pochopit kontext potravin a uklidit je.
Superhuman oznamuje novou AI funkci, která hluboce integruje AI do e-mailových workflow.
🛠️ AI prakticky
Nový AI hráč Sesame představil konverzační AI, která vám vyrazí dech. Možná se taky přistihnete s podobnou reakcí jako autor v twítu níže.
📚 Co si přečíst a zhlédnout
䷉ Nejlepší věc, co jsem četl o Deep Research. Po pár týdnech užívání stále nadšení - jako první působivý agentický produkt OpenAI si zaslouží vaši pozornost.
▶️ Andrej Karpathy má na YouTube 2 skvělá nová videa: jedno je hluboký ponor do LLMs, v druhém pak ukazuje, jak je prakticky sám používá.
䷉ AI mění způsob, jakým Silicon Valley buduje startupy, píše NYT:
Startupy obvykle získávaly obrovské částky, aby mohly najmout hromadu lidí a rychle růst. Nyní AI nástroje razantně zvyšují produktivitu a v kurzu tak jsou příběhy o velkém úspěchu malých týmů.
䷉ Petr Šimeček z kebooly píše: BI is dead
䷉ 50 případů užití genAI v marketingu.
🌁 Odposlechnuto v SF
Na jednom meetupu sdílel CEO Gusto (Josh Reeves) doporučení pro zakladatele k fundraisingu. To nejzajímavější, co bude platit i pro spoustu situací v Česku: Nečekejte na kontaktování investorů do chvíle, kdy potřebujete peníze – jste pak totiž v čistě transakční rovině.
Velmi podceňovaný způsob navázání vztahu je potkat se s investory v raných fázích a otevřít konverzaci o produktu i businessu jako takovém – s cílem získat zpětnou vazbu a vzájemně se myšlenkově obohatit. Spolupráce může či nemusí nastat až později.
💰Transakce a hráči
🇺🇸 Anthropic získal $3.5B v rámci Series E financování, s valuací $61.5B. Kolo vedli Lightspeed Venture Partners, s účastí Bessemer Venture Partners, Cisco Investments, D1 Capital Partners, Fidelity Management & Research Company, General Catalyst, Jane Street, Menlo Ventures, Salesforce Ventures a dalších investorů.
🇺🇸 Genspark získal $100M v rámci Series A financování, čímž dosáhl valuace $530M. AI startup zaměřený na revoluci ve vyhledávání a konkurenci Google.
🇮🇱 Perfect získal $23M v rámci Seed financování od investorů jako Hanaco Ventures a Joule Ventures. AI agentická platforma pro nábor zaměstnanců.
🇺🇸 Bridgetown Research získal $19M v rámci Series A financování vedeného Accel a Lightspeed. AI startup zaměřený na due diligence.
🇸🇪 Lovable získal $15M v rámci Pre-Series A financování vedeného Creandum a angel investory. AI platforma pro vývoj softwaru.
🇧🇪 Jurimesh získal €1.6M (cca $1.7M) na zefektivnění smluvní analýzy pomocí AI-poháněné due diligence.
🇳🇱 LangWatch získal €1M (cca $1.1M) v rámci Pre-seed financování vedeného Passion Capital, s účastí Volta Ventures a Antler. AI platforma pro monitoring LLM modelů.
📊 Povedená vizualizace
Na dobrých promptech stále záleží a naučit se je psát a pracovat s nimi je tak nejníže položené ovoce v rámci firemní i osobní adopce AI. (zdroj)
🆇 Výběr z X
Z dobrého článku “jak mít práci jakmile bude venku o3”.
Skutečné úzké hrdlo pro efektivní využívání AI nejsou (či dlouho již nebudou) schopnosti modelů, ale spíše absence kvalitního kontextu – samotného promptu a dalších dat.
Ano, po OpenAI má nejlepší Deep Research X (Twitter).
Hypotéza: VCs by měli startupové týmy posuzovat i dle jejich úrovně AI augmentace a automatizace všeho, co souvisí s kódem.
Agency je buzzword, který nemá dobrý český překlad. Akceschopnost? Karpathy a mnozí další říkají, že ve světě, kde inteligence je komodita, to bude kombinace vlastní iniciativy a schopnosti věci realizovat, která bude velmi cenná. A ještě jedna věc: “taste”, tedy vkus - ve smyslu dobrého úsudku.
🤖 a 💪
Optifye je YC startup, jehož video se stalo virálním – než jej startup i Y Combinator smazal. Je vtipné, ale trochu necitlivé a na americké poměry kontroverzní.