Vydání #82:
Trochu jiné FAQ k DeepSeek
OpenAI agentická: Operator a deep research
OpenAI přidává model o3-mini a o3-mini-high do ChatGPT
Mistral říká: nejsme na prodej. A spouští model Small
Služby na AI automatizace a agenty, podcast s šéfem Hebbie či Figmy, čtení o hlasových agentech
💬 Hlavní téma
O DeepSeek modelu R1 jste už slyšeli leccos. V následujícím FAQ se proto pokusím shrnout, co možná v diskusi zapadlo, ale nemělo by.
Proč je R1 velká věc?
Za prvé: Efektivní tréninkový proces: DeepSeek-R1 trénovali pomocí reinforcement learningu (RL) bez použití označených dat. Tento přístup minimalizuje potřebu lidského zásahu a snižuje náklady na trénink.
Multi-fázová tréninková strategie: Aby se vyřešily problémy s čitelností a další nedostatky čistého RL, zavedli více-fázový tréninkový proces. Ten zahrnuje počáteční fázi s minimálně označenými daty (cold start), následovanou RL pro zlepšení uvažovacích schopností, a nakonec supervised fine-tuning (SFT) pro další vylepšení výkonu modelu.
Inovativní architektura: DeepSeek implementoval techniku Multi-Head Latent Attention (MLA), která komprimuje KV cache do nižší dimenze. To výrazně snižuje paměťové nároky modelu na 5–13 % oproti tradičním přístupům, aniž by došlo ke ztrátě výkonu.
(Podrobnější a technicky srozumitelné vysvětlení zde).
Za druhé: je to model z Číny, nikoli USA.
Co se říká, ale není to pravda?
“Čínský hedge fond udělal z ničeho a se všemi omezeními GPUs za $5.6M-$6M lepší model, než má jakýkoli americký lab. Navíc je open-source.”
=> podle SemiAnalysis měli k dispozici až 50 000 GPUs - málo H100s, ale zejména H800s, H20s (pro Čínu povolených typů). Nicméně, i tak jim to dává jeden z největších GPU clusterů na světě. Navíc, značný nárůst prodejů Nvidia v Singapuru nasvědčuje, že tak mohli obejít exportní omezení a ve skutečnosti mají i více H100s (US vláda to začala vyšetřovat).
=> zmíněných $5.6M se týká posledního tréninkového běhu modelu, nejde o celkové náklady. Jen cena GPUs bude kolem $1B, ale vzhledem k tomu, že DeepSeek a hedge fond High-Flyer je stejná entita, i odhady se dělají složitě. Jak píše Amodei: je dost možné, že celkové náklady DeepSeeku jako firmy nejsou vzdálené od US labů.
=> R1 je slovy Sama Altmana působivý model a techniky jeho vývoje budou mít na AI trh velké dopady. Na věrohodné srovnání si bude třeba počkat; prvenství OpenAI však díky o1 a nyní o3-mini DeepSeek zatím nenarušil.
=> DeepSeek má otevřené váhy a MIT licenci, což je na tak pokročilý model uvažování nevídané. Nicméně, označit jej za open-source není přesné: jeho tréninková data veřejná nejsou.
Je to skutečně “Sputnik moment”? Není. Analogie, kterou použil třeba Marc Andreessen, naráží na několik limitů. Sputnik ukázal, že Sověti dokážou něco, co USA ne. Následně ale nezveřejnili všechny technické detaily. Extrémně kapitalizované US laby mohou velmi rychle replikovat metody DeepSeeku a využít je ve svůj prospěch. Navíc, zatímco Sputnik vzbudil reakci na straně Američanů, DeepSeek podle Dylana Patela, špičkového analytika AI a polovodičů, má spíš efekt v Číně. Patel tvrdí, že DeepSeek měl vyvolat zájem v nejvyšších patrech režimu. Technologická válka US-Čína tak zřejmě vstoupila do dalšího dějství. Pokud se Čína zaměří na AI podobně jako v minulosti na elektrická vozidla, převaha výrobních kapacit i elektřiny z ní udělá lídra i v této kategorii. Exportní omezení GPUs a náročnost replikovat vývoj čipů je zřejmě poslední bariérou. (více těchto spekulací v podcastu Lexe Friedmana)
Jaký dopad na Nvidii a další poskytovatele GPUs lze čekat? Levnější trénink modelů, ale i výpočetní a paměťové nároky při inferenci interpretují mnozí jako medvědí signál pro Nvidii (rekordní intraday pokles o 17%, $600B hodnoty pryč). Opačný pohled v této debatě skloňuje Jevonsův paradox: situace, kdy technologický pokrok přinášející větší efektivitu při využívání určitého zdroje paradoxně zvyšuje spotřebu tohoto zdroje kvůli větší poptávce (místo očekávaného poklesu spotřeby). Tento meme to shrnuje hezky. Steven Cohen z hedge fondu Point72 to vidí tak, že výprodej byl založený na misinformacích a zůstává v AI býkem. Zpětně vidíme, že větší ranou pro Nvidii jsou Trumpova cla. Dlouhodobě však Nvidia čelí řadě výzev, jedna z nejlepších analýz zde.
Co to znamená velké firmy? DeepSeek aktuálně nemá infrastrukturu, aby mohl R1 poskytovat ve škále. Využívání modelu přes API je tak nutné přes Azure nebo Amazon Bedrock, případně provozovat na vlastní infra. Pro velké firmy bude zásadní obava o bezpečnost dat a možná “zadní vrátka” modelu (Huawei či TikTok vibes). Nejde nutně o nějaký způsob extrakce dat, ale nejasné chování modelu vyplývající z neznámosti tréninkových dat. Patel to popisuje tady. Efekt země původu “Čína” zřejmě způsobí, že i přes výkon a nákladové úspory cestu si DeepSeek do největších firem a vlád Západu nenajde. Nicméně, jen BRICs je aktuálně 37.3 % globálního HDP.
Co DeepSeek znamená pro startupy? Hezkým příkladem rychlého zavedení R1 je Perplexity, které s ním umožňuje vyhledávání. Pro hráče nabízející vícero modelů v rámci platformy může být R1 vítaným přírůstkem s pozitivním dopadem na náklady i kvalitu/UX. Osobní názor: Pokud je R1 poblíž parity s modely OpenAI či Anthropicu (v Silicon Valley se mluví o tom, že už měsíce testuje špičkový model uvažování), pro startupy v aplikační vrstvě dává DeepSeek smysl na rychlé prototypování a POCs. Jinak je ale DeepSeek spíše zbytečným rizikem, zejména pro distribuci.
Jak to ovlivní další vývoj v AI na cestě k AGI? Globální konkurence + větší efektivita tréninku i inference => ještě větší investice do infrastruktury a rychlejší vývoj. To je asi hlavní poselství, které si ze situace kolem DeepSeek odnést. Extrémní akcelerace směrem k AGI je nevyhnutelná. Co bylo dříve skoro esoterickým a obskurním přesvědčením, dnes mezi AI lídry zpochybňuje málokdo: V letech 2026-2027 překoná AI schopnosti lidí prakticky ve všech kognitivních úlohách. (a někteří AI výzkumníci tvrdí, že AGI díky uvažovacím modelům máme již nyní.)
🏆 Velké zprávy
Operator a deep research od OpenAI
První 2 agentické produkty od OpenAI jsou na světě.
Operator: Výzkumné preview agenta, který může k provádění úloh používat vlastní prohlížeč. K dispozici pro uživatele verze Pro v USA.
Operátor může „vidět“ (prostřednictvím snímků obrazovky) a „komunikovat“ (pomocí všech akcí, které umožňuje myš a klávesnice) s prohlížečem, což mu umožňuje provádět akce na webu bez nutnosti vlastní integrace API.
Zmíněné případy užití zahrnují online nákup potravin, rezervace na Booking, objednávání produktů na Etsy, ale i veřejné služby měst.
deep research: Agent, který pomocí uvažování syntetizuje velké množství online informací a provádí více-krokové výzkumné úkoly. K dispozici pro uživatele Pro již dnes, Plus a Team jsou na řadě.
Jmenuje se stejně jako googlovský agent “Deep Research” v Gemini a taky funguje podobně. Jen jej pohání lepší model model uvažování.
Je poháněn modelem o3, který je optimalizovaný pro procházení webu a analýzu dat, a využívá uvažování k vyhledávání, interpretaci a analýze obrovského množství textu, obrázků a souborů PDF na internetu.
OpenAI vydala o3-mini
o3-mini je vyladěný na problémy STEM, konkrétně na programování, matematiku a přírodní vědy. Model se z hlediska schopností do značné míry vyrovná modelům řady o1, tedy o1 a o1-mini, ale pracuje rychleji a stojí méně.
Náklady na provoz systému jsou o 63 % nižší než u jeho předchůdce, čímž se cena snížila na 1,10 USD / milion vstupních tokenů.
na rozdíl od DeepSeek neukazuje přesné uvažovací tokeny (neukazuje co si model reálně “myslí), ale jen shrnutí tohoto procesu.
⏩ Ve zkratce
Sam Altman: OpenAI se v otázce open-source ocitlo na „špatné straně historie“.
OpenAI, SoftBank a Oracle oznamují The Stargate Project, společný podnik na investice do AI infrastruktury v USA, s počátečním závazkem 100 miliard dolarů a možností navýšení až na 500 miliard během čtyř let.
OpenAI spouští ChatGPT Gov a uvádí, že více než 90 tisíc vládních zaměstnanců od začátku roku 2024 vygenerovalo v ChatGPT přes 18 milionů promptů.
OpenAI jedná o navýšení kapitálu až o 40 miliard dolarů při valuaci 340 miliard dolarů; startup byl naposledy oceněn na 157 miliard dolarů v říjnu, kdy získal 6,6 miliardy.
DeepSeek vydal Janus-Pro-7B, nový multi-modální model, který ve standardních srovnávacích testech generování obrazu překonává modely DALL-E 3 i Stable Diffusion.
Alibaba představuje Qwen2.5-Max, velký MoE model trénovaný na 20T tokenech, který překonává DeepSeek V3.
ByteDance vydal Doubao-1.5-pro, novou verzi svého vlajkového AI modelu, který podle něj překonává OpenAI v benchmarku testujícím schopnost modelů reagovat na složité instrukce.
Mistral spouští Small 3, model s 24B parametry, který se podle něj vyrovná větším modelům jako Llama 3.3 70B nebo Qwen 32B.
Mistral AI, vnímaný jako největší evropská naděje v AI, ztrácí půdu pod nohama vůči americké konkurenci a je zastíněn DeepSeekem; podle zdrojů je jeho ARR v desítkách $M. CEO Arthur Mensch pro Bloomberg uvedl, že na prodej není.
Meta plánuje v roce 2025 utratit 60–65 miliard dolarů na capex a dosáhnout více než 1,3 milionu GPU. Odhady capex pro rok 2024 byly 38–40 miliard (asi 24 % příjmů), v roce 2023 to bylo 27 miliard.
Perplexity uvádí Sonar, API pro vyhledávání v reálném čase. Umožňuje vývojářům zabudovat real-time AI vyhledávání do vlastních aplikací.
Perplexity uvádí Assistant, multimodální nástroj pro prohlížení webu a automatizaci více aplikací.
Tencent představuje Hunyuan3D 2.0: generování a animace vysoce kvalitních 3D modelů snadno a rychle.
Goldman Sachs představuje GS AI Assistant, interní nástroj navržený k podpoře více než 10 000 zaměstnanců při úkolech od psaní e-mailů po překlad kódu.
ChatGPT Canvas dostává dlouho požadovaný upgrade. Nově generuje HTML a React kód a funguje také s modelem OpenAI o1.
Jack Dorsey (známý díky Twitteru) open-sourcoval Goose, AI agenta, který může ovládat váš počítač – zaměřeného na vývojářské úkoly, ale použitelný i pro další oblasti.
Allen AI představuje Tülu 3 405B, open-source post-trénovací model, který překonává DeepSeek-V3 ve výkonu.
🛠️ AI prakticky
📹 V ChatGPT pokročilém hlasovém módu máme nově v EU ikonku kamery (i bez zapnuté VPN), která umožňuje mít v reálném čase konverzaci o tom, co vidí váš mobil. Pro placené uživatele.
✍🏻 Jaké jsou nejlepší aplikace na vizualizaci a jednoduché nastavení AI workflow či agentů? n8n, Gumloop, Flowise, Langflow, nebo třeba Lindy, Make či Zapier.
🗣️ Když naplníte limity pokročilého hlasového módu ChatGPT, můžete si povídat s Gemini (i) v češtině.
🧠 Sarah Tavel z Benchmarku trefně shrnuje rozdíly v informačním chování ve světě Google vyhledávače vs LLMs. Soběstačnost ve smyslu “sám si to najdu a vymyslím” již přestává být zásadní výhodou. AI je páka pro mysl a je třeba ji využívat naplno.
📚 Co si přečíst, zhlédnout a poslechnout
▶️ George Sivulka, Co-Founder & CEO Hebbia na téma budoucnost modelů i firemní AI. Proč RAG nefunguje, proč je většina “enterprise AI” bullshit, a proč se Satya Nadella mýlí, když říká, že agenti nahradí většinu SaaS.
🎧 CEO Figmy Field v podcastu Invest Like the Best o AI a dopadu na design. Zmiňuje mj. výrok z X: “O svou práci se nebojím, protože ani produkťák mě neumí dobře promptovat.” (u čehož mě napadlo, že to vypovídá víc o schopnostech PMs než o AI)
䷉ Y Combinator vydal další verzi seznamu startup nápadů, které by rád viděl a zafinancoval. AI nalevo a napravo.
䷉ V a16z se podrobněji podívali na oblast hlasových agentů.
䷉ Zamyšlení Stevena Sinofského nad tím, jak se může vyvinout ovládání počítače (computer use) a jak lze očekávat, že se web přizpůsobí.
䷉ Petr Baudiš z Rossumu o AI agentech: kdo chce najít v 2025 v agentech hodnotou, měl by přemýšlet o specifických (nikoli obecných) řešeních, která nejsou autonomní a proaktivní, ale drží se zavedeného workflow.
📆 Události
Další Miton Times: 27.2. od 16:00 v Mitonu offline nebo online na streamu. Tentokrát s Augustinem Žídkem z Google DeepMind na téma AlphaFold a predikce molekul.
💰Transakce a hráči
🇺🇸 Anthropic získá $1B od Googlu. (zatím finálně nepotvrzeno)
🇺🇸 ElevenLabs získal $180M v rámci Series C financování, čímž dosáhl valuace $3.3B. AI startup zaměřený na generování audia. Kolo vedli a16z a ICONIQ Growth.
🇺🇸 Motif získal $46M v rámci Seed a Series A financování. Startup vyvíjející cloudové 3D nástroje pro architektonický design s AI funkcemi.
🇺🇸 Clay získal $40M v rámci Series B financování s valuací $1.25B. Startup zaměřený na AI nástroje pro prodejní týmy.
🇺🇸 Lanai získal $10M v rámci Series A financování vedeného Juxtapose, s účastí Lux Capital, F7 Ventures a BAG. Startup pomáhá firmám monitorovat a spravovat používání AI nástrojů jejich zaměstnanci.
🇮🇱 Doti AI získal $7M v rámci Seed financování vedeného F2 Venture Capital. AI vyhledávací platforma pro podniky.
🇺🇸 Coval získal $3.3M v rámci Seed financování vedeného MaC Venture Capital, s účastí General Catalyst a YC. Startup poskytuje simulační a evaluační řešení pro AI agenty.
🇺🇸 Origami Agents získalo $2M v rámci Seed financování od skupiny angel investorů. AI startup zaměřený na vývoj výzkumných agentů pro automatizovanou identifikaci potenciálních obchodních příležitostí.
📊 Povedená vizualizace
První zodpovědností foundera není product market fit. Ale dobře si vybrat, kde jej najde. Proces SPC označený jako -1 to 0 proto stojí za to dělat pořádně. Rámec níže může fungovat pro pro AI startupy dobře: zatímco zelená cesta umožňuje využít AI pro dobře známé workflow, černá znamená udělat díky AI již existující jinak a lépe.
🆇 Výběr z X
O tom, že Google ani OpenAI nemají v modelech žádnou konkurenční obranu, psalo uniklé memo z Googlu již v 2023. Co v dnešní diskusi trochu zapadá je fakt, že obě firmy jsou hluboko v aplikační vrstvě. Komodifikace inteligence je daleko větší problém např. pro Mistral a menší tvůrce modelů. AI model ≠ bezpečný business model.
Počítačové vidění patří mezi oblasti, kde má Česko velmi silnou talentovou základnu.
Partnerka VC fondu se ptá, jestli mají zrušit nabídku stáží, když je venku deep research od OpenAI. Odpověď Jeremyho hezky shrnuje konsensus ohledně toho, v čem bude v post-AGI éře přidaná hodnota lidí. Tedy …. na nějakou dobu.
🤖 a 🐳
Vtipné video s receptem na DeepSeek (obsahuje nepřesnosti vyvrácené v úvodu).