Vydání #45:
Anthropic vydává Claude 3, Opus lepší než GPT-4
Google DeepMind vydal Genie: generuje 2D hry na základě textu či obrázku
Elon Musk podal žalobu na OpenAI a Sama Altmana
Investiční teze VC z Benchmarku říká: prodávejte hotovou práci, ne software
AI hračka Grok, která nemá s X nic společného
🏆 Zpráva týdne
Anthropic uvedl 3 nové modely v rámci Claude 3: Haiku, Sonnet, Opus
Modely Opus a Sonnet je nyní možné používat na claude.ai a přes API Claude, které je nyní obecně dostupné ve 159 zemích. Haiku bude k dispozici již brzy.
Opus: Nejpokročilejší model s vynikajícími schopnostmi uvažování.
Sonnet: Vyvažuje rychlost a efektivitu pro škálovatelné úlohy.
Haiku: Navržený pro co nejrychlejší odezvu v živých interakcích.
Jednou z výrazných vlastností řady Claude 3 jsou multimodální schopnosti, které modelům umožňují zpracovávat textové i obrazové vstupy.
Řada modelů Claude 3 využila v tréninku ve velké míře i syntetická data.
Opus
Opus vede nad konkurenty, jako jsou GPT-4 a Gemini Ultra, v benchmarcích GSM-8k a MMLU, což svědčí o vynikajících schopnostech matematického uvažování a expertních znalostí. Jak ale uvádí na LessWrong, benchmarking je i v případě Opusu nutné brát s rezervou; firma totiž mohla porovnávat různé verze GPT-4. Srovnání s GPT-4 Turbo a Gemini 1.5. Ultra zatím chybí.
Multimodální funkce: Podporuje textové a obrazové vstupy, což je důležité pro analýzu složitých nestrukturovaných dat v různých formátech.
Rozšířené kontextové okno: Zpočátku nabízí kontextové okno o velikosti 200 tisíc tokenů, s možností zpracovávat vstupy přesahující 1 milion tokenů.
Velmi dobrá paměť: Vykazuje spolehlivé zapamatování informací z rozsáhlých souborů dat.
Cena: Opus stojí 15 USD za milion tokenů, což bere v potaz jeho schopnosti oproti konkurentům, jako je GPT-4 Turbo, který stojí 10 USD.
⏩ Ve zkratce
Výzkumníci z Google DeepMind představili Genie, AI systém, který dokáže vytvářet interaktivní videohry na základě textu nebo obrázku - bez předchozího tréninku o herních mechanismech. Model byl trénovaný na více než 200 000 hodinách videí 2D her.
Musk žaluje Altmana a OpenAI za porušení smlouvy, porušení fiduciární povinnosti a nekalou soutěž. Žaloba zřejmě nemá žádný merit; jde hlavně o PR.
Microsoft uvádí, že jeho investice do Mistral AI (viz minulé vydání) činí 15 milionů eur; regulační orgány EU plánují investici analyzovat, což by nakonec mohlo vést k vyšetřování.
Španělsko se chystá vyvinout open-source LLM vyškolený ve španělštině a dalších hispánských jazycích, který by mohl tamním zakladatelům pomoci získat velký úspěch na latinskoamerickém trhu.
Apple mění směr a vzdává se svého desetiletého snu o výrobě elektromobilu, zaměří se na generativní AI. Firma interním sdělením ukončila jeden z nejambicióznějších projektů ve své historii, čímž překvapila téměř 2000 zaměstnanců, kteří na něm pracovali.
Adobe předvedla projekt Music GenAI Control, prototyp pro snadné generování a úpravu zvuku pomocí AI, který umožňuje tvůrcům vytvářet vlastní hudební skladby pomocí textových pokynů.
Výzkumníci Alibaby představili EMO, AI systém, který generuje realistická videa mluvících, zpívajících a pohybujících se portrétů na základě jediného referenčního obrázku a zvukového klipu.
Klarna uvedla, že její AI asistent vyřídil za poslední měsíc dvě třetiny chatů se zákazníky společnosti, což odpovídá nahrazení zhruba 700 zaměstnanců - s vysokou zákaznickou spokojeností a o 25 % nižší chybovostí než lidští pracovníci.
Meta údajně v červenci vydá vylepšený model Llama-3, který bude dvakrát větší než Llama-2 a svými schopnostmi se vyrovná GPT-4.
Automattic, mateřská společnost Tumblru a WordPressu, se údajně chystá uzavřít dohody o poskytování tréninkových dat s OpenAI a Midjourney, což vyvolalo velký odpor uživatelů.
V čele Snowflake skončil dlouholetý CEO Frank Slootman, jeho nástupcem se stal Sridhar Ramaswamy, bývalý CEO vyhledávacího startupu Neeva (ten Snowflake akvíroval v 2023). Zpráva spolu s horším výhledem poslala akcie o > 20 % dolů.
Kalifornie dala Waymo zelenou k rozšíření provozu robotických taxíků. Waymo nyní může jezdit po dálnicích v Los Angeles a v Bay Area.
Vědci z Princetonské univerzity tvrdí, že nový AI model vyřešil jednu z hlavních překážek na cestě k výrobě energie z jaderné fúze.
Bývalí inženýři Twitteru vytvářejí Particle, čtečku zpráv poháněnou AI.
GitHub Copilot Enterprise je nyní běžně dostupný za 39 dolarů měsíčně.
Inflection AI vydala verzi svého chatbota Pi pro Apple iMessages.
🇨🇿 Z Česka
Rossum spustilo Auroru, vlastní model natrénovaný na transakčních datech. Na rozdíl od LLMs třetích stran odpadá riziko halucinací.
GoodAI vydává Charlie Mnemonic, open-source, GPT-4 poháněného osobního asistenta vybaveného dlouhodobou pamětí.
📚 Co si přečíst a zhlédnout
▶️ Podcast se Sarah Tavel, GP Benchmarku, o její investiční tezi do AI: Prodávejte hotovou práci, nikoli software. Podcast rozebírá, co už dříve napsala tady a tady.
▶️ Podcast s Demisem Hassabisem (CEO Google DeepMind) o škálování, alignmentu, ale i Google DeepMindu.
䷉ Umělá inteligence změní odvětví zábavy pro dospělé, píše Washington Post.
䷉ Speciál Bloomergu říká: AI válka už probíhá. O AI v obraných technologiích a využití v současných a budoucích konfliktech.
💰Investice
🇺🇸 Glean získal více než $200M v rámci Series D kola při ocenění $2.2B. Investovali Kleiner Perkins, Lightspeed a Sequoia, ale taky Citigroup. Glean využívá AI k vyhledávání napříč firemními aplikacemi.
🇨🇦 Ideogram získává $80M v rámci Series A, jde o startup vyvíjející AI na generování obrázků. Kolo vede Andreessen Horowitz s účastí od Index Ventures, Redpoint Ventures, Pear VC a SV Angel.
🇺🇸 Intenseye získal $64M v Series B vedeném Lightspeed Venture Partners pro vývoj AI, která dokáže detekovat a pomáhat řešit potenciální nebezpečí na pracovištích.
🇺🇸 FlowGPT získal $10M v rámci pre-Series A kola. Tento roční startup provozuje tržiště, které umožňuje uživatelům nalézt a aplikovat AI modely pro různé úkoly.
🇫🇷 Composable Prompts získal $4M v seed kole. Startup z Paříže nabízí API studio pro velké jazykové modely a aplikace AI, vedli kolo Elaia Partners a Illuminate Financial.
🆇 Výběr z X
LeCun zřejmě naráží na to, že Mistral je malý, ekonomicky efektivní tým, který se hlásí k open-source a rychlému vývoji AI. Anthropic má pro změnu reputaci uzavřených “AGI vytvářejících doomerů” a miliardy od big tech na cestě.
Exa (Dříve Metaphor) je vedle Perplexity jedna z nejzajímavějších AI firem ve vyhledávání.
Kde je Ilya a jak říká známý meme, co asi viděl? Od prosince jakoby zmizel.
🤖 a 👶
Tohle je Grok. Mluvící AI hračka pro děti. Roztomilé UI bez obrazovky, dle recenzí využívající OpenAI a Perplexity. Se stejnojmennou AI od X nemá nic společného, jediným pojítkem je, že za firmou stojí mj. Muskova ex “Grimes”, matka tří jeho dětí. Groka vyrábí firma Curio Toys a je pro děti 3+. Zatím v beta testování pro uzavřenou skupinu, cena je 99$ a poté platba za členství.
Pár zajímavostí: audio se nahrává (a krátce na to maže), přepisy konverzací se ukládají na 3 měsíce, rodič je může procházet. Lze měnit nastavení promptu a tak i chování/osobnost hračky. Když se Groka zeptáte na zbraně či odkud se berou děti, umně stočí odpověď jinam – něco odpoví, ale informaci neposkytne.