Vydání #34:
Google Gemini - největší konkurence GPT-4
Mistral získává masivní Series A a představuje nový model
WIRED článek o open-source AI
Záznamy z AI Summitu Cerebral Valley
Karpathy vysvětluje problém LLM halucinací
🏆 Zpráva týdne
Google konečně představil rodinu modelů Gemini
Od počátku jsou konstruovány pro multimodalitu a předvádí působivé rozpoznávání zvuku, videa a obrazu - a excelují v kódu a jazyce. Kapacity z demo videa modely sice nemají, ale nemělo by to být daleko. Kolem demo videa byl trochu rozruch, protože se ukázalo, že bylo silně zeditované.
Gemini bude ve třech verzích - Ultra, Pro, Nano.
Gemini Ultra je určený pro komplexní úlohy v datových centrech a firemních aplikacích. Na trhu bude až příští rok. S výsledkem 90.0 % v testu MMLU (massive multitask language understanding) je prvním modelem, který překonal lidské experty (89.8 %) i GPT-4 (86.4 %) v řadě znalostních úloh a úloh na řešení problémů v 57 oborech včetně matematiky, fyziky, historie, práva, medicíny a etiky. Všechny výsledky jsou reportované Googlem a zatím není možné je ověřit.
Gemini Pro slouží širšímu spektru služeb a integruje se s Bardem a aplikacemi jako Gmail, YouTube, Google Mapy, Google Flights. To by mělo Barda posunout na zcela novou úroveň (lze vyzkoušet jen přes osobní e-mail, avšak nikoli v Evropě a Kanadě, jen v USA). Vývojářům bude k dispozici prostřednictvím API v Google AI Studio nebo Google Cloud Vertex AI od 13/12.
Nejmenší člen rodiny, Gemini Nano, má dvě verze: Nano-1 s 1.8B parametrů a Nano-2 s 3.25B parametrů. Tyto modely jsou speciálně navrženy pro operace na mobilních zařízeních s Androidem.
V oznámení je pohřbena krátká zpráva o Gemini poháněném Alpha Code 2 na generování kódu, který dosáhl lepších výsledků než 85 % lidských účastníků soutěžního programování.
Jakkoli zatím drtivá většina informací pochází od Googlu, lze říci, že představení Gemini patří mezi nejvýznamnější oznámení roku. Pro tvůrce AI softwaru, ale i velké firemní zákazníky se otevírá další možný dodavatel špičkové inteligence – navíc bez rizik špatné korporátní governance a s existující infrastrukturou.
⏩ Ve zkratce
Mistral AI vydal další open-source model, Mixtral-8x7B a v rámci AI komunity zatím panuje velké nadšení.
EU v pátek schválila finální verzi svého EU AI Aktu, komplexní regulace umělé inteligence. Detaily ani analýzy dopadu na startupy zatím nemáme, první reakce jsou ale převážně negativní. Pro open-source to však zdá se (i díky lobbyingu Mistralu, Mety a Aleph Alpha) dopadlo dobře.
Vznikla nová skupina pro spolupráci v oblasti bezpečnosti AI s názvem AI Alliance – za podpory IBM a Mety sdružuje přední vývojáře, výzkumníky, akademiky, firmy a inovátory, kteří spolupracují na projektech podporujících otevřené a odpovědné systémy umělé inteligence.
Meta oznamuje Purple Llama, open-source projekt, který poskytuje nástroje a hodnocení důvěryhodnosti a bezpečnosti pro vývoj zodpovědné generativní AI.
Výzkumníci z Google DeepMind vyvinuli nový způsob, jak mohou AI agenti získávat znalosti z lidských demonstrací v reálném čase - což umožňuje "kulturní přenos".
Animate Anyone je nový projekt Alibaby, který dokáže animovat libovolný obrázek tak, aby se pohyboval podle vašich představ.
Šeptá se o novém, velmi silném modelu od ByteDance (TikTok).
xAI Elona Muska údajně usiluje o získání nové finanční podpory ve výši $1B.
📚 Co si přečíst a zhlédnout
䷉ Velká hra v open-source AI: článek pro český WIRED o strategickém soupeření uzavřené a otevřené strany AI.
▶️ Záznamy z konference Cerebral Valley AI Summit. (Cerebral Valley je název pro Hayes Valley – sousedství v SF, kde se koncentrují AI hacker housy). Za zhlédnutí stojí např. Suleyman z Inflection AI.
▶️ Krátký klip od Stripe o Paříži a vzkvétající francouzské AI scéně.
💰Investice
🇫🇷 Mistral AI získal $414.41M Series A. Kolo vedly fondy a16z a Lightspeed. (více detailů příští týden, pár hodin stará zpráva).
🇺🇸 AssemblyAI získalo $50M Series C na vytváření a poskytování AI modelů pro řeč. Kolo vedl Accel.
🇬🇧 AutogenAI získal $39.5M milionu Series B. Firma se zabývá tvorbou nabídek pro soutěž v oblasti veřejných zakázek. Kolo vedly fondy Salesforce Ventures a Spark Capital za účasti Blossom Capital.
🇫🇷 Pimento získalo $3.2M seed financování. Startup chce díky AI pomáhat kreativcům v lepší ideaci, brainstormingu, moodboardingu. Kolo vedly fondy Partech and Cygni Capital.
🇫🇷 Kleep získává €1.8M na budování AI produktu pro snížení vratek v módě.
🇬🇧 Harriet získalo £1.2M na svého AI asistenta pro HR. Kolo vedl fond Concept Ventures.
🆇 Výběr z X
Střízlivý pohled na Gemini od CEO Perplexity.
Velmi odlišné přístupy. Mistral na X publikoval bez komentáře jen odkaz na torrent.
Nadšení z modelů Mistralu se začíná blížit tomu z LAaMY od Mety.
Delší příspěvek od Karpathyho vysvětluje, proč je termín halucinace zavádějící.
Zajímavý pohled na open-source modely, včetně praktického využití v produktech.
🤖 a 🇪🇺
🇬🇧 AI zatím regulovat nebude.
🇺🇸 Exekutivní příkaz prezidenta, jinak nic.
🇯🇵 Plánuje velmi základní regulaci, trénink modelů na jakýchkoli datech je OK.
🇪🇺 Jsme první v regulaci AI na světě!
(Obrázek oslavně sdílel komisař Thierry Breton. Faktem je, že 🇨🇳 Čína regulaci AI má, v platnosti již od srpna).