Vydání #55:
Mnoho velkých oznámení Googlu na I/O
Konec superalignment týmu v OpenAI
Spoluzakladatel OpenAI v podcastu o AGI, Fei-Fei o prostorové inteligenci
Scarlett Johansson vs OpenAI kvůli hlasu “Sky”
Teze o defenzivních technologiích
🏆 Zpráva týdne
Oznámení z vývojářské konference Google I/O
Všech 100 důležitých oznámení na odkazu výše ⬆️, zde to nejdůležitější:
Vylepšení vyhledávání:
Vyhledávání Google nyní nabídne „AI Overviews“ - tedy odpovědi syntetizující výsledky (jako nabízí např. Perplexity). Zatím jen V USA.
Gemini bude moci provádět složitější plánování, například itinerářů cest.
Vyhledávání také získá funkce „vícekrokového uvažování“, které Gemini umožní rozložit otázky a urychlit vyhledávání.
Uživatelé budou moci vyhledávat s využitím videa. Po nahrání videa bude možné získat jeho shrnutí nebo klást dotazy na jeho obsah.
Pokrok v oblasti agentů:
Google oznámil Projekt Astra, prototyp agenta AI v reálném čase, který vidí, slyší a provádí akce jménem uživatele.
Demonstrace představila hlasového asistenta, který reaguje na to, co vidí a slyší, včetně kódu, obrázků a videa - je schopen pokročilého uvažování.
Veřejný přístup k Astře se očekává prostřednictvím aplikace Gemini později v tomto roce.
Google také předvedl „AI teammates“, agenty, kteří mohou odpovídat na otázky týkající se e-mailů, schůzek a dalších dat v rámci Workspace.
V příštích měsících se také rozběhne živé vysílání, které uživatelům umožní mluvit a konverzovat s Gemini téměř v reálném čase.
=> Google tímto prakticky demonstroval paritu s OpenAI v oblasti brzkých schopností AI asistentů. Nicméně, historická zkušenost naznačuje, že realita za prezentacemi u Google pokulhává. I tak je ale situace Google v AI zásadně jiná než před rokem, a jeho akcie téměř na maximech to dokreslují.
Představené a aktualizované modely:
Veo je konkurentem text-video modelu Sora (OpenAI). Dokáže vytvářet dlouhá videa v rozlišení 1080p z textových podnětů a stejně jako Sora tvrdí, že „simuluje fyziku světa“.
Gemini 1.5 Pro, které Google odhalil v únoru, je nyní dostupný všem: prostřednictvím API, AI studia, Gemini Advanced a všech aktualizací produktů. Délka kontextu Gemini 1.5 Pro byla zdvojnásobena na 2 miliony tokenů.
Nový model Gemini 1.5 Flash je k dispozici také ve studiích API a AI. Je rychlejší a levnější než Gemini 1.5 Pro. Jeho výkon jej řadí do blízké kategorie jako je Llama 3 70B a Claude Sonnet, ale s cenou podobnou Claude Haiku.
Imagen 3, jejich nejschopnější model pro generování obrázků, bude k dispozici v několika verzích, z nichž každá je optimalizována pro různé typy úloh, od generování rychlých náčrtů až po obrázky s vysokým rozlišením.
Gemma 2 a PaliGemma, dva nové otevřené modely. PaliGemma je prvním open-source modelem Googlu pro vidění a je již k dispozici. Gemma 2 je model s 27B parametry, který překonává předchozí verzi.
⏩ Ve zkratce
Ilja Sutskever a Jan Leike, dva vedoucí „super alignment“ týmu v OpenAI, odešli – a celý tým tak končí. Zatímco v případě Ilji se o odchodu spekulovalo už od nepovedeného puče, odchod Jana Leike negativně překvapuje zastánce bezpečného vývoje AI.
OpenAI oznámila partnerství s Redditem. OpenAI získá přístup k datům Redditu pro ChatGPT a „nové produkty“. OpenAI se také stane reklamním partnerem Redditu.
ChatGPT brzy uvede na trh významnou aktualizaci funkcí pro analýzu dat, která usnadní přidávání souborů, práci s velkými soubory dat, vytváření grafů a získávání informací přímo v rámci platformy.
Problémy Stability AI pokračují: objevila se zpráva, že firma v Q1 2024 vygenerovala tržby ve výši pouhých 5 milionů dolarů a zároveň spálila 30 milionů dolarů (nemluvě o tom, že poskytovatelům cloudu dluží 100 milionů dolarů). Měla taky jednat o prodeji.
ElevenLabs uvedla na trh svou první B2C aplikaci s názvem Reader: AI Audio, která dokáže číst webové stránky, PDF a další dokumenty 11 různými hlasy.
Technologický inovační institut Spojených arabských emirátů vydal Falcon 2, rodinu open-source textových a vizuálních modelů.
Intercom vynaloží 100 milionů dolarů ze svých hotovostních rezerv na vytvoření nového nástroje s názvem Fin X.
Expedia začíná testovat AI funkce pro vyhledávání a plánování cestování.
Waymo uvádí, že její robo taxi nyní každý týden uskuteční 50 000 placených jízd.
Slack ve výchozím nastavení shromažďuje vaše zprávy a soubory za účelem vývoje AI.
Meta zkoumá sluchátka s kamerami s podporou umělé inteligence.
Spoluzakladatel Instagramu je novým produktovým ředitelem Anthropicu.
Deepfakes mrtvých příbuzných jsou prosperujícím čínským byznysem.
📚 Co si přečíst a zhlédnout
▶️ AI průkopnice Fei-Fei na TEDu o významu prostorové a vizuální inteligence.
▶️ 2 VCs, Tomazs Tunguz a Matt Turck, v konverzaci i AI, datech, kryptu.
▶️ Dwarkesh a John Schulman (spoluzakladatel OpenAI) - o uvažování, RLHF a plánu pro AGI v roce 2027.
䷉ Esej od Chief of Staff z Anthropicu s názvem: mých posledních 5 let pracovního života si klade zásadní otázku: můžeme být šťastní i bez práce?
䷉ Představení nové sociální služby Maven na WIRED, která díky AI prioritizuje témata a znalosti, nikoli engagement. Založil ji ex-OpenAI výzkumník Ken Stanley.
💰Investice
🇬🇧 PolyAI získal $50M ve financování Series C. Tento poskytovatel hlasových asistentů pro podniky má nyní celkem přes $120M na rozvoj AI řešení pro kontaktní centra. Kolo vedli Hedosophia, Nvidia's NVentures a Zendesk.
🇸🇪 Leya se sídlem ve Stockholmu získala $10.5M v seed financování. Kolo vedl Benchmark s účastí Hummingbird, SV Angel a Y-Combinatoru. AI poháněná platforma optimalizuje právní workflow.
🇬🇧 Malted AI získal £6M na rozšíření vývoje malých AI modelů pro firmy. Kolo vedl Hoxton Ventures, s účastí Creator Fund a andělských investorů.
🇺🇸 Laws of Motion získal $5M v seed financování. Kolo vedl Corazon Capital, s účastí The Scout Program a Leadout Capital. Tento poskytovatel AI technologie nabízí určování velikostí pro e-commerce značky.
🇸🇪 QA.tech se sídlem ve Stockholmu získal €3M v seed financování. Kolo vedl PROfounders s účastí investorů včetně Curiosity a byFounders. Jde o nástroj využívající AI k testování aplikací a SaaS služeb.
🇸🇪 Grasp se sídlem ve Stockholmu získal $1.9M ve financování. Kolo vedl Yanno Capital s účastí Philian Invest. Jde o AI asistenta pro investiční bankéře a konzultanty.
🆇 Výběr z X
Příběhy těchto startupových obratů anekdoticky podporují tezi, že začít v AI se službou a postupně produktivizovat nástroje k její exekuci, může být cesta.
Google na I/O představil automatický monitoring hovorů – a nemusíte být privacy extrémista, aby vás to zaujalo.
Humorně laděný příspěvek v sobě skrývá spoustu pravdy. Ostatně, OpenAI tento týden stáhlo z produkce jeden z hlasů v ChatGPT. Jmenoval se “Sky” a velmi připomínal Scarlett. Tedy Samanthu z Her. Myslí si to i herečka, kterou měla OpenAI měsíce zpátky (a nedávno znovu) dle jejích slov oslovit s nabídkou. Odmítla. Šokována z uvedení hlasu, který byl tak podobnými jejímu, Scarlett poslala na OpenAI právníky. Tweet Altmana “her” po představení GPT4-o taky nepomohl. Více kontextu zde.
Postavit proti sobě AI a lidi ve znalostní soutěži, již velký smysl nedává. Co ale různé modely proti sobě v úlohách záměrně vytvořených pro AI?
🤖 a ☢️
Matt Clifford z Entrepreneur First vydal článek, ve kterém představuje další program EF a investiční tezi: defenzivní technologie. Nemá na mysli jen obranné technologie, ale obecně všechny, které mohou vyvažovat a eliminovat negativní důsledky jiných technologií. Nazývá to ecc/def a jako příklad uvádí AI proti AI.
“Jde o myšlenku, že nejsilnějším řešením technologických rizik je často více technologií. Je to způsob, jak sladit technologický optimismus s vážným přístupem k nebezpečným schopnostem.”
V článku taky zmiňuje knihu o jaderném konfliktu, která dnes budí velmi silné ohlasy.
“Je nemožné číst nedávnou knihu Annie Jacobsenové Nuclear War: A Scenario (vřele doporučuji!) a nepřemýšlet při tom: „Co můžeme udělat pro to, aby se to nikdy nestalo?“
Kulturně s tématem pracuje např. americký film Colossus: The Forbin Project z roku 1970. V něm figurují jak defenzivní AI (AGI), tak i jaderné zbraně.