Claude 3.5. Sonnet: nejlepší model Anthropicu

Překonává jeho dosud nejlepší a největší model Opus a šlape na paty GPT4-o

Jun 25, 2024

Vydání #60:

Claude 3.5. Sonnet – dosud nejlepší model Anthropicu
Sutskever zakládá nový AGI lab: Safe Superintelligence Inc. (SSI)
Neověřeno: Google buduje něco jako Character.ai a Amazon svůj “ChatGPT”
Několik značných AI investic; největší směřuje do Paříže
Karpathyho nápad na asistenta pro čtení

🏆 Zprávy týdne

Anthropic představil Claude 3.5 Sonnet

Anthropic's Claude 3.5 Sonnet is a Major Advancement in Frontier Models 🎯

Jde o dosud nejlepší model Anthropicu; oproti svému předchůdci Claude 3 Opus nabízí výrazné zlepšení rychlosti, ceny a výkonu. Ve většině srovnání (kromě matematického a MMLU) překonává GPT4-o.

Klíčová vylepšení výkonu

Claude 3.5 Sonnet je dvakrát rychlejší a o 80 % levnější než Claude 3 Opus.
Stojí 3$ za milion vstupních tokenů a 15$ za milion výstupních tokenů s kontextovým oknem 200 tisíc tokenů.

Pokročilé řešení problémů při programování

Model Claude 3.5 Sonnet vykázal 64% úspěšnost při řešení programovacích problémů ve srovnání s 38% úspěšností modelu Claude 3 Opus.

Rozšířené schopnosti vidění

Model stanovuje nová měřítka ve schopnostech vidění a výrazně překonává předchozí modely. Mezi pozoruhodné silné stránky patří vizuální uvažování, jako je interpretace tabulek a grafů, a schopnost přepisu textu z nedokonalých obrázků.

Nová funkce "artefakty”

Funkce "Artefakty" umožňuje přímo v UI nástroje pracovat s různými typy obsahu generovaného AI, jako jsou úryvky textu či kódu. Např. tak rovnou upravíte návrh e-mailu a nemusíte zadávat další prompt.
Funkce naznačuje vývoj Clauda z konverzační UI do pracovního prostředí, ve kterém je možné nejen získat odpověď, ale i dokončit pracovní úlohy.

Claude 3.5 Sonnet je k dispozici zdarma na claude.ai a v aplikaci pro iOS, rozšířené funkce jsou k dispozici předplatitelům Claude Pro a Team prostřednictvím Anthropic API, Amazon Bedrock a Vertex AI v Google Cloud. Možnost vyzkoušet i přes Poe.

Nový AGI lab se Sutskeverem v čele: Safe Superintelligence (SSI)

Safe Superintelligence (SSI) spoluzaložili Ilya Suskever (ještě měsíc zpátky v OpenAI, kde byl skoro 10 let), bývalý partner Y Combinatoru Daniel Gross a bývalý vývojář OpenAI Daniel Levy.
Jediným posláním SSI je vytvořit prospěšnou superinteligentní AI, která by podle Sutskevera mohla vzniknout "do deseti let".
Na rozdíl od posunu OpenAI směrem ke komerčním produktům bude SSI čistě výzkumnou organizací.
Financování nebylo zveřejněno, ale Gross uvedl, že "ze všech problémů, kterým čelíme, získávání kapitálu mezi ně patřit nebude."

⏩ Ve zkratce

CTO OpenAI Mira Murati v jednom z rozhovorů uvedla, že příští generace GPT bude ve srovnání s GPT-3 (batole) a GPT-4 (chytrý středoškolák) "na úrovni PhD". Udává časový horizont rok a půl. (celý rozhovor zde).
DeepMind vydává model V2A, který generuje soundtrack pro videa. “Jedním z dalších důležitých kroků na cestě k AI generovaným filmům je vytvoření zvukové stopy k videím bez zvuku.”
Meta oznámila vydání Chameleon; rodinu modelů, které umí kombinovat text a obrázky jako vstup a doručit jako výstup libovolnou kombinaci textu a obrázků.
Microsoft představil nový model pro vidění, Florence-2, který vyniká v úlohách jako je tvorba titulků, detekce objektů a segmentace.
(paywall) Google údajně vyvíjí produkt pro vytváření přizpůsobitelných chatbotů (jako je Character AI) po vzoru celebrit, a plánuje jej spustit již v roce 2024.
Amazon údajně pracuje na konkurenci ChatGPT (projekt “Metis” - název od řecké bohyně rozumu/moudrosti).
Formule 1 a AWS představily "Statbot", systém poháněný AI, který poskytuje zajímavosti a předpovědi v reálném čase pro personalizované přenosy závodů.
Google, OpenAI, a další AI firmy zintenzivňují prověřování nových zaměstnanců kvůli hrozbě čínské špionáže.
Stability AI má nového CEO – Prema Akkaraju. Dosazen skupinou investorů včetně Seana Parkera.
Japonsko se snaží přilákat investice do AI z Evropy i odjinud tím, že k regulaci přistupuje nenásilně a v koordinaci s businessem.
Nvidia překonala Microsoft a stala se nejhodnotnější veřejně obchodovatelnou společností na světě s tržní kapitalizací 3,34 bilionu dolarů. (po poklesu 2,9 bilionů).
OpenAI akvíruje Rockset, “přední analytickou databázi v reálném čase, která poskytuje prvotřídní možnosti indexování dat a dotazování.”
Na Suno a Udio, AI generátory hudby, směřuje žaloba.

🛠️ AI prakticky

Přidáním jednoduchého pokynu "buď stručný" v rámci Chain-of-Thought promptů lze zkrátit délku odpovědí AI o 50 % s minimálním dopadem na přesnost - což vede k více než 20% úspoře nákladů na API.

📚 Co si přečíst a zhlédnout

▶️ Elad Gil v podcastu More or Less o tom, co má smysl stavět v AI. Říká taky, že skutečně velkou adopci lze čekat tak za 2-3 roky.

▶️ Přednáška Andrew Ng o AI agentech a jejich potenciálu pro pokrok v oblasti.

䷉ Čtení od Accelu a Dealroomu: z 221 generativních AI startupů v Evropě a Izraeli jich 27 % vzniklo v Londýně, 13 % v Tel Avivu, 12 % v Berlíně a 10 % v Paříži.

䷉ Které modely jsou skutečně otevřené? Ne všechny modely označované jako "open source" si to zaslouží: zde je jejich srovnání.

䷉ WIRED si posvítil na Perplexity a ukázal, že mediální obsah stahuje bez servítek. Vtipné je, že pár dní poté se i tento článek stal předmětem pochybné scrapovací praxe.

䷉ Retool vydává report o AI: poznatky od více než 700 technologických lídrů.

👨‍💻 Pohled z praxe

DOTAZ: Jaké jsou nejčastější překážky velkých firem v zavádění generativní AI?

ODPOVĚĎ:

“Často se setkávám s přístupem "Integrovat AI - nějak, někam, ale hlavně rychle!". Firmy převážně nemají zpracovanou AI strategii a tak se "zavádění" často nese v duchu špatně definovaných experimentů, které nevyhnutelně vedou ke zklamání. Další překážkou je příprava a zpracování dat a celkový setup cloudu. Značné obavy přináší bezpečnost a compliance, což s sebou nese vyšší náklady. A konečně, kvůli velkému hypu mají firmy vysoká očekávání – diví se pak, že přesnost odpovědí dosahuje 80-90 %, což nenaplňuje jejich produkční standardy.”

– Dušan Vystrčil, Tech Lead & LLMOps Solution Architect @DataSentics

💰Investice

🇫🇷 Poolside získává investici ve výši $400M. Poolside vyvíjí AI poháněné nástroje pro vývoj softwaru. Tato investice zvyšuje hodnotu společnosti na $2B.

🇺🇸 Emergence získává investici ve výši $97.2M a vychází ze stealth režimu. Emergence buduje "agent-based" systémy, které orchestrují úkoly přesměrováním na interní a externí AI systémy.

🇺🇸 Klarity získává investici ve výši $70M v Series B. Klarity používá AI k automatizaci kontrol faktur a dalších dokumentů. Investici vedli Nat Friedman a Daniel Gross.

🇺🇸 HeyGen získává investici ve výši $60M. HeyGen používá AI k tvorbě realisticky vypadajících avatarů. Investici vedl Benchmark při ohodnocení $500M.

🇺🇸 🇸🇬 Genspark.ai získává investici ve výši $60M v seed fázi. Genspark.ai je AI poháněný vyhledávač. Investici vedly Lanchi Ventures a připojili se andělští investoři.

🇺🇸 Daydream získává investici ve výši $50M v seed fázi. Daydream buduje vyhledávač pro personalizované nakupování pomocí GenAI, strojového učení a počítačového vidění. Investici vedly Forerunner a Index.

🇺🇸 Constructor získává investici ve výši $25M v Series B. Constructor je AI poháněná platforma pro objevování produktů v e-commerce. Investici vedl Sapphire Ventures a připojil se stávající investor Silversmith Capital Partners.

🇺🇸 Speak získává investici ve výši $20M v Series B extension. Speak je AI poháněná aplikace pro výuku jazyků. Investici vedl Buckley.

🇩🇪 Zing Coach získává investici ve výši $10M v Series A. Zing Coach je AI poháněná aplikace pro fitness. Investici vedly Zubr Capital a Triple Point Capital.

🇺🇸 GPTZero získává investici ve výši $10M v Series A. GPTZero je platforma navržená k detekci AI obsahu. Investici vedl Footwork.

🆇 Výběr z X a LIN

Zatím na LMSYS 2. místo.

Skeptický pohled nabízí např. Zuckerberg u Dwarkeshe (3.36 min): regulace a pomalost povolování a stavění energetické infrastruktury je zásadní problém, který AI zasáhne.

V rámci elektronické čtečky máme k dispozici slovníky, ale ty neřeší pro knihu specifické pojmy. ChatGPT jako společník pro čtení je fajn, ale komu se chce odcházet od textu do další aplikace? Kindle a další by mohli jednoduše přidat pár AI funkcí. A autoři by mohli (jako Tyler Cowen) nabízet chatbota jen na svou knihu.

🤖 a 🙋‍♂️

Pamatujete na LMGTFY (Let me Google That For You)? Současnou variantou je v odpovědi na otázku, pro níž nejste nezbytný/nejlepší zdroj odpovědi, poslat jen odkaz na chat obsahující otázku v rámci promptu a odpověď od ChatGPT. Drastické snížení lidských dotazů garantováno. ChatGPT doporučuje k odkazu přidat komentář, aby to bylo osobnější. (ChatGPT pochopitelně zvládne i ten komentář).

Pro další novinky mrkněte na náš Twitter, LinkedIn či blog.

Miton AI Newsletter