Llama 3.1 and GPT-4o Mini

Největší model od Mety a nejlevnější od OpenAI

Jul 24, 2024

Vydání #62:

Meta uvádí Llama 3.1
OpenAI vydává GPT4-o Mini
Karpathy zakládá vzdělávací startup Eureka Labs
Velká investice Cohere, Harvey, nebo World Labs
Rozhovory s Markem Zuckerbergem o Metě a AI

🏆 Zprávy týdne

Meta vydává Llama 3.1

Meet Llama 3.1, the world's largest and most capable open foundation model - Neowin

Meta vydala Llama 3.1 ve variantách 405B, 70B, a 8B parametrů.

Výkonnost modelu 405B se vyrovná nejlepším uzavřeným modelům.
Otevřené/volné váhy a kód s licencí, která umožňuje fine-tuning, destilaci do jiných modelů a nasazení kdekoli.
Délka kontextu 128k, vícejazyčné schopnosti, dobrý výkon generování kódu, schopnosti komplexního uvažování, použití nástrojů (tool use).
Ekosystém s více než 25 partnery, včetně AWS, NVIDIA, Databricks, Groq, Dell, Azure a Google Cloud.

Zuckerberg:

„Nejvíce se těším na to, až je lidé budou používat k ladění svých vlastních modelů... Podle našich odhadů bude inference přímo na modelu 405B o 50 % levnější než u GPT-4.“

OpenAI vypustilo GPT-4o Mini

Cena GPT-4o mini je 15 centů za milion vstupních tokenů a 60 centů za milion výstupních tokenů, což je o více než 60 % méně než u GPT-3.5 Turbo.
V benchmarku MMLU dosáhl model 82 %, čímž překonal Gemini Flash Googlu (77,9 %) a Claude Haiku od Anthropicu (73,8 %).
GPT-4o mini nahrazuje GPT-3.5 Turbo v ChatGPT pro uživatele Free, Plus a Team.
Model podporuje kontextové okno o velikosti 128 tisíc tokenů a zvládá textové a vizuální vstupy, přičemž v budoucích aktualizacích se plánují funkce zvuku a videa.

⏩ Ve zkratce

Andrej Karpathy, spoluzakladatel OpenAI a bývalý šéf autopilota v Tesle, představuje Eureka Labs, „nový druh školy“, jejímž cílem je edukace v a pomocí AI. Skvělá výměna na Hacker News o tom, proč to mají edukační businessy těžké.
Mistral uvádí na trh dva 7B LLM: Codestral Mamba pro generování kódu na základě architektury Mamba a Mathstral pro matematické uvažování a vědu.
Meta a Apple plánují vyloučit zákazníky z EU z některých svých AI produktů s odvoláním na nejistotu ohledně používání dat a ochranu osobních údajů. (mělo by se týkat zejména budoucích multi-modálních modelů).
Výzkumníci z OpenAI odhalili algoritmus, pomocí kterého se mohou LLM naučit lépe vysvětlovat a zlepšit srozumitelnost svých výstupů.
OpenAI údajně jedná s výrobci čipů, jako je Broadcom, o vývoji vlastního čipu pro AI s cílem snížit závislost na společnosti Nvidia.
Google na akci I/O Connect v Bengalúru představil Project Oscar, open-source platformu, která pomáhá produktovým týmům monitorovat softwarové problémy nebo chyby pomocí AI agentů.
Nvidia a Mistral vydávají Mistral NeMo, 12B-parametrový jazykový model s kontextovým oknem o 128K tokenech, který je k dispozici pod open-source licencí Apache 2.0.
Hugging Face představilo SmolLM, rodinu vysoce výkonných malých jazykových modelů se 135M, 360M a 1.7B parametry.
Microsoft spouští svou AI poháněnou aplikaci Designer v předběžném náhledu pro iOS a Android, která umožňuje uživatelům vytvářet obrázky, samolepky a další prvky a rozšiřuje webového klienta.
Salesforce představilo Einstein Service Agent, autonomního chatbota zákaznických služeb, který využívá LLM a firemní data k pochopení kontextu, přijímání opatření v případě problémů a poskytování personalizovaných odpovědí.
Microsoft předvádí nový model nazvaný SpreadsheetLLM, který pomáhá analyzovat rozsáhlé soubory dat - může naznačovat, že by se do Excelu mohly brzy dostat nové funkce.
Menlo Ventures a Anthropic se spojili v rámci„Anthology Fund“ – fond bude investovat do AI startupů v pre-seed do Series A, začíná se $100M.
Proton uvádí na trh AI asistenta pro psaní e-mailů, který běží lokálně.
Vyšetřování Wired odhalilo, že technologické firmy jako Nvidia, Apple a Salesforce - trénovaly své modely pomocí více než 170 000 videí na YouTube bez souhlasu tvůrců.

📅 Události

Václav Volhejn z Lakery bude mluvit o bezpečnosti LLMs, zejména prompt injections. Online i offline v kancelářích Mitonu v Karlíně, 16:00 - 17:00, 25.7.2024.

📚 Co si přečíst a zhlédnout

▶️ Mark Zuckerberg a jeho shrnutí oznámení Llama a celkového přístupu Mety k AI.

▶️ Mark Zuckerberg ve speciálu Bloombergu o Metě + AI.

▶️ Coatue a jejich současný pohled na trhy, včetně AI.

䷉ Karpathy na X píše, že modely se musí stát nejdříve velké, aby mohly být později malé – kvůli tomu, že pomohou s přípravou tréninkových dat.

䷉ Tržní mapa AI agentů od Dawn Capital.

💰Investice

🇨🇦 Cohere získalo $500M v Series D financování, které vedl kanadský penzijní fond PSP, při ocenění $5.5 miliardy. Cohere je kanadský AI lab vytvářející základní modely.

🇺🇸 Harvey, který vyvíjí AI poháněného kopilota pro právníky, získal $100M v Series C financování, které vedl GV. Tato investice oceňuje společnost na $1.5B.

🇺🇸 World Labs, založený Fei-Fei Li v dubnu 2024 s cílem vytvořit "prostorovou inteligenci" v AI, získal ~$100M v nejnovějším kole financování při ocenění přes $1B.

🇺🇸 Vectara, která nabízí vektorové databáze a RAG nástroje pro podniky, získala $25M v Series A financování.

🇺🇸 Exa získala $22M v seed a Series A financování. Kolo vedl Lightspeed Venture Partners s účastí NVentures, NVIDIA a Y Combinator. Vyvíjí AI vyhledávač.

🇧🇪 LegalFly získal $16.3M v Series A financování. Kolo vedl Notion Capital s účastí redalpine a Fortino Capital

🇸🇪 Leya oznámila $25M v Series A financování. Startup vyvíjí produkt pro automatizaci opakujících se a manuálních úkolů právníků.

🇬🇧 Bioniq získal $15M v Series B financování. Kolo vedli HV Capital a Unbound. Startup využívá AI k poskytování personalizovaných doplňků stravy na základě dat z krevních testů.

🇩🇪 SAIZ získal €2.5M v seed financování. Kolo vedli EnjoyVenture a Salica Investments. Tento startup využívá AI k poskytování doporučení velikostí pro online nakupující.

🇫🇷 Presti se sídlem v Paříži získal $3.5M v seed financování. Kolo vedl Partech. Startup využívá GenAI k vytváření produktových fotografií pro nábytkářský průmysl.

🇺🇸 Shaped oznámila financování ve výši $8M a spuštění svého nového self-serve cloudového produktu. Je to AI doporučovací a vyhledávací platforma pro tržiště, e-commerce a obsahové společnosti.

🇷🇴 .lumen získal €4M na vývoj AI poháněných brýlí pro nevidomé. Společnost plánuje uvedení produktu na trh do konce roku.

🆇 Výběr z X

Kdo jiný než Karpathy? V AI vzdělávání to zkouší řada hráčů. Accenture koupilo strádající Udacity. Poláci taky něco staví.

Připomnělo příběh o Kissingerovi, který se měl opakovaně svého podřízeného ptát: je to to nejlepší, co dokážeš? Technika zdá se funguje i s LLMs.

Trocha sarkasmu z tábora AI bezpečnosti aneb reflexe nedávné CrowdStrike příhody.

Je to spíš parita než-li významné vítězství – ale událost extrémně důležitá. Uvidíme, jak dlouho to Metě vydrží, sám Zuckerberg zpochybnil ekonomický smysl vydávání obřích modelů s otevřenými váhami.

🤖 a ⚙️

Připomnělo starší twít Navala Ravikanta o typech páky: práce (lidé), média, kód, kapitál. A zmínku Sama Altmana, že s ostatními tech CEOs se v rámci skupinového chatu dohadují o tom, kdy uvidí $1B firmu o 1 člověku.

Pro další novinky mrkněte na náš Twitter, LinkedIn či blog.

Miton AI Newsletter

Discussion about this post