AudioCraft od Mety a RT-2 od Googlu

A k tomu 30+ aktualit včetně spousty seed investic.

fdalecky

Aug 07, 2023

Po týdenní publikační pauze tu máme vydání #17:

Nové text to audio modely od Mety
Robotické transformery od Google DeepMind
Nové, již brzy dostupné funkce v ChatGPT
Čtení o transformerech a lidech, kteří položili základy dnešního AI boomu
Investice do AI v hrách, bezpečnosti, ale i vzdělávání a sportu

🏆 Zprávy týdne

AudioCraft od Mety: 3 nové modely v audiu

Meta releases open source AI audio tools, AudioCraft | Ars Technica

3 modely se jmenují MusicGen, AudioGen, EnCodec. MusicGen vytváří hudbu, AudioGen zvukové efekty a EnCodec komprimuje zvuky pro lepší kvalitu.
Modely jsou vydány jako open-source, odborníci a výzkumní pracovníci je tudíž mohou trénovat a experimentovat s nimi na základě svých dat a nehrozí spory o autorská práva (modely využívají veřejný materiál nebo materiál vlastněný Metou).
AudioCraft nyní každému umožňuje vytvořit libovolný typ hudby, melodie nebo zvukové stopy, či vytvořit jakýkoli zvukový efekt nebo šum. Ukázky kromě řady hudebních ústřižků zahrnují např. štěkot psa, či hvízdání ve větrném počasí.
Ačkoli je AudioCraft významným krokem vpřed, generovaná hudba stále působí trochu uměle. Meta v něm nicméně vidí potenciální nástroj pro hudebníky a zvukové designéry, který poskytuje inspiraci a umožňuje rychlý brainstorming a experimentování.

RT-2: nový VLM model od Google DeepMind

Robotický transformer 2 (RT-2) je nový vizuálně-jazykově-akční model (VLA), který se učí z webových i robotických dat a převádí tyto znalosti do zobecněných instrukcí pro řízení robotů.
RT-2 vykazuje lepší schopnosti zobecnění a sémantického a vizuálního porozumění nad rámec robotických dat, kterým byl vystaven. To zahrnuje interpretaci nových příkazů a reakce na příkazy uživatele prováděním základního uvažování, jako je uvažování o kategoriích objektů nebo popisech.
Využití chain of thought uvažování umožňuje RT-2 provádět vícestupňové sémantické uvažování, například rozhodování, který předmět lze použít jako improvizované kladivo (kámen) nebo který druh nápoje je nejlepší pro unaveného člověka (energetický nápoj).

⏩ Ve zkratce

Stability oznámilo SDXL 1.0, nejnovější a veřejnosti dostupnou verzi jejich text to image modelu, který firma hodnotí jako z těch otevřených jako nejlepší. Podobně jako u posledního Midjourney, i zde stačí pro výborné výsledky stručný prompt.
V tomto týdnu nás čeká řada novinek v rámci ChatGPT. Ukázky promptů na začátek konverzace, návrhy odpovědí pro její pokračování, ale taky klávesové zkratky či konec odhlašování po 2 týdnech.
Cohere spustilo Coral, znalostního asistenta pro velké firmy. V zásadě jde o “ChatGPT na vlastní firemní data”, o jejichž bezpečnost se firmy nemusí obávat.
DoorDash testuje DashAI, jenž má umožnit uživatelům hledání restaurací na základě dotazů v přirozeném jazyce. Na zavedení AI v rámci své aplikace pracuje i Uber, detaily nejsou známé.
Daniel Ek (Spotify) naznačil několik možností, jak firma může využít AI v produktu. Od personalizace ke generování reklam až po sumarizaci podcastů.
Wayfair představil Decorify. AI nástroj dokáže na základě nahrané fotky a výběru stylu udělat nový model a nabídnout konkrétní nábytek ke koupi.
YouTube testuje řešení na sumarizaci videí. Popis od tvůrce by zůstal klíčovou informací, shrnutí by ale umožnilo blížeji poznat obsah videa.
Amazon skrz AWS rozšiřuje svou nabídku zdravotnických služeb o platformu, která nabízí AI nástroje, které pomáhají lékařům přepisovat a analyzovat jejich rozhovory s pacienty.
Perplexity nově umožňuje nahrání souboru a následné dotazování na jeho obsah.
Doména AI.com, kterou pár měsíců zpátky koupilo OpenAI, nyní vede na X.ai.
Rewind, “vyhledávač pro život”, představil iPhone aplikaci.

💰Investice

Inworld Becomes Best-Funded AI Gaming Startup With $50 Million Round

Inworld AI získala $50M v rámci kola vedeného Lightspeed. Společnost nabízí nástroje pro tvorbu NPCs (non-playable characters) pro herní průmysl. Valuace firmy by měla být >$0.5B.
Britská AutogenAI, která využívá generativní umělou inteligenci k tomu, aby pomáhala firmám při psaní nabídek a výběrových řízení na veřejné a podnikové zakázky, získala $22,3M od Blossom Capital.
Protect AI, startup vytvářející nástroje pro posílení bezpečnosti AI systémů, získal $35M v rámci Series A vedeného Evolution Equity Partners za účasti Salesforce Ventures a dalších.
Stealth startup Stackless Data získal $14M v seed financování. Chce poskytovat užitečné poznatky bez nutnosti zaměstnávat datový tým.
Akooda získala $11M seed financování od NFX, Atlassian Ventures, a dalších. Startup pomáhá zákazníkům analyzovat jejich interní softwarový stack, aby lépe porozuměli vnitřnímu fungování svých organizací.
Cyclops získala seed financování ve výši $6,4M na spuštění AI vyhledávací platformy pro kybernetickou bezpečnost.
ScorePlay získala seed financování ve výši $5M, aby podpořila vyprávění příběhů sportovců a sportovních klubů s pomocí AI.
Quench.ai získala $5M v rámci pre-seed financování. Londýnská platforma pro AI koučování pomáhá uživatelům učit se novým dovednostem.
Effectiv získal $4,5M a zvýšil tak objem svého seed kola na $9M. Dva roky starý startup ze San Francisca vytváří AI řešení pro odhalování podvodů při platbách, ověřování zákazníků, a správu compliance.
ReflexAI získal $3,3M, vedoucím investorem byla společnost Footwork. Rok starý newyorský startup vyvíjí školicí AI software pro zaměstnance call center.
Britská thymia získala $2,7M v seed financování. Startup vytváří herní nástroje s umělou inteligencí pro hodnocení duševního zdraví.
Beyond Work získává $2,5M na vybudování platformy pro práci s AI, která má zjednodušit firemní procesy.
Švédská DBtune uzavřela seed kolo ve výši €2,4M vedené 42Cap. Jde o AI startup pro správu databází.
Berlínský proptech start-up dao získal €1,5M, aby dal AI do rukou správců nemovitostí.

📚 Co si přečíst a poslechnout

䷉McKinsey vydalo globální průzkum o generativní AI v 2023. Dočtete se mimo jiné, jaké jsou nejčastější use-casy (např. marketing a prodej), ale také obavy (nepřesnost a bezpečnost).

䷉Financial Times o Google výzkumnících, kteří stáli za transformery. Fascinující čtení popisující příběh lidí, kteří položili základy dnešní AI mánie. Obsahuje také pochopitelné vysvětlení technologie, která stojí za “T” v GPT.

🎧 Podcast Unsupervised Learning od Redpoint Ventures stojí za sledování. Zpovídají většinou praktiky a tvůrce nových řešení napříč AI trhem.

🐦 Výběr z Twitteru (X)

Proběhla srovnání s knihtiskem, ale i elektrickou energií. Že by problém s analogickým uvažováním?

YC partner říká: většina startupů chce dělat horizontální řešení pro vícero trhů, ale nakonec dají přednost určité vertikále, které postupně prodají další řešení. O vertikální AI jako pokračování vertikálního SaaS, psali nedávno v Index Ventures.

Proč tvořit generický deck, když můžete napsat memo? Mistral pro své velké seed kolo fundraisoval s tímto.

Naposledy k Oppenheimerovi a srovnávání s AI.

🤖 a 🚗

Kritizovaná reklama od Cruise v tištěném vydání NYT říká: lidé jsou špatní řidiči.

Pro další novinky sledujte náš Twitter, LinkedIn či blog.

Miton AI Newsletter

Discussion about this post