AI agenti, 1. díl

Historie a teorie nové generace softwaru

May 27, 2025

V úvodním článku k AI agentům se podíváme na to, odkud se jejich koncept vzal, jak se vyvíjel a jaké teoretické principy stojí za jejich fungováním. Nejde o výčet nástrojů ani návod (to až příště), ale o oporu pro porozumění fenoménu, který už teď na člověka vyskakuje i z ledničky, a to je teprve začátek.

Jak se zrodil pojem agent

Představa inteligentního agenta, který samostatně vnímá svět, plánuje a jedná, není nová. Její kořeny sahají až k Alanu Turingovi a jeho vizím strojového myšlení. Během následujících dekád vznikaly různé formy agentů, od expertních systémů s pevně danými pravidly přes skriptované automatizace až po dnešní agentní systémy založené na velkých jazykových modelech. Následující časová osa ve zkratce ukazuje vývoj agentů.

Jak je vidět, vývoj AI agentů nebyl lineární, ale tvořily ho klíčové průlomy v různých oblastech. Dnešní agenti se opírají o desítky let vývoje, ale teprve díky kombinaci jazykových modelů, paměti a nástrojového volání dosahují úrovně, která se blíží původní Turingově představě. Právě proto je dobré chápat dnešní agenty nejen jako produkt současného hypu, ale jako výsledek dlouhodobého vývoje směřujícího k systémům, které se dokážou rozhodovat, učit a jednat.

Co definuje AI agenta

Na rozdíl od klasického jazykového modelu, který pasivně generuje odpovědi na dotazy, AI agent:

Vnímá kontext (text, data, prostředí)
Uchovává paměť (pracuje s historií, má uložiště)
Plánuje postup jak dosáhnout cíle
Volá akce (API, funkce, nebo i fyzické rozhraní)
Vyhodnocuje výsledky a přizpůsobuje chování

Agent je tedy struktura schopná rozhodování a jednání na základě částečných výsledků. Nejčastěji se popisuje v podobě cyklu:

Pozoruj (vstup z prostředí)
Plánuj (rozlož cíl na kroky)
Jednej (vykonej krok)
Vyhodnoť (co se stalo)
Pamatuj si (ulož zkušenost)

5 klíčových technik AI agentů

Moderní AI agenti využívají kombinaci několika technik, aby dokázali efektivně řešit úkoly a přizpůsobit se různým situacím. Následující pětice není úplný výčet, ale spíš rychlý přehled těch nejdůležitějších pojmů, se kterými se do budoucna budeme setkávat.

1. Rozhodovací cyklus OODA (Observe–Orient–Decide–Act)

Observe (Pozoruj): Agent získává vstupy z okolí – např. dotaz uživatele, data ze systému nebo výsledek předchozí akce.
Orient (Zorientuj se): Zpracuje informace v kontextu – pochopí situaci, vyhodnotí prostředí, aktualizuje svůj stav.
Decide (Rozhodni se): Rozhodne, co má udělat, často na základě předchozího plánování, pravidel nebo cílového stavu.
Act (Jednej): Provede konkrétní akci – odpoví, zavolá nástroj, změní něco v systému.
Tento cyklus se opakuje, agent neustále vnímá nové podněty, aktualizuje svůj pohled na situaci, přehodnocuje další kroky a jedná.
Příklad:
- Asistent pro plánování schůzek si nejprve vyžádá kalendáře účastníků (Observe).
- Zorientuje se v časových možnostech (Orient).
- Vybere nejvhodnější termín (Decide) a rozešle pozvánky (Act).
- Pokud někdo termín odmítne, agent cyklus zopakuje s novými daty.

2. Techniky uvažování (Chain of Thought, Tree of Thought)

Chain of Thought: Agent místo okamžité jednorázové odpovědi generuje postupný tok myšlenek. Složitý problém tak řeší krok za krokem podobně jako člověk.

Příklad: Při plnění dotazu „Chci něco sladkého, upečeného do 45 minut, mám 3 banány a základní pečící suroviny“ agent postupuje v řetězci kroků.

Kontext (Ingredience, Časový limit podle promptu)
Kandidáti (Banánová bábovka, Muffin, Sušenka)
Výběr na základě kritérií
Kontrola poměrů (Máme dost všeho?)
Postup (Předehřeju troubu na 190 °C, Suché suroviny zvlášť, Naplním formu…)
Výsledkem jsou upečené muffiny

Chain-of-thought tedy nutí model rozkládat problém na srozumitelné menší kroky, takže uživatel i vývojář vidí, kde se mohly objevit chyby. Tato transparentnost zároveň zlepšuje přesnost, protože model průběžně kontroluje vlastní logiku místo jednorázového hádání výsledku.

Tree of Thought: Agent rozvětvuje svůj myšlenkový proces do více paralelních cest. Zkouší několik alternativních postupů řešení současně, porovnává jejich výsledky a následně vybere nejperspektivnější větev.

Příklad: Agent má navrhnout strategii, jak zvýšit návštěvnost webu.

Začne třemi nápady: 1) SEO, 2) placená reklama, 3) obsah na sociálních sítích, kdy si pro každý směr vymyslí několik konkrétních kroků a u každého průběžně vyhodnocuje, jak efektivně směřuje k cíli. Pokud zjistí, že SEO sice zní slibně, ale málo přispívá ke krátkodobému růstu, tuto větev ukončí. Naopak reklamu a obsah rozvíjí dál a hledá jejich kombinaci. Tímto způsobem se rozhoduje ne jen podle vstupních parametrů, ale na základě průběžného prozkoumávání prostoru možností.

Tree Of Thoughts Prompting For Better Generative AI Results

3. Použití nástrojů (tool calling, API)

Volání externích nástrojů: Agent může využít služby (web-search, databáze, kalkulačku) pro data či akce, které jeho interní model neumí.

Rozšíření schopností: Tímto způsobem překonává omezení tréninkových dat a svých znalostí. Dokáže získat aktuální data (např. vyhledat nejnovější zprávy či ceny akcií), provést přesné výpočty nebo vykonat akce ve vnějším světě (třeba odeslat e-mail).

Nový standard: Open-source protokoly A2A či MCP dnes navíc umožňují škálování a lepší výstupy agentů. Tyto protokoly byly vyvinuty proto, aby umožnily komunikaci mezi více agenty bez komplikací. Výsledkem je rychlý přerod starých maker v adaptivní digitální kolegy, kteří za přítomnosti lidského dohledu a jasných mantinelů dokážou automatizovat úkoly od třídění fotek až po řízení firemních procesů.

Příklad: Na otázku „Jaké je dnes počasí v Praze?“ agent zavolá meteorologické API, získá aktuální předpověď a tu následně srozumitelně předá uživateli. Podobně může při finanční analýze použít kalkulačku či při zákaznické podpoře nahlédnout do firemní databáze.

4. Integrované rozhodování (ReAct)

ReAct = Reason + Act: Tento přístup propojuje uvažování a akce do jednoho integrovaného procesu. Agent v rámci jednoho toku střídavě přemýšlí (Chain of Thought) a jedná (provádí akce).

Dynamické řešení problémů: Díky integraci rozhodování agent nečeká s akcemi až na konec uvažování a už během přemýšlení si může obstarat potřebná data nebo ověřit své hypotézy pomocí nástrojů. To zvyšuje šanci vyřešit i složitý úkol efektivně a správně na první pokus.

Příklad: Na dotaz „najdi hlavní město Francie a počet obyvatel“ agent jedná v následující sekvenci:

Thought: Nejprve musím zjistit hlavní město Francie, pak jeho populaci.
Action: Vyhledá ("hlavní město Francie")
Observation: Paříž
Thought: Znám hlavní město, teď potřebuji jeho populaci.
Action: Search ("populace Paříže")
Observation: Populace ≈ 2.1 mil.
Thought: Mám obě informace, mohu odpovědět.
Action: Konečný výsledek ("Hlavním městem Francie je Paříž a její populace je přibližně 2,1 milionu obyvatel.")

5. Paměť (krátkodobá vs. dlouhodobá)

Krátkodobá paměť: Dočasný kontext, který má agent k dispozici právě teď. Zahrnuje například poslední zprávy v konverzaci nebo aktuální stav úkolu. U LLMs je omezená délkou kontextového okna (řádově nízké jednotky milónů slov), takže agent řekněme zapomíná informace, které se nevejdou do aktuálního kontextu.

Dlouhodobá paměť: Trvalejší znalosti, které si agent uchovává a může je využít i s odstupem času. Může jít o data z minulých interakcí (historie konverzace, preference uživatele) nebo o informace uložené ve znalostní databázi, ke které má agent přístup. Často se řeší uložením údajů do externího úložiště (mimo samotný model), odkud si je agent podle potřeby opět načte.

Příklad: Chatbot zákaznické podpory má krátkodobě v paměti pouze aktuální dotaz klienta a několik předchozích vět z právě probíhajícího rozhovoru. Díky dlouhodobé paměti si však „vzpomene“ i na předchozí komunikace a ví například, s jakým problémem volal tentýž zákazník minulý měsíc, a může na tuto znalost navázat při řešení aktuálního dotazu.

AI Agents vs Agentic AI

Ne každý agent je zároveň agentický. V nedávné studii AI Agents vs Agentic AI autoři rozlišují mezi běžnými AI agenty a systémy, které skutečně vykazují hlubší formu autonomie.

Zatímco klasický AI agent:

reaguje na podněty,
a plní zadané úkoly podle instrukcí,

agentická AI jde dál:

plánuje napříč různými úkoly a v čase,
formuluje si vlastní cíle,
pamatuje si napříč interakcemi a dokáže měnit své chování na základě výsledků (učení).

Čtyři klíčové schopnosti agentické AI:

Schopnost dlouhodobého plánování (napříč úkoly, nikoliv jen v rámci jedné konverzace nebo zadání)
Vlastní formulaci cílů (agent nepřebírá jen instrukce, ale aktivně je interpretuje nebo dokonce generuje)
Persistentní paměť (uložení a využívání zkušeností napříč kontexty a časy)
Samostatné učení a evoluce strategií (adaptivní změna chování)

Proč na tom záleží?

Mnoho dnešních AI agentů splňuje maximálně první dva body. Skutečně agentické systémy jsou teprve ve vývoji a budou vyžadovat čas a nové přístupy k návrhu, hodnocení i k důvěře k nim.

Toto rozlišení není jen akademické. V praxi potřebujeme vědět, co náš agent umí dnes, a co ještě ne. Máme očekávat, že se sám zlepší? Nebo bude dělat pořád dokola ty samé chyby? Můžeme mu svěřit víc než jeden úkol?

Závěrem

AI agenti nejsou jen chytrý chatbot. Jsou to systémy, které:

samostatně plánují,
rozhodují na základě proměnlivých vstupů,
pamatují si a učí se.

Jejich vývoj trval desítky let. Od teoretických modelů přes skriptované automatizace až po dnešní kombinaci s LLMs, pamětí a nástroji. A právě dnes máme poprvé technologie, které z agentů dělají prakticky využitelné pomocníky. Agenti tedy nejsou jen další funkcionalitou chatbotů. Jsou příkladem entit, které jednají se záměrem, mají adaptivní logiku a umějí se i samostatně rozhodovat.

V jakém stádiu jsme dnes?

Většina dnešních agentů je reaktivní a úkolově orientovaná, umí si rozdělit zadání na kroky, volat nástroje a rozhodovat se v rámci jedné relace. Díky technikám jako ReAct nebo Tree of Thought zvládnou překvapivě složité úkoly, ale:

často postrádají dlouhodobou paměť a schopnost spolehlivě navazovat na dřívější zkušenosti,
neumí formulovat vlastní cíle ani přehodnocovat strategii podle měnícího se prostředí a jejich učení je zatím spíše offline (formou updatů modelu), nikoliv průběžné v čase.

Dnes stojíme na prahu zlomového okamžiku, kdy výkonné nástrojové systémy, které jsme léta vnímali spíš jako chytrá makra, se díky LLMs, paměti a otevřeným protokolům (A2A, MCP) mění v první skutečně autonomní entity. Právě tato tenká, rychle se posouvající hranice mezi nástrojem a autonomií dělá z AI agentů jedno z nejdůležitějších a nejnapínavějších témat současné umělé inteligence a určuje, kam se bude celá disciplína dál vyvíjet.

Takové systémy tak představují novou výzvu nejen pro vývojáře, ale i pro firmy, které je nasazují. Budeme jim důvěřovat? Rozumíme tomu, co dělají? A umíme je navrhovat tak, aby byly opravdu spolehlivé?

Co bude dál?

V dalším díle si ukážeme, jak si můžete jednoduše vytvořit vlastního AI agenta bez programování pomocí no-code nástrojů a vizuálních rozhraní. Podíváme se na to, co je potřeba, jak agenta nastavit a jaké komponenty vám umožní vytvořit plnohodnotný systém i bez jediného řádku kódu.

Další reference:

Miton AI Newsletter

Discussion about this post