Preskočiť na obsah
2.3Pokročilý7 min

Chain-of-Thought pre agentov: Kedy pomáha a kedy nie?

Blck Alpaca·
Definition

Chain-of-Thought (CoT) je technika promptovania, pri ktorej veľký jazykový model explicitne slovami formuluje svoje medzikroky predtým, než odpovie. Namiesto priameho výstupu výsledku model zapisuje postup riešenia krok za krokom. To zvyšuje presnosť pri viacstupňovej logike, matematike a plánovaní – stojí to však ďalšie tokeny a latenciu.

Key Takeaways

  • Chain-of-Thought robí postupné reasoning LLM explicitným a viditeľným – to pomáha najmä pri viacstupňovej logike, matematike a plánovaní.
  • CoT je striktne ľavosmerné a nedokáže sa vrátiť späť: pri vyhľadávacích a backtracking problémoch (napr. Game of 24) čisté CoT zlyháva – tam si Tree-of-Thoughts so 74 % oproti 4 % CoT (podmienky GPT-4) vedie výrazne lepšie.
  • Čisté CoT halucinuje fakty, pretože mu chýba akékoľvek ukotvenie – ReAct kombinuje CoT s volaním nástrojov (Thought–Action–Observation) a dodáva tak overiteľné medzivýsledky.
  • Pri jednoduchých lookupoch, latenčne a nákladovo kritických aplikáciách je CoT často zbytočné a dokonca nevýhodné.
  • Moderné reasoning modely (séria o, Claude s Extended Thinking, Gemini-Thinking; stav 2026) internalizujú myšlienkový proces – explicitné CoT-promptovanie sa tým sčasti stáva nadbytočným.
  • Zero-shot CoT („Poďme premýšľať krok za krokom") nepotrebuje príklady; few-shot CoT poskytuje vzorové postupy riešenia a je pri doménových úlohách presnejšie.

Chain-of-Thought (CoT) je technika promptovania, pri ktorej veľký jazykový model explicitne slovami formuluje svoje medzikroky predtým, než odpovie. Namiesto priameho výstupu výsledku model zapisuje postup riešenia krok za krokom. To zvyšuje presnosť pri viacstupňovej logike, matematike a plánovaní – stojí to však ďalšie tokeny a latenciu. Pre agentov je CoT zároveň konceptuálnym jadrom, z ktorého sú odvodené takmer všetky moderné agentové architektúry.

  • Pomáha pri: viacstupňovej logike, matematike, plánovaní a všade tam, kde zrozumiteľná myšlienková cesta zlepšuje výsledok.
  • Nepomáha pri: jednoduchých lookupoch, single-step klasifikácii, ako aj pri latenčne a nákladovo kritických aplikáciách.
  • Sčasti nadbytočné pri: modeloch optimalizovaných na reasoning, ktoré postupné premýšľanie už vykonávajú interne.

Čo Chain-of-Thought technicky robí

CoT núti model rozložiť implicitný skok od otázky k odpovedi na viditeľnú reťaz medzizvažovaní. Praktická páka je malá, efekt často veľký: predradený spúšťač alebo vzorový postup riešenia posúva pravdepodobnostné rozdelenie modelu smerom k štruktúrovanej, postupnej generácii.

Chain-of-Thought (Wei et al., 2022) je historickým koreňom prakticky všetkých dnešných agentových vzorov. Z CoT vznikli ReAct, Tree-of-Thoughts, Plan-and-Solve/Plan-and-Execute a ReWOO – všetky buď stavajú na explicitnom reasoningu, prepracúvajú jeho štruktúru alebo ho vedome odmietajú. Kto rozumie CoT, rozumie tým spoločnému základu týchto architektúr.

Rozhodujúca vlastnosť – a zároveň centrálna slabina – čistého CoT: myšlienková cesta je striktne ľavosmerná. Model generuje jeden krok za druhým a nedokáže sa vrátiť späť alebo zrevidovať slepú uličku, do ktorej sa vydal. Pri úlohách, ktoré vyžadujú vyhľadávanie, lookahead alebo backtracking, preto CoT zlyháva. Práve tu nastupuje Tree-of-Thoughts, ktoré reasoning prehodnocuje ako vyhľadávanie po strome medzistavov.

Zero-shot vs. few-shot CoT

V praxi existujú dva varianty s rozdielnymi profilmi nákladov a prínosov.

  • Zero-shot CoT: úlohe sa len predradí spúšťač ako „Poďme premýšľať krok za krokom". Žiadne príklady, minimálna kontextová réžia. Z tejto myšlienky vzniklo Plan-and-Solve promptovanie (Wang et al., 2023) – dvojstupňový zero-shot prístup („Poďme najprv navrhnúť plán / Poďme plán vykonať"), ktorý prekonáva zero-shot CoT pri matematickom reasoningu a stal sa predlohou pre agentovú architektúru Plan-and-Execute.
  • Few-shot CoT: v prompte sú jeden až viac kompletných vzorových postupov riešenia. To ukotvuje nielen postupné premýšľanie, ale aj požadovaný formát a doménovo špecifické heuristiky. Few-shot CoT je pri špecializovaných alebo formátovo kritických úlohách spravidla presnejšie, stojí však citeľne viac kontextových tokenov na požiadavku.

Praktické pravidlo pre agentúry: zero-shot CoT ako nákladovo úsporný štandard, few-shot CoT len tam, kde dodatočná presnosť alebo vernosť formátu ospravedlňuje vyššiu spotrebu tokenov.

Vzťah k ReAct: reasoning potrebuje ukotvenie

Čisté CoT má pre agentov zásadný problém: halucinuje fakty, pretože mu chýba akékoľvek externé ukotvenie. Model síce „premýšľa" plauzibilne, ale nemá žiadny mechanizmus na overenie svojich predpokladov oproti realite.

ReAct (Yao et al., 2022) rieši práve toto tým, že rozširuje CoT o konanie. Namiesto toho, aby len premýšľal, ReAct prepletá reasoning kroky s volaním nástrojov:

```
Thought: Musím vyhľadať aktuálny obrat zákazníka.
Action: crm_lookup(zakaznik="Muster GmbH", pole="obrat_q1")
Observation: Obrat Q1 = 1.240.000 EUR
Thought: To je o 8 % nad minulým rokom. Teraz to porovnám s pipeline.
Action: ...
```

Reasoning kroky riadia nasadenie nástrojov; pozorovania z nástrojov korigujú reasoning. CoT teda zostáva jadrom – ReAct len pridáva ukotvenie, ktoré čistému CoT chýba. Pre väčšinu produkčných agentov (chatboty s prístupom k CRM a znalostnej databáze, triáž ticketov) je tento ukotvený variant správnym východiskom, nie čisté CoT.

Kedy CoT pomáha – a kedy nie

Typ úlohy

CoT zmysluplné?

Odôvodnenie

Viacstupňová logika / matematika

Áno

Explicitné medzikroky výrazne znižujú chyby výpočtu

Plánovanie / rozklad úloh

Áno

Postupné premýšľanie vynucuje globálnu štruktúru

Jednoduchý lookup / single-step

Nie

Žiadny zisk v presnosti, len viac tokenov a latencie

Klasifikácia / routing

Väčšinou nie

Priama odpoveď je rýchlejšia a lacnejšia

Vyhľadávacie/backtracking problémy

Len ako Tree-of-Thoughts

Ľavosmerné CoT sa nedokáže vrátiť späť

Reasoning modely (séria o, Extended Thinking; stav 2026)

Sčasti nadbytočné

Model už premýšľa interne krok za krokom

Audit/compliance kontext (DACH, EU AI Act)

Áno

Viditeľná myšlienková cesta ako zrozumiteľná trace

Najdôležitejší poznatok z poľných správ 2024–2026 znie: začať s najjednoduchším vzorom, ktorý funguje, a eskalovať až vtedy, keď to vynútia namerané chybovosti. Prenesené na CoT to znamená: nenafukovať reflexívne každý prompt inštrukciami „krok za krokom", ale len tam, kde to typ úlohy preukázateľne vyžaduje.

Príklad s CoT a bez neho: Game of 24

„Game of 24" (zo štyroch čísel pomocou základných počtových operácií vytvoriť 24) ukazuje hranicu čistého CoT obzvlášť názorne. Za podmienok GPT-4 dosahuje čisté CoT tu len 4 % úspešnosť, pretože sa model skoro zafixuje na jednu cestu a nedokáže sa vrátiť späť. Tree-of-Thoughts, ktoré generuje viacero kandidátov na krok, hodnotí ich a vetví sa, sa dostáva na 74 % (b=5, BFS cez tri myšlienkové kroky).

Podobne pri mini-crosswords (5×5): na úrovni hry rieši čisté CoT len 1 % úloh, Tree-of-Thoughts 20 %. Pri kreatívnom písaní so zadaniami je hodnotenie koherencie CoT okolo 6,2 z 10, Tree-of-Thoughts okolo 7,6.

Poučenie nie je „CoT je zlé", ale: CoT sa hodí na lineárne myšlienkové úlohy, nie na vyhľadávacie problémy. Pri viacstupňovej výpočtovej alebo plánovacej úlohe CoT výsledok citeľne zlepšuje; pri vyhľadávacom probléme s mnohými slepými uličkami je potrebná stromová štruktúra, pri čistom lookupe žiadny reasoning vôbec.

Poznámka: tieto čísla pochádzajú z pôvodných prác (prevažne éra GPT-3.5/GPT-4, 2022–2023). Moderné frontier modely tieto hodnoty nastavujú nanovo – rády veličín treba čítať ako relatívne indikátory efektu, nie ako dnešné absolútne hodnoty.

CoT a náklady: výpočet latencie/tokenov

Každý reasoning krok generuje ďalšie tokeny a – keďže je generácia sekvenčná – ďalšiu latenciu. Pri jednoduchom lookupe, ktorý by model dokázal zodpovedať priamo, je to čistá réžia. Pri vysokoobjemových aplikáciách (napr. triáž support ticketov) sa táto réžia rýchlo sčíta do citeľných nákladov.

Praktickou nákladovou pákou je model-tiering: silný, drahý model na náročnú reasoning/plánovaciu fázu, menší, lacný model na jednoduché vykonávacie kroky. Tento prístup – známy zo vzoru Plan-and-Execute – šetrí na viacstupňových workflow rádovo 40–70 % tokenov. Pre CoT to znamená: nakupovať reasoning cielene tam, kde naň záleží, a nerozdeľovať ho rovnomerne cez všetky kroky.

Dôležité pre voľbu modelu v roku 2026: modely optimalizované na reasoning (séria o, Claude s Extended Thinking, varianty Gemini-Thinking) vykonávajú postupný myšlienkový proces už interne. Explicitné CoT-promptovanie tam často prináša malý dodatočný úžitok a môže dokonca rušiť. Explicitné CoT zostáva relevantné predovšetkým pre menšie/lacnejšie modely, pre zrozumiteľné audit traily a v regulovaných DACH kontextoch, kde sa myšlienková cesta musí dokumentovať.

Pre agentúry a B2B: pragmatické rozhodnutie

Pre DACH marketingové agentúry a B2B tímy sa dá CoT zhustiť na jednoduchú heuristiku: CoT nie je štandardný príplatok, ale cielený nástroj. Nasaďte ho, keď úloha vyžaduje viacero myšlienkových krokov, počítanie alebo plánovanie – napríklad pri spracovaní reportov, plauzibilizácii ukazovateľov alebo rozklade zložitých zákazníckych požiadaviek. Vzdajte sa ho pri lookupoch, klasifikácii a všetkom, kde dominuje rýchlosť a jednotkové náklady. Voľte medzi zero-shot (lacné) a few-shot (presnejšie, drahšie) vedome podľa úlohy. A pri reasoning modeloch preverte, či explicitné CoT vôbec ešte niečo prináša, predtým než naň miniete tokeny. Kto tieto štyri rozhodnutia urobí čisto, získa presnejších agentov pri kontrolovaných nákladoch – namiesto toho, aby drahú, pomalú reasoning réžiu rozsypal cez celú pipeline.

Často kladené otázky

Čo je Chain-of-Thought (CoT)?
Chain-of-Thought je technika promptovania, pri ktorej LLM rozkladá svoj postup riešenia na jednotlivé, explicitne sformulované medzikroky namiesto priamej odpovede. Táto viditeľná reasoning cesta zlepšuje presnosť pri viacstupňových úlohách ako matematika, logika a plánovanie a robí rozhodnutie modelu zrozumiteľným.
Kedy by sa CoT pri agentoch NEMALO používať?
Pri jednoduchých lookupoch, klasifikáciách alebo single-step odpovediach neprináša CoT žiadny zisk v presnosti, ale zvyšuje počet tokenov a latenciu. V latenčne a nákladovo kritických aplikáciách (real-time chat, vysokoobjemová triáž) je často nevýhodné. Pri modeloch optimalizovaných na reasoning, ktoré interne už premýšľajú krok za krokom, je navyše explicitné CoT sčasti nadbytočné.
Aký je rozdiel medzi zero-shot a few-shot CoT?
Zero-shot CoT predraďuje úlohe spúšťač ako „Poďme premýšľať krok za krokom" bez príkladov. Few-shot CoT ukazuje modelu jeden až viac kompletných vzorových postupov riešenia v prompte; to je pri doménovo špecifických alebo formátovo kritických úlohách spravidla presnejšie, stojí to však viac kontextových tokenov.
Ako spolu súvisia CoT a ReAct?
ReAct rozširuje CoT o konanie: prepletá reasoning kroky (Thought) s volaním nástrojov (Action) a spätne načítava ich výsledky (Observation). Čisté CoT halucinuje fakty, pretože mu chýba akékoľvek externé ukotvenie; ReAct koriguje reasoning reálnymi pozorovaniami. CoT je tým konceptuálnym jadrom ReAct.
Oplatí sa CoT pri moderných reasoning modeloch v roku 2026 ešte?
Reasoning modely ako séria o, Claude s Extended Thinking alebo varianty Gemini-Thinking (stav 2026) vykonávajú postupný myšlienkový proces interne. Dodatočné explicitné CoT-promptovanie tam často prináša malý prínos a môže dokonca rušiť. Relevantné zostáva explicitné CoT pre menšie/lacnejšie modely, pre zrozumiteľné audit traily a v regulovaných kontextoch.

Ísť hlbšie?

Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.