Preskočiť na obsah
5.14Expert7 min

Code Execution s MCP: Tokenová efektívnosť pre komplexných agentov

Blck Alpaca·
Definition

Code Execution s MCP označuje agentový vzor, pri ktorom AI agent namiesto mnohých jednotlivých tool-callov píše a spúšťa kód, ktorý programovo volá MCP-nástroje v sandboxe. To výrazne znižuje spotrebu tokenov a latenciu, pretože medzivýsledky sa spracúvajú v kontexte kódu namiesto v kontextovom okne jazykového modelu.

Key Takeaways

  • Code Execution obracia logiku: agent generuje kód, ktorý volá MCP-nástroje, namiesto toho, aby každý nástroj prechádzal jednotlivo cez LLM-kontext - definície nástrojov a medzivýsledky už nekončia v plnom rozsahu v kontextovom okne.
  • Pákou je tokenová efektívnosť: pri mnohých dostupných nástrojoch a dlhých medzivýsledkoch spotreba tokenov výrazne klesá, pretože filtrovanie, slučky a agregácia prebiehajú v kóde namiesto v modeli.
  • Vzor sa oplatí pri komplexných, viacstupňových workflow s mnohými nástrojmi a veľkými objemami dát - nie pri jednoduchých jednokrokových úlohách, kde priame tool-cally zostávajú rýchlejšie a transparentnejšie.
  • Bezpečnosť nie je voliteľná: spustiteľný kód generovaný modelom potrebuje izolovaný sandbox, scope-limitované OAuth 2.1 tokeny a least-privilege - MCP sleduje zámerne optimistický trust-model, ktorý ponecháva hardening na prevádzkovateľa.
  • MCP je k roku 2026 de facto štandardom pre komunikáciu agent-to-tool (zaviedol ho Anthropic v roku 2024, od 9. 12. 2025 pod Agentic AI Foundation organizácie Linux Foundation); technickým základom je JSON-RPC 2.0 cez stdio resp. Streamable HTTP.
  • Pre DACH agentúry je Code Execution pákou na ekonomicky prevádzkovanie agentických produktov: menej tokenov na beh znamená lepšiu unit economics pri multi-tenant službách.

Code Execution s MCP označuje agentový vzor, pri ktorom AI agent namiesto mnohých jednotlivých tool-callov píše a spúšťa kód, ktorý programovo volá MCP-nástroje v sandboxe. To citeľne znižuje spotrebu tokenov a latenciu, pretože definície nástrojov a medzivýsledky sa spracúvajú v kontexte kódu namiesto toho, aby v plnom rozsahu prešli cez kontextové okno jazykového modelu. Ide o optimalizáciu pre komplexné, dátovo náročné workflow - nie o nahradenie klasických tool-callov.

Rýchle odpovede

  • Čo to je: agent generuje program, ktorý volá MCP-nástroje ako funkcie; do modelu sa vracia iba zhustený konečný výsledok.
  • Na čo je dobrý: tokenová a latenčná efektívnosť pri mnohých nástrojoch, mnohých krokoch a veľkých medzivýsledkoch.
  • Čo potrebuje: izolovaný sandbox, scope-limitované tokeny a least-privilege - spustiteľný kód modelu je samostatná útočná plocha.

Problém: tool-cally sa zle škálujú

Model Context Protocol (MCP) zaviedol Anthropic 25. novembra 2024 ako otvorený štandard na prepojenie AI aplikácií s externými systémami - súborové systémy, databázy, podnikové aplikácie, vývojárske nástroje. Technicky MCP stavia na JSON-RPC 2.0 cez viacero transportov: stdio pre lokálne servery, od revízie špecifikácie v apríli 2025 navyše Streamable HTTP, k tomu OAuth 2.1, JSON-RPC batching a anotácie nástrojov. K roku 2026 je MCP de facto štandardom pre komunikáciu agent-to-tool; 9. decembra 2025 Anthropic protokol daroval novozaloženej Agentic AI Foundation (AAIF) pod záštitou Linux Foundation. SDK zaznamenávajú vyše 97 miliónov mesačných stiahnutí v Pythone a TypeScripte.

V klasickom vzore agent volá každý nástroj jednotlivo. Každé volanie prechádza cez jazykový model: model vidí definíciu nástroja, sformuluje volanie, dostane späť do svojho kontextového okna úplný výsledok a rozhodne o ďalšom kroku. Pri jednoduchých úlohách je to ideálne - transparentné a dobre auditovateľné. Pri komplexných workflow však vznikajú dva žrúti tokenov:

  1. Definície nástrojov v predstihu. Ak má agent k dispozícii desiatky alebo stovky MCP-nástrojov, ich popisy musia byť vopred načítané do kontextu - často tisíce tokenov ešte predtým, než agent vôbec začne pracovať.
  2. Medzivýsledky v kontexte. Nástroj, ktorý vráti dlhý zoznam, veľký dokument alebo rozsiahlu API-odpoveď, ho zapisuje v plnom rozsahu do kontextového okna - aj keď agent potrebuje len tri hodnoty z neho. Pri viacstupňových reťazcoch sa to sčítava.

Riešenie: agent píše kód

Vzor Code Execution - publikovaný Anthropic na konci roka 2025 ako inžiniersky prístup - obracia logiku. Agent generuje program, typicky v Pythone alebo TypeScripte, ktorý zaobchádza s MCP-nástrojmi ako s importovateľnými funkciami. Tento kód beží v sandboxe. Filtrovanie, slučky, vetvenia a agregácie prebiehajú tam, v runtime kontexte kódu. Do kontextového okna modelu sa vracia iba zhustený konečný výsledok.

Rozdiel možno ukázať na pseudokóde.

Klasicky - mnoho tool-callov cez model:

```
LLM: zavolaj get_contacts()
-> 5 000 kontaktov (v plnom rozsahu do kontextu)
LLM: pre každý kontakt zavolaj get_last_order(id)
-> 5 000 ďalších tool-callov, každý jednotlivo cez model
LLM: filtruj tie s obratom > 10 000
-> opäť veľké objemy dát v kontexte
```

Code Execution - jeden generovaný program:

```

agentom generovaný kód spustený v sandboxe

kontakty = mcp.crm.get_contacts()
top = [k for k in kontakty
if mcp.crm.get_last_order(k.id).obrat > 10000]
return [{"name": k.name, "obrat": k.obrat} for k in top]
```

V druhom prípade model nevidí ani 5 000 kontaktov, ani 5 000 order-odpovedí. Vidí iba kód, ktorý napísal, a na konci filtrovaný zoznam. Samotné volania nástrojov prebiehajú programovo, nie ako jednotlivé LLM-kolá. To šetrí tokeny aj latenciu, pretože slučky sa vykonávajú bez roundtripov cez model.

Druhým efektom je objavovanie nástrojov podľa potreby: namiesto načítania všetkých definícií nástrojov vopred môže agent prehľadávať dostupné MCP-servery a ich funkcie ako adresár modulov a importovať iba tie skutočne potrebné. Tým zostáva réžia predstihu malá, aj keby bolo teoreticky k dispozícii stovky nástrojov.

Príklad s číslami

Zjednodušený výpočet objasňuje páku. Predpoklad: agent má z CRM zistiť top zákazníkov a obohatiť ich o objednávkové dáta. Čísla sú ilustračné a slúžia na rád veličiny, nie ako benchmark.

Položka

Klasické tool-cally

Code Execution

Definície nástrojov v predstihu

cca 8 000 tokenov (všetky nástroje načítané)

cca 1 500 tokenov (len potrebné)

Medzivýsledky v kontexte

cca 40 000 tokenov (5 000 záznamov surovo)

cca 0 tokenov (filtrované v kóde)

Generovaný kód / finálna odpoveď

cca 2 500 tokenov

LLM-roundtripy

1 na tool-call (mnoho)

málo (generovanie kódu + výsledok)

Súčet tokenov (hrubý rád veličiny)

cca 48 000

cca 4 000

Rozhodujúcou položkou nie je predstih, ale medzivýsledky: spracúvajú sa v kóde a nezaberajú žiadny kontext modelu. Práve tu leží páka. Čím väčšie objemy dát a čím viac iterácií, tým výraznejší je rozdiel. Pri jednoduchom jednotlivom dopyte sa naopak výpočet obracia - réžia generovania a spúšťania programu prevyšuje úžitok.

Kedy má zmysel - a kedy nie

Kritérium

Code Execution má zmysel

Priame tool-cally sú lepšie

Počet nástrojov

Mnoho (desiatky+)

Málo

Kroky workflow

Viacstupňové, so slučkami/vetveniami

Jeden až dva kroky

Medzivýsledky

Veľké (zoznamy, dokumenty, API-dumpy)

Malé

Determinizmus

Opakujúca sa, programovateľná logika

Exploratívne, ad hoc

Sledovateľnosť

Potrebný code-trace + sandbox-logy

Stačí tool-call-trace

Code Execution je optimalizácia, nie štandardný vzor na všetko. Hodí sa k dátovo náročným, opakujúcim sa multi-tool workflow. Pre jednoduché, jednorazové akcie zostávajú priame tool-cally rýchlejšie, lacnejšie a transparentnejšie - trace ukazuje každý krok priamo, bez obchádzky cez generovaný kód.

Bezpečnosť: sandbox je povinnosť

Najväčší rozdiel oproti klasickým tool-callom je bezpečnostne relevantný: pri vzore Code Execution systém spúšťa spustiteľný kód generovaný jazykovým modelom. Je to samostatná útočná plocha. Pre MCP je k roku 2026 zdokumentovaný zámerne optimistický trust-model, ktorý stotožňuje syntaktickú správnosť so sémantickou bezpečnosťou - k tomu konkrétne triedy útokov: nepriama prompt-injection cez popisy serverov, Tool Poisoning (Invariant Labs PoC, marec 2025), look-alike server squatting a Full-Schema-Poisoning od CyberArk, pri ktorom môže byť každá časť schémy nástroja injekčným vektorom. Hardening je pritom výslovne úlohou prevádzkovateľa.

Pre Code Execution to konkrétne znamená:

  • Izolovaný sandbox. Generovaný kód beží v odizolovanom runtime prostredí bez širokého súborového a sieťového prístupu, s limitmi zdrojov a času proti nekonečným slučkám a vyčerpaniu zdrojov.
  • Scope-limitované tokeny. MCP-servery za OAuth 2.1 (od špecifikácie z apríla 2025) s minimálne potrebnými oprávneniami - kód dostane prístup len k tomu, čo úloha vyžaduje.
  • Least-privilege a žiadna autonómna inštalácia. Agenti nesmú samostatne doťahovať alebo inštalovať MCP-servery z nedôveryhodných registrov.
  • Úplné audit-logovanie. Každé volanie nástroja zo sandbox-kódu sa protokoluje. V DACH kontextoch je to zároveň compliance požiadavka, nielen inžinierska prax - end-to-end trace, pripnuté verzie modelov, korelácia cez trace ID.

Kto prevádzkuje spustiteľný kód modelu bez týchto ochranných vrstiev, vymieňa tokenovú efektívnosť za výrazné bezpečnostné a dátové riziko - v regulovaných DACH odvetviach je to no-go.

Pre agentúry a B2B rozhodovateľov

Pre DACH agentúry a produktizujúcich AI vendorov je Code Execution s MCP priamou pákou na unit economics agentických produktov. Kto prevádzkuje multi-tenant služby - napríklad SEO, newsletterové alebo rešeršné agenty -, platí za beh v tokenoch; vzor Code Execution tieto náklady pri dátovo náročných workflow merateľne znižuje a zároveň znižuje latenciu, čo zlepšuje vnímanú kvalitu produktu. Praktický vstup: existujúce MCP-založené agenty preveriť na to, ktoré workflow prechádzajú mnohými nástrojmi a veľkými medzivýsledkami, práve tie prestaviť na Code Execution - a od prvého dňa zabudovať sandbox, OAuth 2.1 scopes a audit-logovanie. Pre B2B rozhodovateľov platí: vzor je architektonickým rozhodnutím pre každý workflow, nie zmenou platformy. Stavia na aj tak etablovanom štandarde MCP a dá sa zavádzať postupne, bez zahodenia existujúcej integrácie nástrojov.

Často kladené otázky

Čo presne je Code Execution s MCP?
Vzor, pri ktorom AI agent neposiela každé volanie MCP-nástroja jednotlivo cez svoje kontextové okno, ale píše program, ktorý volá MCP-nástroje ako funkcie. Tento kód beží v izolovanom sandboxe; do kontextového okna sa vracia iba zhustený konečný výsledok. Tým pri komplexných workflow výrazne klesá spotreba tokenov a latencia.
Kedy sa oplatí kód namiesto jednotlivých tool-callov?
Keď workflow zahŕňa mnohé nástroje, mnoho krokov alebo veľké medzivýsledky - napríklad filtrovanie dát naprieč viacerými zdrojmi, slučky cez datasety alebo agregácie. Pri jednoduchých jednokrokových úlohách s malým výstupom je priamy tool-call rýchlejší, lacnejší a lepšie sledovateľný. Pravidlo: čím väčší objem dát a čím viac medzikrokov, tým výraznejšie sa Code Execution vypláca.
Prečo Code Execution šetrí tokeny?
Dva efekty. Po prvé, do kontextu nemusia byť vopred načítané všetky definície nástrojov - agent môže nástroje objavovať a importovať podľa potreby. Po druhé, medzivýsledky sa spracúvajú, filtrujú a agregujú v kóde, namiesto toho, aby v plnom rozsahu prešli cez model. Tokeny zaberá iba zhustený výsledok. Pri dlhých zoznamoch výsledkov je to najväčšia páka.
Aké bezpečnostné riziká prináša spúšťanie agentového kódu?
Agent generuje spustiteľný kód - to je samostatná útočná plocha. Potrebné sú izolovaný sandbox bez širokého sieťového a súborového prístupu, scope-limitované OAuth 2.1 tokeny, least-privilege a limity zdrojov. Pre MCP je k roku 2026 zdokumentovaný optimistický trust-model, ako aj riziká ako Tool Poisoning a Full-Schema-Poisoning; hardening je zodpovednosťou prevádzkovateľa.
Nahrádza Code Execution bežné MCP tool-cally?
Nie. Oba koexistujú. Priame tool-cally zostávajú štandardným vzorom pre jednoduché, jednotlivé akcie a pre maximálnu transparentnosť v trace. Code Execution je optimalizácia pre komplexné, dátovo náročné multi-tool workflow. Dobrá architektúra rozhoduje pre každú úlohu, ktorý vzor sa uplatní.
Je Code Execution pripravený na produkciu pre DACH B2B projekty?
Vzor stavia na MCP, ktoré je k roku 2026 etablovaným štandardom agent-to-tool pod Linux Foundation. Pripraveným na produkciu sa stáva vďaka disciplíne sandboxu, identity a observability okolo neho. Pre regulované DACH workflow platia navyše požiadavky na audit-trail, GDPR a dátovú suverenitu, ktoré musia byť splnené nezávisle od vzoru spúšťania.

Ísť hlbšie?

Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.