AGI a agenti: Čo je relevantné pre praktikov (a čo je hype)
AGI (Artificial General Intelligence) označuje hypotetickú AI s ľudskej úrovni podobnou, naprieč doménami fungujúcou všeobecnou inteligenciou. Pre praktikov v oblasti agentov nie je AGI v roku 2026 plánovacou veličinou: relevantné sú merateľné, inkrementálne skoky v schopnostiach dnešných modelov (dlhšia autonómia, lepší reasoning), nie samotný prísľub AGI. Ten zostáva špekuláciou.
Key Takeaways
- ✓AGI nie je pre prax s agentmi v roku 2026 operatívnou kategóriou. Čo sa počíta, sú preukázateľné pásma schopností (capability bands) dnešných modelov, nie prahová hodnota s názvom AGI.
- ✓Inkrementálne skoky sú reálne a plánovateľné: BFCL Multi-Turn z ~65 % smerom k ~75 %, OSWorld z ~40 % smerom k 50-70 %, dlhšie použiteľné kontextové okná, hlasoví agenti pod 0,10 USD/minútu (prognóza 2027).
- ✓Prísľuby AGI zostávajú špekuláciou: humanoidná robotika, near-PhD reasoning a niekoľkotýždňové autonómne grafy úloh nesú podľa zdroja 30-50 % chybové pásma na časovanie.
- ✓Tvrdé kontroly reality brzdia každý hype: miery halucinácií 22-94 %, aj najlepšie modely sú v približne 20 % prípadov nepresné, prienik AI agentov je jednociferný, namerané prírastky produktivity 14-26 %.
- ✓Anti-hype disciplína poráža stávku: architektúru navrhovať na zameniteľnosť, human-in-the-loop pri akciách s veľkými dôsledkami, eval-sety namiesto čísel z demo prezentácií dodávateľov.
AGI (Artificial General Intelligence) označuje hypotetickú AI s ľudskej úrovni podobnou, naprieč doménami fungujúcou všeobecnou inteligenciou. Pre praktikov v oblasti agentov nie je AGI v roku 2026 plánovacou veličinou: relevantné sú merateľné, inkrementálne skoky v schopnostiach dnešných modelov (dlhšia autonómia, lepší reasoning), nie samotný prísľub AGI. Ten zostáva špekuláciou. Tento článok vecne oddeľuje to, čo sa pre prax s agentmi konkrétne mení, od toho, čo je hype.
- Operatívne irelevantné: AGI nie je prahová hodnota, podľa ktorej by sa dali zosúladiť roadmapy. Neexistuje žiadna spoľahlivá definícia ani seriózny dátum.
- Operatívne relevantné: preukázateľné pásma schopností dnešných modelov a ich inkrementálna cesta (viac autonómie na úlohu, lepší viacstupňový reasoning).
- Brzda pre každý hype: miery halucinácií 22-94 %, namerané prírastky produktivity 14-26 % a naďalej jednociferný prienik agentov.
Prečo AGI debata pre praktikov takmer nič nemení
AGI debata sa vedie na nesprávnej úrovni abstrakcie, keď ide o konkrétne projekty s agentmi. Či a kedy vznikne naprieč doménami fungujúca všeobecná inteligencia, je otázka pre výskumné laboratóriá a rizikový kapitál, nie pre DACH B2B tím, ktorý uvádza zákaznícky agentský systém do produkcie. Pre túto prácu sa počíta iná otázka: čo dokáže nasadený model dnes merateľne zvládnuť a ako sa táto schopnosť posunie v nasledujúcich dvanástich až dvadsiatich štyroch mesiacoch?
Záväzný odvetvový výskum to formuluje jasne: otázka schopností v roku 2026 už neznie „dokáže to model", ale „dokáže to organizácia absorbovať". Tým sa úzke hrdlo presúva zo schopnosti modelu na adopciu, na redizajn workflow a na governance. AGI špekulácia neadresuje žiadne z týchto reálnych úzkych hrdiel.
Pre zaradenie generácie modelov (stav máj 2026): na špici stoja Claude Opus 4.7, GPT-5.5 a Gemini 3.1 Pro; pracovné kone, ktoré absorbujú väčšinu agentských volaní, sú Sonnet 4.6, GPT-5.4 a Gemini 3 Flash. Tieto modely sú pre veľkú väčšinu use case znalostnej práce preukázateľne dostatočné, bez toho aby na to bolo potrebné alebo tvrdené „AGI".
Inkrementálny skok v schopnostiach namiesto AGI skoku
Rozhodujúca mentálna zmena: pokrok prichádza v rokoch 2026-2028 ako séria inkrementálnych, jednotlivo merateľných skokov, nie ako diskrétny AGI moment. Tieto skoky sú reálne, sú plánovateľné a menia to, čo agent prakticky dokáže. Najdôležitejšie preukázateľné benchmarkové pásma (stav máj 2026):
- SWE-Bench Multilingual: približne 75 % (na konfigurácii Sonnet plus advisor)
- MMLU: nad 87 %
- GPQA Diamond: približne 75 %
- BFCL Multi-Turn (viacstupňové použitie nástrojov): približne 65 %
- OSWorld (computer-use): približne 40 % — pre väčšinu enterprise workflow ešte nie produkčne pripravené
Čo z toho pre prax konkrétne vyplýva: dlhšia autonómia na úlohu a lepší reasoning naprieč viacerými krokmi. Práve tu leží praxi relevantná páka, nie v hypotetickej všeobecnej inteligencii.
Čo sa prakticky mení vs. čo zostáva špekuláciou
Nasledujúca tabuľka oddeľuje typické tvrdenia z verejnej AGI diskusie od toho, čo výskum označuje za realistické, a zaraďuje relevanciu pre prax tímov s agentmi. Všetky čísla stav máj 2026; prognózy s výslovným chybovým pásmom.
Tvrdenie | Realistické? | Relevancia pre prax s agentmi |
|---|---|---|
„AGI príde do roku 2028 a nahradí znalostnú prácu" | Nie. V zdroji žiadny prísľub AGI; len „priblíženie k úrovni near-PhD" na benchmarkoch, s 30-50 % chybovým pásmom na časovanie | Nízka. Žiadna plánovacia veličina. Nezahŕňať do roadmáp |
„Viacstupňoví agenti budú výrazne spoľahlivejší" | Áno, inkrementálne. BFCL Multi-Turn z ~65 % smerom k ~75 % (prognóza Q4 2026-Q1 2027) | Vysoká. Viac komplexných tool-use workflow sa stane produkčne pripravenými |
„Computer-use čoskoro plošne nahradí RPA" | Čiastočne. OSWorld z ~40 % smerom k 50-70 %; produkčne pripravené pre mnoho prehliadačových workflow až okolo roku 2027 | Stredná. V roku 2026 vedome obmedzené piloty, žiadna úplná náhrada |
„Hlasoví agenti sa stanú štandardom v inbound servise" | Áno, s časovým horizontom. Náklady pod 0,10 USD/minútu, latencia pod 800 ms ako prognóza pre rok 2027 | Vysoká. Jasná, datovaná cesta do produkcie |
„Dlhšie kontextové okná vyriešia problém pamäte" | Čiastočne. Dnes je reálne použiteľných 30-50 % inzerovaných okien 1M+; prognóza ~80 % | Stredná. Perzistentné memory architektúry zostávajú potrebné |
„Humanoidné roboty prevezmú v roku 2028 logistiku" | Špekulatívne. Rok 2028 je pilot-at-scale, nie bežná prevádzka; explicitná neistota | Nízka. Pozorovať, nie stávkovať na termíny |
„Coding agenti vybavia celé projekty autonómne" | Špekulatívne. Niekoľkotýždňové autonómne grafy úloh pre vybrané domény pravdepodobné do roku 2028; plná autonómia životného cyklu nie | Stredná. Dnes: produkčne pripravené len pre obmedzené úlohy |
Zdroj otvorene pomenúva svoju vlastnú slabinu prognóz: oznámenia dodávateľov z roku 2024 o roku 2025 boli „prevažne správne v smerovaní a konkrétne nesprávne v detaile" — a oznámenia z roku 2025 o roku 2026 sledujú rovnaký vzorec. Práve preto nesú tvrdenia o roku 2028 30-50 % chybové pásma. Pre praktikov to znamená: dôverovať štruktúrnemu smerovaniu, konkrétnemu časovaniu nie.
Tvrdé kontroly reality, ktoré brzdia každý hype
Štyri triezve zistenia z výskumu relativizujú každý AGI naratív:
- Halucinácie zostávajú. Naprieč viac ako 26 vedúcimi foundation modelmi sa miery halucinácií pohybujú medzi 22 % a 94 %; aj najlepšie modely sú v približne 20 % prípadov nepresné. Všeobecná inteligencia vyzerá inak.
- Agenti ešte nie sú všade. Napriek 88 % organizačnej adopcie AI globálne je prienik AI agentov naprieč takmer všetkými obchodnými funkciami jednociferný. Pilot, nie bežná prevádzka.
- Produktivita je reálna, ale mierna. Rigorózne namerané sa prírastky pohybujú na úrovni 14 % v zákazníckom servise a do 26 % vo vývoji softvéru; štúdia Brynjolfsson so 14 % platí za najspoľahlivejšiu dolnú hranicu. Marketingové naratívy ležia systematicky vyššie.
- Incidenty pribúdajú. Stanford HAI AI Index 2026 dokumentuje 362 významných AI incidentov za rok 2025 (po 233 v roku 2024). Viac schopností znamená aj väčšiu plochu pre útoky a chyby.
Jediné tvrdenie blízke AGI, ktoré zdroj vôbec robí, je formulované opatrne: reasoning modely sa do roku 2028 na benchmarkoch znalostnej práce priblížia úrovni near-PhD — s výslovným dodatkom, že konkrétne míľniky (ktorý benchmark, ktorý rok) sú nespoľahlivé. To je tvrdenie o benchmarkoch, nie prísľub všeobecnej inteligencie.
Príklad z praxe: Ako odčarovať tvrdenie o AGI za 60 sekúnd
Predpokladajme, že dodávateľ v pitchi tvrdí: „Náš agent dosahuje ľudskú úroveň a plne automatizuje 80 % vašej podpory." Anti-hype test, tri kontrolné otázky:
- Číslo, zdroj, dátum? „Ľudská úroveň" nie je metrika. Preukázateľné by bolo napríklad: BFCL Multi-Turn ~65 % (stav máj 2026). Bez čísla s dátumom platnosti je to naratív.
- Inkrementálne alebo AGI skok? „80 % plne automatizované" odporuje nameranej realite: rigorózne štúdie ukazujú 14 % prírastok produktivity v servise, nie 80 % plnú automatizáciu. Pravdepodobná je triage plus eskalácia, nie náhrada.
- Chybové pásmo? Ak chýba údaj o neistote, chýba seriózny podklad. Aj najlepšia trieda modelov je v ~20 % prípadov nepresná — plne autonómna podpora bez human-in-the-loop je tým vylúčená.
Výpočet k tomu: pri miere halucinácií/nepresnosti okolo 20 % a 10 000 interakciách mesačne by sa čisto výpočtovo dalo očakávať približne 2 000 chybových odpovedí. Bez eval-setu, human-in-the-loop a eskalačnej logiky sa z „80 % prísľubu" stáva operatívne riziko, nie ROI.
Záver a odporúčanie pre prax
AGI debata je pre praktikov v oblasti agentov v roku 2026 predovšetkým otázkou disciplíny: dôverovať smerovaniu inkrementálnych pásiem schopností, hype a konkrétnemu časovaniu nie. Kto stavia architektúry na zameniteľnosť (model gateways, abstrakčné vrstvy), human-in-the-loop pri akciách s veľkými dôsledkami a vlastné eval-sety namiesto čísel z dém dodávateľov, je odolný voči každej zmene generácie — bez ohľadu na to, či „AGI" niekedy príde.
Pre agentúry: Pozicionujte sa ako triezvy prekladateľ medzi hype a preukázateľnou schopnosťou. Dodávajte eval-riadených, na spolurozhodovanie ohľaduplných agentov do produkcie — nie prísľuby AGI. To je moat voči dodávateľom, ktorí predávajú na čísla z dém.
Pre B2B rozhodovateľov: Plánujte rozpočty proti rigoróznym peer benchmarkom (14-26 % produktivity), nie proti naratívom dodávateľov. Zadržte si 15-25 % AI rozpočtu ako trigger-based rezervu na reálne skoky. Zaobchádzajte s migráciou modelu ako s decision gate s eval kontrolou, nie ako s automatikou. Blck Alpaca pomáha DACH firmám túto líniu medzi substanciou a hype ťahať čisto.
Často kladené otázky
Dá sa AGI očakávať do roku 2028?
Čo sa pre praktikov v oblasti agentov konkrétne mení vďaka lepším modelom?
Prečo je anti-hype postoj dôležitý práve pre B2B rozhodovateľov?
Znamená nadchádzajúci skok modelu (napr. Opus 5 / GPT-6), že by sme mali čakať?
Ako rozlíšim preukázateľnú schopnosť od hype vo vyjadrení dodávateľa?
Ísť hlbšie?
Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.