Preskočiť na obsah
10.20Pokročilý7 min

AGI a agenti: Čo je relevantné pre praktikov (a čo je hype)

Blck Alpaca·
Definition

AGI (Artificial General Intelligence) označuje hypotetickú AI s ľudskej úrovni podobnou, naprieč doménami fungujúcou všeobecnou inteligenciou. Pre praktikov v oblasti agentov nie je AGI v roku 2026 plánovacou veličinou: relevantné sú merateľné, inkrementálne skoky v schopnostiach dnešných modelov (dlhšia autonómia, lepší reasoning), nie samotný prísľub AGI. Ten zostáva špekuláciou.

Key Takeaways

  • AGI nie je pre prax s agentmi v roku 2026 operatívnou kategóriou. Čo sa počíta, sú preukázateľné pásma schopností (capability bands) dnešných modelov, nie prahová hodnota s názvom AGI.
  • Inkrementálne skoky sú reálne a plánovateľné: BFCL Multi-Turn z ~65 % smerom k ~75 %, OSWorld z ~40 % smerom k 50-70 %, dlhšie použiteľné kontextové okná, hlasoví agenti pod 0,10 USD/minútu (prognóza 2027).
  • Prísľuby AGI zostávajú špekuláciou: humanoidná robotika, near-PhD reasoning a niekoľkotýždňové autonómne grafy úloh nesú podľa zdroja 30-50 % chybové pásma na časovanie.
  • Tvrdé kontroly reality brzdia každý hype: miery halucinácií 22-94 %, aj najlepšie modely sú v približne 20 % prípadov nepresné, prienik AI agentov je jednociferný, namerané prírastky produktivity 14-26 %.
  • Anti-hype disciplína poráža stávku: architektúru navrhovať na zameniteľnosť, human-in-the-loop pri akciách s veľkými dôsledkami, eval-sety namiesto čísel z demo prezentácií dodávateľov.

AGI (Artificial General Intelligence) označuje hypotetickú AI s ľudskej úrovni podobnou, naprieč doménami fungujúcou všeobecnou inteligenciou. Pre praktikov v oblasti agentov nie je AGI v roku 2026 plánovacou veličinou: relevantné sú merateľné, inkrementálne skoky v schopnostiach dnešných modelov (dlhšia autonómia, lepší reasoning), nie samotný prísľub AGI. Ten zostáva špekuláciou. Tento článok vecne oddeľuje to, čo sa pre prax s agentmi konkrétne mení, od toho, čo je hype.

  • Operatívne irelevantné: AGI nie je prahová hodnota, podľa ktorej by sa dali zosúladiť roadmapy. Neexistuje žiadna spoľahlivá definícia ani seriózny dátum.
  • Operatívne relevantné: preukázateľné pásma schopností dnešných modelov a ich inkrementálna cesta (viac autonómie na úlohu, lepší viacstupňový reasoning).
  • Brzda pre každý hype: miery halucinácií 22-94 %, namerané prírastky produktivity 14-26 % a naďalej jednociferný prienik agentov.

Prečo AGI debata pre praktikov takmer nič nemení

AGI debata sa vedie na nesprávnej úrovni abstrakcie, keď ide o konkrétne projekty s agentmi. Či a kedy vznikne naprieč doménami fungujúca všeobecná inteligencia, je otázka pre výskumné laboratóriá a rizikový kapitál, nie pre DACH B2B tím, ktorý uvádza zákaznícky agentský systém do produkcie. Pre túto prácu sa počíta iná otázka: čo dokáže nasadený model dnes merateľne zvládnuť a ako sa táto schopnosť posunie v nasledujúcich dvanástich až dvadsiatich štyroch mesiacoch?

Záväzný odvetvový výskum to formuluje jasne: otázka schopností v roku 2026 už neznie „dokáže to model", ale „dokáže to organizácia absorbovať". Tým sa úzke hrdlo presúva zo schopnosti modelu na adopciu, na redizajn workflow a na governance. AGI špekulácia neadresuje žiadne z týchto reálnych úzkych hrdiel.

Pre zaradenie generácie modelov (stav máj 2026): na špici stoja Claude Opus 4.7, GPT-5.5 a Gemini 3.1 Pro; pracovné kone, ktoré absorbujú väčšinu agentských volaní, sú Sonnet 4.6, GPT-5.4 a Gemini 3 Flash. Tieto modely sú pre veľkú väčšinu use case znalostnej práce preukázateľne dostatočné, bez toho aby na to bolo potrebné alebo tvrdené „AGI".

Inkrementálny skok v schopnostiach namiesto AGI skoku

Rozhodujúca mentálna zmena: pokrok prichádza v rokoch 2026-2028 ako séria inkrementálnych, jednotlivo merateľných skokov, nie ako diskrétny AGI moment. Tieto skoky sú reálne, sú plánovateľné a menia to, čo agent prakticky dokáže. Najdôležitejšie preukázateľné benchmarkové pásma (stav máj 2026):

  • SWE-Bench Multilingual: približne 75 % (na konfigurácii Sonnet plus advisor)
  • MMLU: nad 87 %
  • GPQA Diamond: približne 75 %
  • BFCL Multi-Turn (viacstupňové použitie nástrojov): približne 65 %
  • OSWorld (computer-use): približne 40 % — pre väčšinu enterprise workflow ešte nie produkčne pripravené

Čo z toho pre prax konkrétne vyplýva: dlhšia autonómia na úlohu a lepší reasoning naprieč viacerými krokmi. Práve tu leží praxi relevantná páka, nie v hypotetickej všeobecnej inteligencii.

Čo sa prakticky mení vs. čo zostáva špekuláciou

Nasledujúca tabuľka oddeľuje typické tvrdenia z verejnej AGI diskusie od toho, čo výskum označuje za realistické, a zaraďuje relevanciu pre prax tímov s agentmi. Všetky čísla stav máj 2026; prognózy s výslovným chybovým pásmom.

Tvrdenie

Realistické?

Relevancia pre prax s agentmi

„AGI príde do roku 2028 a nahradí znalostnú prácu"

Nie. V zdroji žiadny prísľub AGI; len „priblíženie k úrovni near-PhD" na benchmarkoch, s 30-50 % chybovým pásmom na časovanie

Nízka. Žiadna plánovacia veličina. Nezahŕňať do roadmáp

„Viacstupňoví agenti budú výrazne spoľahlivejší"

Áno, inkrementálne. BFCL Multi-Turn z ~65 % smerom k ~75 % (prognóza Q4 2026-Q1 2027)

Vysoká. Viac komplexných tool-use workflow sa stane produkčne pripravenými

„Computer-use čoskoro plošne nahradí RPA"

Čiastočne. OSWorld z ~40 % smerom k 50-70 %; produkčne pripravené pre mnoho prehliadačových workflow až okolo roku 2027

Stredná. V roku 2026 vedome obmedzené piloty, žiadna úplná náhrada

„Hlasoví agenti sa stanú štandardom v inbound servise"

Áno, s časovým horizontom. Náklady pod 0,10 USD/minútu, latencia pod 800 ms ako prognóza pre rok 2027

Vysoká. Jasná, datovaná cesta do produkcie

„Dlhšie kontextové okná vyriešia problém pamäte"

Čiastočne. Dnes je reálne použiteľných 30-50 % inzerovaných okien 1M+; prognóza ~80 %

Stredná. Perzistentné memory architektúry zostávajú potrebné

„Humanoidné roboty prevezmú v roku 2028 logistiku"

Špekulatívne. Rok 2028 je pilot-at-scale, nie bežná prevádzka; explicitná neistota

Nízka. Pozorovať, nie stávkovať na termíny

„Coding agenti vybavia celé projekty autonómne"

Špekulatívne. Niekoľkotýždňové autonómne grafy úloh pre vybrané domény pravdepodobné do roku 2028; plná autonómia životného cyklu nie

Stredná. Dnes: produkčne pripravené len pre obmedzené úlohy

Zdroj otvorene pomenúva svoju vlastnú slabinu prognóz: oznámenia dodávateľov z roku 2024 o roku 2025 boli „prevažne správne v smerovaní a konkrétne nesprávne v detaile" — a oznámenia z roku 2025 o roku 2026 sledujú rovnaký vzorec. Práve preto nesú tvrdenia o roku 2028 30-50 % chybové pásma. Pre praktikov to znamená: dôverovať štruktúrnemu smerovaniu, konkrétnemu časovaniu nie.

Tvrdé kontroly reality, ktoré brzdia každý hype

Štyri triezve zistenia z výskumu relativizujú každý AGI naratív:

  • Halucinácie zostávajú. Naprieč viac ako 26 vedúcimi foundation modelmi sa miery halucinácií pohybujú medzi 22 % a 94 %; aj najlepšie modely sú v približne 20 % prípadov nepresné. Všeobecná inteligencia vyzerá inak.
  • Agenti ešte nie sú všade. Napriek 88 % organizačnej adopcie AI globálne je prienik AI agentov naprieč takmer všetkými obchodnými funkciami jednociferný. Pilot, nie bežná prevádzka.
  • Produktivita je reálna, ale mierna. Rigorózne namerané sa prírastky pohybujú na úrovni 14 % v zákazníckom servise a do 26 % vo vývoji softvéru; štúdia Brynjolfsson so 14 % platí za najspoľahlivejšiu dolnú hranicu. Marketingové naratívy ležia systematicky vyššie.
  • Incidenty pribúdajú. Stanford HAI AI Index 2026 dokumentuje 362 významných AI incidentov za rok 2025 (po 233 v roku 2024). Viac schopností znamená aj väčšiu plochu pre útoky a chyby.

Jediné tvrdenie blízke AGI, ktoré zdroj vôbec robí, je formulované opatrne: reasoning modely sa do roku 2028 na benchmarkoch znalostnej práce priblížia úrovni near-PhD — s výslovným dodatkom, že konkrétne míľniky (ktorý benchmark, ktorý rok) sú nespoľahlivé. To je tvrdenie o benchmarkoch, nie prísľub všeobecnej inteligencie.

Príklad z praxe: Ako odčarovať tvrdenie o AGI za 60 sekúnd

Predpokladajme, že dodávateľ v pitchi tvrdí: „Náš agent dosahuje ľudskú úroveň a plne automatizuje 80 % vašej podpory." Anti-hype test, tri kontrolné otázky:

  1. Číslo, zdroj, dátum? „Ľudská úroveň" nie je metrika. Preukázateľné by bolo napríklad: BFCL Multi-Turn ~65 % (stav máj 2026). Bez čísla s dátumom platnosti je to naratív.
  2. Inkrementálne alebo AGI skok? „80 % plne automatizované" odporuje nameranej realite: rigorózne štúdie ukazujú 14 % prírastok produktivity v servise, nie 80 % plnú automatizáciu. Pravdepodobná je triage plus eskalácia, nie náhrada.
  3. Chybové pásmo? Ak chýba údaj o neistote, chýba seriózny podklad. Aj najlepšia trieda modelov je v ~20 % prípadov nepresná — plne autonómna podpora bez human-in-the-loop je tým vylúčená.

Výpočet k tomu: pri miere halucinácií/nepresnosti okolo 20 % a 10 000 interakciách mesačne by sa čisto výpočtovo dalo očakávať približne 2 000 chybových odpovedí. Bez eval-setu, human-in-the-loop a eskalačnej logiky sa z „80 % prísľubu" stáva operatívne riziko, nie ROI.

Záver a odporúčanie pre prax

AGI debata je pre praktikov v oblasti agentov v roku 2026 predovšetkým otázkou disciplíny: dôverovať smerovaniu inkrementálnych pásiem schopností, hype a konkrétnemu časovaniu nie. Kto stavia architektúry na zameniteľnosť (model gateways, abstrakčné vrstvy), human-in-the-loop pri akciách s veľkými dôsledkami a vlastné eval-sety namiesto čísel z dém dodávateľov, je odolný voči každej zmene generácie — bez ohľadu na to, či „AGI" niekedy príde.

Pre agentúry: Pozicionujte sa ako triezvy prekladateľ medzi hype a preukázateľnou schopnosťou. Dodávajte eval-riadených, na spolurozhodovanie ohľaduplných agentov do produkcie — nie prísľuby AGI. To je moat voči dodávateľom, ktorí predávajú na čísla z dém.

Pre B2B rozhodovateľov: Plánujte rozpočty proti rigoróznym peer benchmarkom (14-26 % produktivity), nie proti naratívom dodávateľov. Zadržte si 15-25 % AI rozpočtu ako trigger-based rezervu na reálne skoky. Zaobchádzajte s migráciou modelu ako s decision gate s eval kontrolou, nie ako s automatikou. Blck Alpaca pomáha DACH firmám túto líniu medzi substanciou a hype ťahať čisto.

Často kladené otázky

Dá sa AGI očakávať do roku 2028?
Záväzný výskumný podklad nedáva žiadny prísľub AGI. Pre rok 2028 prognózuje len to, že reasoning modely sa na benchmarkoch znalostnej práce priblížia úrovni near-PhD, zároveň však zdôrazňuje 30-50 % chybové pásma na časovanie. AGI ako definovaný stav nie je seriózna plánovacia veličina, ale špekulácia. Praktici plánujú s inkrementálnymi pásmami schopností, nie s dátumom AGI.
Čo sa pre praktikov v oblasti agentov konkrétne mení vďaka lepším modelom?
Merateľné a plánovateľné je: silnejšie viacstupňové správanie pri použití nástrojov (BFCL Multi-Turn z približne 65 % smerom k 75 %), computer-use z OSWorld ~40 % smerom k 50-70 %, dlhšie reálne použiteľné kontextové okná a hlasoví agenti s nákladmi pod 0,10 USD/minútu (prognóza 2027). To znamená dlhšiu autonómiu na úlohu a viac produkčne pripravených use case, nie autonómnych vševedov.
Prečo je anti-hype postoj dôležitý práve pre B2B rozhodovateľov?
Pretože naratívy dodávateľov systematicky ležia nad rigorózne nameranými hodnotami. Stanford HAI a štúdia Brynjolfsson dokladajú prírastky produktivity 14-26 % pre štruktúrovanú prácu, nie násobky sugerované v marketingových materiáloch. Kto plánuje rozpočty na čísla z dém namiesto na peer benchmarky, riskuje chybné investície. Prienik AI agentov je naprieč funkciami naďalej jednociferný.
Znamená nadchádzajúci skok modelu (napr. Opus 5 / GPT-6), že by sme mali čakať?
Nie. Nový cyklus frontier modelov je podľa zdroja pre Q4 2026 až Q2 2027 pravdepodobný, ale nepotvrdený. Správnou disciplínou je staviť na zameniteľnosť: abstrakčné vrstvy a model gateways udržiavajú náklady na prechod nízke. Migrácia je decision gate s eval kontrolou, nie automatika, keďže nové modely môžu spôsobiť regresie na produkčných agentoch.
Ako rozlíšim preukázateľnú schopnosť od hype vo vyjadrení dodávateľa?
Tri kontrolné otázky: po prvé, existuje benchmark alebo číslo produktivity so zdrojom a dátumom platnosti, alebo len naratív? Po druhé, je to tvrdenie inkrementálny skok v schopnostiach alebo skok smerom k všeobecnej inteligencii? Po tretie, nesie chybové pásmo pri časovaní? Tvrdenia bez čísla, bez dátumu a bez údaja o neistote sú hype, nie plánovací podklad.

Ísť hlbšie?

Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.