Jak ušetřit 92 % tokenů v Claude Code: MCP gateway pro týmy a firmy
Používáš Claude Code s MCP servery a tokeny mizí hned na startu? Ukážu ti, jak MCP gateway snižuje spotřebu až o 92 % a jak ji nasadit v týmu.
Opus 4.8 přináší Dynamic Workflows — Claude Code si sám roztočí stovky subagentů na velké úlohy a je 4× méně náchylný přejít vadný kód. Ukazujeme, jak toho využít ve workflow.
Znáš to. Migrace napříč stovkami souborů, audit celé codebase, masivní refaktoring po změně API — úlohy, které musíš krájet na malé kousky a každý hlídat ručně, protože jeden agent je na to prostě moc pomalý a moc nespolehlivý. Skončíš u babysittingu: spustíš, počkáš, zkontroluješ, opravíš, spustíš znovu.
Claude Opus 4.8 (vyšel 28. května 2026) tohle mění. Ne proto, že by psal o trochu lepší kód — to taky, ale to není ten zlom. Zlom je v tom, že Claude Code teď zvládne celou velkou úlohu sám a navíc ti spolehlivěji řekne, když je něco špatně. Pojďme na to, jak toho využít v praxi.
Hlavní novinka se jmenuje Dynamic Workflows (zatím v režimu research preview v Claude Code). Princip: Claude si sám naplánuje práci a podle náročnosti roztočí desítky až stovky paralelních subagentů v jednom sezení. Každý útočí na problém z jiného úhlu, Claude pak nasadí i adversariální agenty, kteří se snaží dílčí závěry vyvrátit, a iteruje, dokud se odpovědi nesejdou. Teprve potom ti reportuje.
Anthropic to popisuje přímo: „Claude může naplánovat práci a poté spustit stovky paralelních subagentů v jednom sezení" — jako modelový příklad uvádí migrace codebase přes stovky tisíc řádků.
Co je tady zásadní pro tvůj reálný output: nemusíš orchestraci řešit ty. Dřív sis musel dělit úlohu sám, otevírat víc sessions, ručně skládat výsledky. Teď zadáš velký záměr běžnou řečí a Claude sám rozhodne, jestli stačí pár subagentů, nebo rozjede celou flotilu.
Tohle je důvod, proč můžeš nechat Opus 4.8 běžet dýl bez neustálého dohledu. Anthropic uvádí, že nová verze je zhruba čtyřikrát méně náchylná k tomu, aby přešla chybu ve vlastním kódu bez komentáře, a častěji sama upozorní na nejistotu.
V číslech je posun vidět i na benchmarcích agentického kódování:
Praktický dopad: u dlouhých autonomních běhů je největší riziko, že ti model sebevědomě podstrčí něco rozbitého. Když je tahle pravděpodobnost čtyřnásobně nižší, posouvá se hranice toho, co si dovolíš nechat na něm, a kolik času ušetříš na kontrole.
Druhá užitečná novinka jsou effort controls — řídíš, kolik „úsilí" model do odpovědi vloží. Vyšší úsilí = víc přemýšlení a kvalitnější výstup u těžkých úloh; nižší úsilí = rychlejší odpovědi a pomalejší čerpání limitů. Pro rutinní práci jedeš nízko, na náročný problém přidáš.
K tomu Fast mode: Opus 4.8 v něm pracuje 2,5× rychleji a nově je třikrát levnější než u předchozích modelů. Cena samotného modelu zůstává stejná ($5 za milion vstupních / $25 za milion výstupních tokenů).
Praktické pravidlo, kdy Opus vs. Sonnet: na velké, riskantní nebo vícekrokové agentické úlohy (refaktoring, migrace, audit) sáhni po Opusu 4.8 — vyplatí se přesnost. Na rychlé, jednoduché a opakované věci nech levnější model a šetři rozpočet.
Nech Claude Code rozdělit práci samotný. Prompt typu:
Projdi celý projekt a nahraď starý způsob volání
oldApiClientnovýmhttpClient. Změny prováděj po souborech, u každého ověř, že se nic nerozbilo, a na konci mi dej souhrn, kde sis nebyl jistý.
Opus 4.8 si roztočí subagenty po souborech a díky vyšší spolehlivosti ti rovnou označí místa, která si zaslouží tvůj pohled.
Udělej bezpečnostní a kvalitativní audit tohoto repa. Pusť na to víc nezávislých pohledů, ať mi neunikne edge case, a každé zjištění se pokus sám vyvrátit, než ho zařadíš do reportu. Výstup seřaď podle závažnosti.
Tady naplno využiješ adversariální ověřování — dostaneš report, který už prošel vnitřní oponenturou.
Migruj projekt z verze X na Y. Najdi všechna dotčená místa, navrhni plán po krocích, proveď ho a po každém kroku spusť testy. Když něco selže, zastav se a řekni mi proč.
Přesně typ úlohy, na kterou Dynamic Workflows cílí — velký rozsah, opakovatelná logika, jasná kontrola na konci každého kroku.
Dynamic Workflows jsou zatím v režimu research preview — počítej s tím, že se chování může ladit a ne každá úloha je na flotilu subagentů ideální. Pár praktických poznámek z reálného používání:
Žádná věda: v Claude Code přepneš model příkazem /model na Opus 4.8, příkazem /fast zapneš rychlý režim. Effort si nastavíš v rozhraní. Tím to končí — všechen zajímavý čas věnuj zadání, ne konfiguraci.
Opus 4.8 posouvá Claude Code z „chytrého párového pomocníka" do role autonomního exekutora velkých úloh. Dynamic Workflows ti seberou orchestraci z hlavy, skok ve spolehlivosti ti dovolí nechat ho běžet dýl bez babysittingu a effort s Fast mode ti dají páku na cenu i rychlost.
A nezůstává to jen u kódu. Stejný princip — rozděl, paralelizuj, ověř — využiješ kdekoli, kde máš velký objem práce s opakovatelnou logikou: hromadné zpracování dat, rešerše napříč mnoha zdroji, generování a kontrola obsahu. Schopnost orchestrovat tým subagentů je obecná páka na produktivitu, ne jen vývojářská hračka.
Příště, až narazíš na úlohu, kterou bys instinktivně rozkrájel na deset menších, zkus jediné: popiš celý záměr a nech Opus 4.8, ať si práci rozdělí sám. Možná zjistíš, že babysitting už nepotřebuješ.
Bezplatný e-mailový kurz s praktickými tipy. Žádná teorie, jen to, co funguje.
Navštivte zacinamsai.cz — průvodce světem AI pro úplné začátečníky.
Přejít na Začínáme s AI →
Používáš Claude Code s MCP servery a tokeny mizí hned na startu? Ukážu ti, jak MCP gateway snižuje spotřebu až o 92 % a jak ji nasadit v týmu.
Nauč se propojit Claude Code s Playwright MCP a automatizovat prohlížečové úkoly přímo z terminálu. Od testování až po scraping — bez psaní kódu.
Anthropic právě vydal self-hosted sandboxy a MCP tunely pro Claude Managed Agents. Ukážu ti, jak díky nim udržet data ve firmě a přitom využít plnou sílu AI agentů.
Voice Mode v Claude Code je nyní dostupný pro všechny uživatele. Ukazuji praktické workflow pro hands-free kódování, code review i debugging.
/loop v Claude Code přeměňuje nástroj z reaktivního na proaktivního asistenta. Ukazuji osvědčené workflow pro monitoring, PR review a automatizaci rutinních úkolů.
Claude Code disponuje kontextovým oknem o velikosti 1 milionu tokenů. Ukazuji, jak tento prostor efektivně využít pro refaktoring, onboarding i debugování napříč celým projektem.
Potřebujete pomoct s AI automatizací?
Domluvte si nezávaznou konzultaci →Týdenní AI tipy přímo do mailu
Žádný spam. Odhlášení jedním klikem.