Menu
Přihlásit
Domů / Obsah / Claude Code / Jak ušetřit 92 % tokenů v Clau...
Claude Code 02.06.2026 Article

Jak ušetřit 92 % tokenů v Claude Code: MCP gateway pro týmy a firmy

Používáš Claude Code s MCP servery a tokeny mizí hned na startu? Ukážu ti, jak MCP gateway snižuje spotřebu až o 92 % a jak ji nasadit v týmu.

Jak ušetřit 92 % tokenů v Claude Code: MCP gateway pro týmy a firmy - ilustrační obrázek

Představ si, že zapneš Claude Code s několika MCP servery a hned na začátku relace zmizí 15 000 tokenů jen na popisy nástrojů. Nemluvíš s AI, neposíláš kód — jen ses připojil. Pro týmy, které používají desítky MCP serverů denně, to není drobnost. Jednomu vývojáři to může sežrat stovky dolarů měsíčně.

V tomto článku ti ukážu, jak tento problém vyřešit pomocí MCP gateway. Konkrétně strategii, která u velkých týmů snižuje spotřebu tokenů až o 92 % — a jak ji nasadit, aniž bys musel měnit celou infrastrukturu.

Proč MCP servery žerou tolik tokenů

Model Context Protocol (MCP) je skvělý. Umožňuje Claude Code mluvit s databázemi, GitHubem, Slackem, prohlížečem — čímkoliv. Každý MCP server ale při připojení zaregistruje svůj kompletní schéma nástrojů přímo do kontextového okna. Čím víc nástrojů máš, tím větší je úvodní "daň".

Jeden vývojář změřil, že při 84 nástrojích to dělá 15 540 tokenů jen na startu session. Při denním používání to rychle naroste na statisíce tokenů týdně. Pro tým dvaceti lidí, kteří používají Claude Code s desítkami integrací, jsou to reálné tisíce korun měsíčně — a to ještě předtím, než vůbec něco vyrobíš.

Problém se zhoršuje s každým novým nástrojem. Přidáš GitHub, Jira, databázi, interní API — a kontext se nafoukne. Claude sice zvládne až milion tokenů, ale plýtvat jimi na schémata místo na kód je jako zaplnit kancelář papírenstvím místo lidí, kteří v ní mají pracovat.

Co je MCP gateway a jak funguje

MCP gateway sedí mezi Claude Code a tvými MCP servery. Místo aby se Claude připojoval přímo ke každému serveru a načítal jeho schéma, komunikuje jen s gateway. Ta mu poskytuje metadata na vyžádání — až ve chvíli, kdy je skutečně potřebuje.

Nejznámější open-source řešení je Bifrost od Maxim AI. Místo aby načítal všechny nástroje najednou, zpřístupní čtyři meta-nástroje:

  • listToolFiles — seznam dostupných nástrojů
  • readToolFile — detail konkrétního nástroje
  • getToolDocs — dokumentace
  • executeToolCode — spuštění

Když Claude potřebuje něco udělat, nejprve se zeptá gateway, jaké nástroje jsou k dispozici. Pak si načte jen ten jeden, který potřebuje. Gateway mezitím spouští skutečné nástroje v sandboxovaném prostředí.

Výsledky: od 15 000 tokenů k 1 200

Bifrost publikoval měření při různém počtu nástrojů:

Počet nástrojů Běžné MCP S gateway Úspora
96 15 540 6 525 58 %
251 38 750 6 200 84 %
508 78 200 6 256 92 %

Všimni si klíčové věci: při 508 nástrojích je spotřeba téměř konstantní kolem 6 000 tokenů. Gateway odstřihla závislost mezi počtem nástrojů a náklady. Přidáš nový server? Cena se téměř nezmění.

Latence gateway je přitom zanedbatelná — 11 mikrosekund na požadavek při 5 000 RPS. Pro běžné vývojářské použití to neznatelně.

Jak gateway nasadit v praxi

Nejsnadnější cesta je přes NPX:

npx -y @maximhq/bifrost

Nebo Docker:

docker run -p 3000:3000 maximhq/bifrost:latest

V konfiguraci Claude Code (claude_desktop_config.json nebo settings.json) pak místo přímých MCP serverů odkážeš na gateway:

{
  "mcpServers": {
    "gateway": {
      "command": "npx",
      "args": ["-y", "@maximhq/bifrost"],
      "env": {
        "BIFROST_MODE": "code"
      }
    }
  }
}

Gateway sama se pak připojí k tvým existujícím MCP serverům přes HTTP nebo stdio. Nemusíš měnit konfiguraci nástrojů — jen ji přesměruješ.

Příklad konfigurace pro tým

Představ si, že máš pět vývojářů a každý používá jinou kombinaci nástrojů. Místo aby měl každý lokálně desítky MCP serverů, nastavíš jednu gateway na firemním serveru:

{
  "mcpServers": {
    "company-gateway": {
      "command": "docker",
      "args": [
        "run", "--rm", "-i",
        "-e", "GITHUB_TOKEN",
        "-e", "JIRA_API_TOKEN",
        "maximhq/bifrost:latest"
      ],
      "env": {
        "GITHUB_TOKEN": "${GITHUB_TOKEN}",
        "JIRA_API_TOKEN": "${JIRA_API_TOKEN}"
      }
    }
  }
}

Vývojáři se pak připojují ke stejné gateway. Správce přidá nový nástroj? Stačí aktualizovat gateway — nikdo nemusí měnit lokální konfiguraci. A hlavně: každý vývojář platí stejnou "startovní cenu" tokenů, jako by měl jen pár nástrojů, i když jich je za gateway desítky.

Real-world příklad: Tým 15 vývojářů

Pojďme si to ukázat na konkrétních číslech. Máš tým 15 vývojářů, každý používá Claude Code s průměrně 30 MCP nástroji (GitHub, Jira, databáze, interní API, Slack, Notion, prohlížeč).

Bez gateway:

  • Startovní tokeny na session: ~9 000
  • Sessionů denně na vývojáře: ~10
  • Denní spotřeba týmu: 15 × 10 × 9 000 = 1 350 000 tokenů
  • Měsíční spotřeba: ~40 500 000 tokenů
  • Při ceně Anthropic API ($3 / 1M input tokenů): ~$120 měsíčně jen na startovní schémata

S gateway:

  • Startovní tokeny na session: ~1 200
  • Denní spotřeba týmu: 15 × 10 × 1 200 = 180 000 tokenů
  • Měsíční spotřeba: ~5 400 000 tokenů
  • Cena: ~$16 měsíčně

Úspora: $104 měsíčně — a to ještě nepočítáme rychlejší odezvu a čistší kontext. Při roce používání je to přes 25 000 Kč ušetřených jen na tokenech pro schémata. A každý nový nástroj už téměř nezvedá cenu.

Alternativy pro enterprise

Pokud potřebuješ firemní kontrolu, existují i další možnosti:

  • Cloudflare MCP Portals — integrace s Zero Trust, edge routing
  • Kong AI Gateway — přes MCP Proxy plugin
  • MintMCP — managed služba s důrazem na compliance
  • IBM Context Forge — multi-protokol, open-source

Pro týmy s přísnými bezpečnostními požadavky dává smysl zvolit řešení, které umí auditovat každý požadavek a řídit přístup podle rolí.

Další triky pro snížení tokenů

Gateway je nejvýraznější úspora, ale existují i další taktiky:

  1. Tool Search v Claude Code — Anthropic přidal vlastní optimalizaci, která redukuje tokeny až o 46,9 %. Aktivuje se automaticky u novějších verzí.

  2. Subagenti — místo jednoho Claude s všemi nástroji rozděl úkoly. Každý subagent nese jen nástroje, které potřebuje pro svou část práce.

  3. Hooks — pomocí PreToolUse můžeš filtrovat nepotřebné nástroje ještě před tím, než se dostanou do kontextu.

  4. SkillsSKILL.md soubory v projektech omezují potřebu širokého kontextu tím, že definují pravidla přímo v repozitáři.

Kdy se gateway vyplatí

Gateway není nutnost pro každého. Pokud používáš tři MCP servery a pracuješ sám, úspora bude pár dolarů měsíčně — možná ne stojí za komplexitu.

Ale vyplatí se, pokud:

  • Používáš více než 10 MCP nástrojů
  • Pracuješ v týmu, kde náklady násobí počet lidí
  • Přidáváš nové integrace pravidelně
  • Potřebuješ centralizovanou správu přístupu
  • Chceš sandboxovat nástroje kvůli bezpečnosti

Závěr: Nekrm kontext zbytečně

MCP protokol změnil, jak pracujeme s AI nástroji. Ale každá integrace nese svou cenu — a ta se projevuje v tokenech, rychlosti i přehlednosti. Gateway není jen o úspoře peněz. Je o tom, udržet kontext čistý a nechat Claude pracovat na kódu místo na čtení schémat.

Začni malým experimentem. Spusť Bifrost lokálně, připoj pár nástrojů a sleduj rozdíl. Čísla jsou překvapivá — a workflow příjemně rychlejší.

Bezplatný kurz

Nauč se Claude Code za 10 dní

Bezplatný e-mailový kurz s praktickými tipy. Žádná teorie, jen to, co funguje.

Začínáte s AI?

Navštivte zacinamsai.cz — průvodce světem AI pro úplné začátečníky.

Přejít na Začínáme s AI →

// Další články, které by tě mohly zajímat

Potřebujete pomoct s AI automatizací?

Domluvte si nezávaznou konzultaci →