Cursor Background Agents: Jak nechat AI kódovat, zatímco děláš něco jiného
Cursor Background Agents běží na pozadí v cloudu, zatímco ty děláš něco jiného. Ukazuji ti, jak je nastavit a jaké workflow si s nimi vybudovat, aby ti šetřily hodiny týdně.
Víc než polovina tokenů zmizí dřív, než AI napíše první slovo odpovědi. Tady je přesně kde — a jak to zastavit. Platí pro Claude Code, API i běžné předplatné.
Ušetři 60 % tokenů bez ztráty kvality
Platíš 20 $ měsíčně za Pro, 100 $ za Max — a přitom 75 % z toho jde do koše. Ne na tvoje úkoly, ale na AI, která si povídá sama se sebou.
Ať používáš Claude Code, vlastní API integraci, nebo jen chatovací okno — tokeny mizí pořád stejnými místy. Po analýze reálných sessionů je jasné: více než 50 % tokenů se spotřebuje ještě předtím, než AI napíše první slovo odpovědi.
Nejde o předražené modely. Jde o to, kde přesně se peníze ztrácejí.
⚠️ Část oprav níže je pro vývojáře a API uživatele. Část platí pro každého — i pro běžné Pro/Max předplatné. U každé sekce je jasně označeno pro koho.
Tyhle problémy se týkají vývojářů, kteří používají AI s nástroji, agentní frameworky nebo vlastní API integrace.
Pokud používáš AI s nástroji (function calling, MCP servery, agentní frameworky), každý request tahá s sebou definice všech dostupných nástrojů. Celé schéma, popis, parametry.
U typické Claude Code sessiony to znamená ~45 000 tokenů samotných definic nástrojů na každý request — ještě předtím, než přijde tvůj dotaz nebo jakýkoliv kód. To je 25–30 % celého kontextového okna spotřebovaného ještě před začátkem práce.
💡 Redukce z 45 000 na 20 000 tokenů samotných schémat = 55 % úspora na každém requestu jen tímto krokem.
Prompt caching je jednou z největších pák na snížení nákladů — opakovaný obsah (systémové prompty, dokumentace, kontext projektu) platíš jen 10 % původní ceny. Zní skvěle. Ale háček je v TTL.
Cache u Claude vyprší za 5 minut (nebo 1 hodinu za příplatek). Pokud máš sessiony s pomalejším tempem nebo si odejdeš pro kávu, cache ti vyprší přesně tehdy, kdy na ni spoléháš.
Reálná čísla: v delších AI sessionách 54 % requestů narazí na vypršenou cache — a zaplatí 10× víc, než by muselo.
Agentní AI systémy mají tendenci číst stejné soubory znovu a znovu. Model přečte config.ts v kroku 1, pak ho znovu v kroku 4, pak ještě jednou v kroku 7.
U typické coding sessiony se stejný soubor přečte 3–7×. Pro 500řádkový soubor to znamená 2 000–3 000 tokenů za každé zbytečné načtení.
Tohle je nejzáludnější problém — není vidět na první pohled.
Každý request přenáší celou historii od začátku sessiony. Zpráva v turn 10 nese 10× více tokenů než zpráva v turn 1. Sessiona s 20 turny může spotřebovat 500 000+ tokenů jen na přehrávání historie. Kvadratický růst — ne lineární. A z 80 % je to obsah, který model v daném momentě vůbec nepotřebuje.
Systémový prompt jde s každým requestem. Fixní overhead na každé volání — bez ohledu na to, jak jednoduchý dotaz posíláš.
Typický problém: systémový prompt narostl organicky, nikdo ho neprořezal, a teď má 4 000+ tokenů plných instrukcí, které model ve většině kontextů vůbec nepotřebuje.
Při 100 turnech denně = 400 000 tokenů jen na systémový prompt. Při 1 000 requestech = 4 miliony tokenů.
Tyhle tipy fungují i bez jediného řádku kódu — platí pro každého, kdo používá Claude v chatovacím rozhraní.
Je to plugin/skill, který přepne model do minimalistického módu. Místo zdlouhavých úvodů model jen odpoví a skončí. Průměrná úspora je 75 % tokenů na request.
Reálná čísla z praxe:
• Vysvětlování React bug: 1 180 → 159 tokenů (87 % úspora)
• Oprava auth middleware: 704 → 121 tokenů (83 % úspora)
• Nastavení PostgreSQL pool: 2 347 → 380 tokenů (84 % úspora)
Začni s lite verzí (profesionální tón, bez flaflu). Přepni na full pro agentic úlohy.
Claude používá klouzavé 5hodinové okno pro limity. Pokud začneš pracovat v 8:30, okno běží do 13:00. Dojdeš-li k limitu v 11:00 — čekáš 2 hodiny.
Hacek: pošli jednoduchý 'ahoj' přes Haiku v 6:15 ráno. Okno se ukotvuje na 6:00 →běží do 11:00 → v 11:00 se okamžitě resetuje → další okno 11:00–16:00. Nulový výpadek.
Automatizuj to přes GitHub Actions nebo přímo v Claude: /schedule "send 'hi' to haiku at 6:15 AM every weekday"
💡 Edit místo follow-up: Zpráva v turnu 30 stojí 31× víc než zpráva v turnu 1. Místo 'Ne, myslel jsem...' jako nová zpráva — klikni Edit na původní prompt, oprav ho, znovu vygeneruj. Špatná výměna se smaže a neprodražuje každý další turn.
Projects: 100stránkový PDF = ~75 000 tokenů. Nahraješ ho do 5 různých chatů = 375 000 tokenů. V Projects nahraješ jednou → všechny konverzace uvnitř projektu na to referují bez spalování tokenů. Kontrakt, briefing, style guide — toto samo ušetří 15–40 $ měsíčně za opakované uploady.
Memory: Každý nový chat bez uloženého kontextu = 3–5 setup zpráv. 5 zpráv × 500 tokenů × 10 nových chatů denně = 25 000 tokenů/den na opakování téhož. Jdi do Settings → Memory, ulož svoji roli a preferences jednou. Claude je aplikuje automaticky.
úspora tokenů bez ztráty kvality
úspora jen z tool schema optimalizace
méně tokenů na odpověď s Caveman Claude
dražší zpráva v turnu 30 vs turnu 1
Bezplatný e-mailový kurz s praktickými tipy. Žádná teorie, jen to, co funguje.
Navštivte zacinamsai.cz — průvodce světem AI pro úplné začátečníky.
Přejít na Začínáme s AI →
Cursor Background Agents běží na pozadí v cloudu, zatímco ty děláš něco jiného. Ukazuji ti, jak je nastavit a jaké workflow si s nimi vybudovat, aby ti šetřily hodiny týdně.
Užíváš Cursor nebo Claude Code? Většina vývojářů teď používá oba nástroje najednou. Ukážu ti, jak je propojit do jednoho efektivního workflow, které ti ušetří hodiny každý týden.
Cursor přestal být jen wrapperem. V roce 2026 nabízí Agent mód, Background Agents, inteligentní Tab a MCP integrace. Kompletní průvodce pro týmy, které chtějí šetřit hodiny týdně.
Cena AI nástrojů pro vývojáře se v roce 2026 zvýšila o stovky procent. Podívejme se na konkrétní čísla a zjistěme, jaké máš možnosti – od placených tarifů až po bezplatné open-source alternativy.
Do roku 2028 bude většina kódu generována AI. Jak se mění role vývojáře, které nástroje musíš znát a jak se připravit na svět, kde inženýr orchestruje agenty místo psaní každého řádku.
AI generuje kód rychleji než lidé, ale obsahuje o 70 % více chyb. Ukážu ti 4vrstvý review proces, který tě ochrání před zbytečnými bugy a udrží produktivitu vysoko.
Potřebujete pomoct s AI automatizací?
Domluvte si nezávaznou konzultaci →Týdenní AI tipy přímo do mailu
Žádný spam. Odhlášení jedním klikem.