Velká kontextová okna v praxi: 5 workflow, která změní vaši práci s AI
Kontextové okno je nejtěžším konkurenčním bojištěm velkých jazykových modelů v roce 2026. Zatímco před dvěma lety bylo standardních 8 000 tokenů, dnes Claude Opus 4.7 nabízí 1 milion tokenů jako výchozí hodnotu — a to bez příplatku oproti standardnímu 200K kontextu. Tento posun není jen technickou specifikací. Mění to fundamentálně to, jak můžete s AI pracovat.
Co se změnilo a proč to není jen "větší okno"
V březnu 2026 Anthropic zpřístupnil 1M kontextové okno obecně pro modely Opus 4.6 a Sonnet 4.6. V dubnu pak přišel Opus 4.7, pro který je 1M tokenů standardem, nikoli beta funkcí.
Klíčové rozdíly oproti minulosti:
- Žádný příplatek — cena za token zůstává stejná jako u 200K kontextu
- Obecná dostupnost — nevyžaduje beta hlavičku ani speciální přístup
- Vyšší rychlost — infrastrukturní investice (včetně dohody Colossus 1) zvýšily propustnost API až 16×
Ale co to reálně znamená pro vaši práci?
Workflow 1: Analýza celého codebase najednou
Při práci na větším projektu jste dosud museli vybírat — buď posíláte relevantní soubory, nebo se spokojíte s tím, že model nevidí celý kontext. S 1M tokeny to přestává platit.
Průměrný středně velký projekt v Node.js nebo Pythonu má 50–100 souborů s celkovým objemem 200–400 tisíc tokenů. To nyní celé vleze do jednoho kontextu.
Jak na to prakticky:
# Zkontrolujte velikost projektu
find . -name "*.ts" -o -name "*.js" | xargs cat | wc -c
# Pod ~700 tisíc znaků = jde to celé najednou
Místo toho, abyste modelu vysvětlovali architekturu, mu ji prostě celou dáte. Pak se ptáte:
- "Kde v tomhle projektu má smysl přidat caching?"
- "Najdi všechna místa, kde se dělá přímý DB dotaz bez transakce"
- "Identifikuj technický dluh, který bychom měli vyřešit v příštím sprintu"
Výsledek: místo hodinového code review dostanete strukturovaný report za 2 minuty.
Workflow 2: Hromadná analýza dokumentů
Máte 50 zákaznických smluv, které potřebujete projít? Nebo 200 přepisů rozhovorů s uživateli? Dřív jste to museli porcovat po dávkách a ztrácet kontext, nebo platit za specializované nástroje.
Praktický příklad: E-commerce firma má 300 zákaznických recenzí z posledního kvartálu. Celé se vejdou do 1M kontextu. Prompt pak může být:
- "Identifikuj 5 nejčastějších bolestivých bodů, které se opakují"
- "Porovnej sentiment recenzí produktu A vs. produktu B"
- "Navrhni 3 konkrétní změny na základě zpětné vazby"
Bez nutnosti sumarizovat, bez ztráty nuancí, bez opakovaných API volání. Celá analýza stojí přibližně $3 na vstupu a $5 na výstupu — zlomek ceny specializovaného analytického nástroje.
Workflow 3: Kompletní onboarding dokumentace najednou
Nastoupí k vám nový vývojář nebo marketér. Normálně mu dáváte dokumentaci po kouscích, odpovídáte na dotazy, trávíte hodiny vysvětlováním.
S velkým kontextem nahrajete celou onboarding dokumentaci, interní wiki, klíčové procesy — a necháte model odpovídat na otázky nového člověka jako jeho osobní průvodce. Kontext drží po celou délku konverzace.
Tip: Pro tenhle případ použití kombinujte Claude s Projects funkcí. Projects si pamatují dokumenty mezi konverzacemi — takže nenahráváte model pokaždé znovu.
Realistický scénář: Nový vývojář se ptá "jak u nás funguje deploy proces?" a místo obecného popisu dostane konkrétní kroky s odkazy na vaše interní návody, varování před známými problémy a kontakt na člověka, který to aktuálně spravuje.
Workflow 4: Iterace na dlouhých textech
Píšete knihu, dlouhou zprávu nebo rozsáhlý business plán? Dřív jste mohli sdílet jen část najednou — model neviděl celek, a tak nemohl kontrolovat konzistenci nebo navrhnout systémové změny.
Nyní vložíte celý 80stránkový dokument a ptáte se:
- "Jsou závěry v kapitole 5 konzistentní s daty v kapitole 2?"
- "Identifikuj místa, kde opakuji stejný bod různými slovy"
- "Přidej propojení mezi sekcí o distribuci a sekcí o cenotvorbě"
Tenhle typ práce byl dřív doménou drahých editorů nebo týmů korektorů. Nyní je to pětiminutový prompt.
Praktická aplikace: Právníci používají tuto funkci pro review 50 dodavatelských smluv najednou. Místo desítek hodin manuální práce dostanou strukturovaný report s anomáliemi za odpoledne.
Workflow 5: Smluvní a právní analýza
Tohle je případ použití, kde velký kontext mění ekonomiku celých oddělení. Právní review 50 dodavatelských smluv stojí v advokátní kanceláři desetitisíce. S vhodným modelem to zvládnete interně za zlomek ceny.
Vložíte všechny smlouvy najednou a ptáte se:
- "Které smlouvy neobsahují klauzuli o ochraně dat dle GDPR?"
- "Porovnej výpovědní lhůty napříč všemi smlouvami — kde jsou anomálie?"
- "Identifikuj smlouvy, kde je odpovědnost omezena na méně než 3 měsíce fakturace"
Důležitá poznámka: AI vám nedá právní radu. Ale pomůže vám identifikovat, kde problém může být — takže se na advokáta obrátíte připravení a s konkrétními dotazy místo obecného "zkontroluj mi to". To samo o sobě ušetří hodiny i tisíce.
Jak funguje velký kontext technicky
Kontextové okno je v podstatě "pracovní paměť" modelu. Všechno, co vložíte, je viditelné najednou — model může křížově odkazovat libovolné části textu bez ztráty vazby.
Starší modely s 8K nebo 32K kontextem nutily vývojáře k tzv. chunking technikám — dokument se rozsekal na kousky, každý se zpracoval zvlášť a výsledky se slévaly dohromady. Ztrácelo se přitom propojení mezi vzdálenými částmi textu.
1M kontext tohle chunking v naprosté většině případů eliminuje. Pro Claude API stojí zpracování 1M tokenů zhruba $3 na vstupu a $15 na výstupu (Sonnet je výrazně levnější než Opus). Pro Claude.ai Pro plán je to součástí měsíčního předplatného.
Kde jsou hranice?
Buďme realističtí. 1M tokenů neznamená, že model zpracuje cokoliv dokonale.
Co funguje dobře:
- Analýza strukturovaných dat
- Code review napříč projektem
- Extrakce informací z dlouhých dokumentů
- Porovnávání a křížová reference
Co dělá problém:
- Generování velmi dlouhého výstupu (model je dobrý v čtení dlouhého vstupu, ale výstup zůstává omezený)
- Velmi technické nebo specializované domény bez dostatečného tréninkového materiálu
- Matematické výpočty na základě dat v kontextu
Praktické pravidlo: Pokud potřebujete výsledek kratší než 10 stran, ale vstup může být libovolně dlouhý, jste v ideální zóně.
Srovnání s konkurencí v roce 2026
| Model | Standardní kontext | Cena za 1M tokenů (input) |
|---|---|---|
| Claude Opus 4.7 | 1M | $15 |
| Claude Sonnet 4.6 | 1M | $3 |
| GPT-5 | 1M | $2,50 |
| Gemini 2.5 Pro | 1M–2M | $1,25 |
| Grok 4.20 | 2M | $5 |
Pro čtení dlouhých dokumentů je nejvýhodnější Sonnet 4.6 — kombinuje 1M kontext s rozumnou cenou $3 za milion tokenů. Opus 4.7 použijte, když záleží na maximální přesnosti a kvalitě výstupu.
Malý vs. velký kontext: Kdy použít který přístup
Ne každý úkol potřebuje milion tokenů. Efektivní práce s AI znamená volit správný nástroj pro danou situaci.
Použijte malý kontext (do 32K tokenů), když:
- Potřebujete rychlou odpověď na jednoduchý dotaz
- Pracujete s krátkým kódem nebo snippetem
- Cena je primární omezení a přesnost je sekundární
- Používáte levnější modely jako Haiku nebo GPT-4o mini
Použijte velký kontext (200K–1M tokenů), když:
- Analyzujete vztahy mezi vzdálenými částmi dokumentu
- Potřebujete konzistenci napříč dlouhým textem
- Kontext je rozdělený do více souborů, které musíte chápat dohromady
- Šetříte svůj čas tím, že eliminujete manuální sumarizaci
Pravidlo palce: Pokud strávíte více než 5 minut vybíráním, co modelu pošlete, pravděpodobně byste měli použít větší kontext a poslat všechno.
Praktické tipy pro efektivní práci s dlouhým kontextem
1. Strukturujte vstup
Model lépe pracuje s organizovanými daty. Použijte nadpisy, odrážky a oddělovače mezi sekcemi. To mu pomáhá orientovat se v dlouhém dokumentu.
2. Buďte konkrétní v dotazu
❌ "Analyzuj tohle" — model netuší, co hledáte ✅ "Identifikuj 3 hlavní rizika v těchto smlouvách a navrhni konkrétní změny klauzulí"
3. Využijte výstupní limity
I s 1M vstupním kontextem má Claude omezený výstup (16K–128K podle modelu). Pokud potřebujete dlouhý výstup, rozdělte úkol na kroky:
- "Shrň hlavní body z těchto 50 recenzí"
- "Na základě shrnutí navrhni 5 konkrétních změn produktu"
4. Sledujte token count
Pro Python projekty použijte knihovnu tiktoken nebo anthropic SDK pro přesný výpočet tokenů před odesláním. Pro češtinu platí přibližně: 1 token = 0,75 slova.
5. Využijte cache
Anthropic nabízí prompt caching pro často používané kontexty. Pokud opakovaně posíláte stejnou dokumentaci nebo codebase, caching snižuje cenu až o 90 %.
Jak začít využívat velký kontext
- Změřte své dokumenty — zjistěte, kolik tokenů zabírají vaše běžné dokumenty (průměrně 1 token = 0,75 slova v češtině)
- Začněte s code review — nahrajte celý projekt a nechte model najít bugy nebo navrhnout refaktoring
- Experimentujte s analýzou dokumentů — smlouvy, recenze, feedback — cokoliv, co dříve vyžadovalo manuální procházení
- Sledujte náklady — 1M tokenů zní jako hodně, ale při $3 za vstup je to často levnější než hodina vašeho času
- Porovnávejte modely — pro čtení použijte Sonnet 4.6 ($3/1M), pro kritické analýzy Opus 4.7 ($15/1M)
Závěr: Přestaňte se omezovat
Velká kontextová okna nejsou feature pro power usery. Je to změna mentálního modelu — přestáváte přemýšlet "co z toho modelu dostanu" a začínáte přemýšlet "jak zpracuji celý problém najednou".
Vývojáři, marketéři, analytici, konzultanti — každý, kdo pracuje s textem nebo kódem, má nyní k dispozici AI, které vidí celý obraz. Otázka není, jestli to využijete. Otázka je, kdy začnete.
Začněte dnes — vezměte jeden projekt, který jste dosud řešili po částech, a zkuste ho celý vložit do modelu. Výsledek vás překvapí.