Alibaba právě vydala Qwen 3.5 -- open-source AI model s 397 miliardami parametrů, který na benchmarcích poráží GPT-5.2 i Claude Opus 4.5. A to za 60 % nižší náklady. Tady je všechno, co o tom potřebuješ vědět.
Co je Qwen 3.5 a proč by tě měl zajímat
Pokud jsi dosud platil za GPT nebo Claude API a říkal sis, že na open-source alternativy je ještě brzo -- přestaň. Qwen 3.5 od Alibaby změnil pravidla hry.
Model vyšel 16. února 2026 a okamžitě se stal nejdiskutovanějším open-source AI modelem na světě. Důvod? Má 397 miliard parametrů, ale díky architektuře Mixture of Experts (MoE) aktivuje jen 17 miliard najednou. To znamená výkon srovnatelný s top komerčními modely -- ale za zlomek ceny.
A hlavně: je kompletně open-source pod licencí Apache 2.0. Můžeš ho stáhnout, upravit, nasadit u sebe na serveru a používat komerčně. Žádné poplatky, žádná omezení.
Čísla, která mluví za vše
Tady jsou klíčové parametry Qwen 3.5 v porovnání s konkurencí:
- 397 miliard parametrů celkem, ale aktivních je jen 17 miliard na každý dotaz
- 201 jazyků a dialektů -- nárůst o 69 % oproti předchozí verzi (82 jazyků)
- 19x rychlejší dekódování než Qwen3-Max
- 60 % nižší provozní náklady oproti předchozí generaci
- 8x vyšší propustnost při zpracování velkých objemů dotazů
- 1 milion tokenů kontextové okno (hostovaná verze)
- Nativní multimodalita -- rozumí textu, obrázkům i videu v jednom systému
Alibaba tvrdí, že Qwen 3.5 překonává GPT-5.2, Claude Opus 4.5 i Gemini 3 Pro v 80 % testovaných benchmarků. A to v oblastech jako reasoning, kódování i multimodální úlohy.
Jak funguje Mixture of Experts (a proč je to geniální)
Možná si říkáš: "397 miliard parametrů? To musí žrát elektřinu jako malá vesnice." A měl bys pravdu -- kdyby se aktivovaly všechny najednou. Ale právě tady přichází architektura Mixture of Experts (MoE).
Představ si to jako firmu s 397 specialisty. Když přijde dotaz, neodpovídá všech 397 lidí. Systém vybere 17 nejrelevantnějších expertů a ti společně vygenerují odpověď. Zbytek čeká na svůj typ úlohy.
Výsledek? 95% úspora aktivační paměti oproti "hustým" modelům stejné velikosti. V praxi to znamená, že model s výkonem srovnatelným s GPT-5.2 můžeš rozjet na výrazně levnějším hardwaru.
Co to znamená pro tvůj byznys
1. Dramaticky nižší náklady na AI
Pokud tvoje firma používá GPT API pro zákaznický support, analýzu dat nebo generování obsahu, Qwen 3.5 ti může ušetřit tisíce měsíčně. O 60 % nižší provozní náklady nejsou marketingový výmysl -- vyplývají přímo z efektivnější architektury.
Pro český startup nebo středně velkou firmu to může být rozdíl mezi "AI si nemůžeme dovolit nasadit ve velkém" a "jedeme na plný plyn."
2. Nezávislost na amerických firmách
S Apache 2.0 licencí nejsi závislý na OpenAI, Anthropicu ani Google. Qwen 3.5 si můžeš:
- Stáhnout a hostovat na vlastním serveru -- žádná data neopustí tvoji infrastrukturu
- Doladit (fine-tune) na vlastní data -- ať už jde o právnické dokumenty, produktový katalog nebo interní knowledge base
- Nasadit bez měsíčních poplatků za API -- platíš jen za hardware
Pro firmy, které řeší GDPR a citlivá data, je tohle obrovská výhoda. Žádný vendor lock-in, žádné odesílání dat do zahraničí.
3. Podpora 201 jazyků včetně menších trhů
S podporou 201 jazyků má Qwen 3.5 potenciál fungovat výrazně lépe na menších jazycích než konkurence. Pro český trh to může znamenat lepší výsledky při zpracování českých textů, zákaznických dotazů nebo lokalizaci obsahu.
4. Agentic capabilities -- AI, co za tebe jedná
Qwen 3.5 přichází s nativní podporou agentických schopností. Model dokáže nejen odpovídat na dotazy, ale také plánovat kroky, volat externí nástroje a vykonávat úlohy. Je kompatibilní s open-source agentem OpenClaw a dalšími frameworky.
To znamená, že si můžeš postavit AI agenta, který:
- Automaticky odpovídá na e-maily zákazníků
- Prochází a analyzuje firemní dokumenty
- Generuje reporty z dat v reálném čase
- Spouští akce v tvých nástrojích (CRM, ERP, helpdesk)
Jak Qwen 3.5 vyzkoušet ještě dnes
Pokud chceš Qwen 3.5 otestovat bez jakéhokoli nastavování:
- Hugging Face -- model je dostupný na HuggingFace jako
Qwen/Qwen3.5-397B-A17B. Můžeš ho vyzkoušet přímo v prohlížeči. - Alibaba Cloud -- hostovaná verze Qwen 3.5-Plus s kontextem 1 milion tokenů je dostupná přes API.
- Lokální nasazení -- s dostatečným hardwarem (GPU s min. 48 GB VRAM pro kvantizované verze) si model rozjedeš přes
vllm,ollamanebollama.cpp.
Pro většinu firem dává smysl začít s hostovanou verzí na Alibaba Cloud a teprve po ověření use casu přejít na self-hosting.
Srovnání s konkurencí
| Parametr | Qwen 3.5 | GPT-5.2 | Claude Opus 4.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| Licence | Apache 2.0 (open) | Proprietární | Proprietární | Proprietární |
| Self-hosting | Ano | Ne | Ne | Ne |
| Jazyky | 201 | ~100 | ~100 | ~100 |
| Kontextové okno | 1M tokenů | 128K | 200K | 2M |
| Multimodalita | Text + obraz + video | Text + obraz + audio | Text + obraz | Text + obraz + video + audio |
| Cena za 1M tokenů (input) | ~$0.30 | ~$2.50 | ~$3.00 | ~$1.25 |
Pozn.: Ceny jsou orientační a mohou se lišit podle poskytovatele a objemu.
Na co si dát pozor
Než se pustíš do migrace z GPT na Qwen 3.5, je dobré vědět o pár věcech:
- Benchmarky nejsou všechno. Alibaba tvrdí, že Qwen 3.5 vede v 80 % testů. Ale benchmarky a reálné nasazení jsou dvě různé věci. Než přepneš produkční systém, důkladně otestuj na vlastních datech a use casech.
- Čínský původ může být téma. Pro některé firmy a odvětví (obrana, státní správa, zdravotnictví) může být čínský původ modelu regulatorní komplikace. Apache 2.0 licence tenhle problém technicky řeší -- kód je otevřený a auditovatelný -- ale je dobré to mít na paměti.
- Self-hosting není zadarmo. I když je model zdarma, hardware na jeho provoz stojí peníze. Pro plnou verzi potřebuješ server s několika GPU. Kvantizované verze sníží nároky, ale za cenu mírného poklesu kvality.
- Ekosystém je mladší. GPT a Claude mají rozsáhlejší ekosystém pluginů, integrací a komunitní podpory. Qwen 3.5 dohání, ale zatím nemá tak širokou nabídku hotových řešení.
Co z toho plyne pro rok 2026
Qwen 3.5 je dalším důkazem, že open-source AI modely definitivně dohnaly (a v některých oblastech předběhly) komerční konkurenci. V kombinaci s trendem praktického nasazení AI -- menší modely tam, kde stačí, velké tam, kde je potřeba -- se otevírá obrovský prostor pro firmy, které chtějí AI nasadit chytře a levně.
Rok 2026 už není o tom, jestli AI nasadit. Je o tom, jak ji nasadit co nejefektivněji. A Qwen 3.5 ti k tomu dává všechny nástroje -- zdarma a bez omezení.
Zdroje: CNBC, VentureBeat, DataCamp, MarketingProfs AI Update