- června 2026 vydala japonská laboratoř Sakana AI model, který obrací logiku posledních tří let naruby. Místo aby stavěla ještě větší a dražší jazykový model, postavila Sakana Fugu – model, jehož hlavní dovedností je velet ostatním modelům. Nepíše kód ani nepočítá sám. Rozdělí úkol, vybere pro každou část toho nejlepšího „experta" mezi špičkovými modely (Claude, GPT, Gemini) a výsledky pospojuje dohromady.
Jméno není náhoda. „Sakana" znamená japonsky ryba, „fugu" je ryba čtverzubec. A stejně jako kuchař, který musí přesně vědět, kterou část fugu naservírovat, Fugu přesně ví, který model na který úkol nasadit.
Co je orchestrace modelů
Klíčový pojem, který si zapamatuj, je orchestrace modelů. Je to systém, který každý dílčí úkol pošle tomu nejvhodnějšímu specializovanému modelu, místo aby nutil jeden obří model řešit úplně všechno. Představ si dirigenta: sám nehraje na žádný nástroj, ale ví, kdy mají nastoupit housle a kdy žestě. Přesně tohle dělá Fugu s frontier modely.
Tohle je zásadní posun. Dosavadní závod v AI byl hlavně o velikosti: víc parametrů, víc výpočetního výkonu, větší model. Sakana tvrdí, že frontier výkonu jde dosáhnout i jinak – chytrým rozdělením práce mezi existující modely. A čísla, která ukazuje, naznačují, že to není jen marketing.
Jak vypadá orchestrace v praxi
Vezmi si typický úkol: „Naprogramuj funkci, otestuj ji a napiš k ní dokumentaci." Klasický model to vezme jako jeden velký blok a vyřeší od začátku do konce. Fugu postupuje jinak:
- Rozloží zadání na tři části – návrh a kód, testy, dokumentace.
- Pro samotné kódování pošle úkol modelu, který je v kódu nejsilnější.
- Testy nechá ověřit jiným modelem, který funguje jako kontrolor a hledá chyby v cizí práci.
- Dokumentaci napíše model, který je nejlepší v psaní srozumitelného textu.
- Výsledky složí dohromady a zkontroluje, že do sebe zapadají.
Výhoda je, že žádný model nemusí být dobrý ve všem. Stačí, aby orchestrátor věděl, kdo je v čem nejlepší. A protože Fugu umí volat i sám sebe, dokáže si u složitějších zadání vytvořit víc úrovní delegování – jako manažer, který si na velký projekt sestaví tým a ten tým si sestaví podtýmy.
Jak Fugu funguje uvnitř: TRINITY a Conductor
Pod kapotou stojí dvě technologie, které Sakana popsala ve dvou odborných pracích pro konferenci ICLR 2026.
TRINITY je evolučně vyladěný koordinátor. Úkolům přiřazuje role: „Thinker" (plánovač), který rozmyslí postup, „Worker" (vykonavatel), který práci odvede, a „Verifier" (ověřovatel), který výsledek zkontroluje. Tahle trojice se umí přizpůsobit tomu, jestli jde o kódování, matematiku nebo logické uvažování.
Conductor je metoda postavená na zpětnovazebním učení (reinforcement learning), která objevuje, jak spolu mají agenti komunikovat přirozeným jazykem. Místo natvrdo naprogramovaných pravidel se modely „domluví" samy.
Z těchto dvou stavebních kamenů vzniká multi-agentní systém – víc specializovaných AI modelů, které spolupracují, každý vyladěný na svou doménu. Fugu je rozhraní, které tuhle spolupráci řídí a uživateli ji schová za jediné API.
Fugu a Fugu Ultra: dvě varianty
Sakana nabízí dvě verze:
- Fugu – vyladěné na rovnováhu mezi výkonem a rychlostí, pro běžné každodenní úkoly.
- Fugu Ultra – maximální přesnost pro náročné vícekrokové problémy: výzkum, kód, složité uvažování.
Přístup je přes API kompatibilní s OpenAI, takže firmy, které dnes volají OpenAI, by teoreticky mohly přepnout endpoint. Ceny jsou předplatné v rozmezí zhruba 20 až 200 dolarů měsíčně plus platba za tokeny.
Benchmarky: silné, ale opatrně
Sakana zveřejnila srovnání, ve kterém Fugu Ultra drží krok s nejlepšími samostatnými modely:
| Benchmark | Fugu Ultra | Claude Fable 5 | Opus 4.8 |
|---|---|---|---|
| SWE-Bench Pro | 73,7 % | 80,3 % | 69,2 % |
| LiveCodeBench | 93,2 % | 89,8 % | – |
| GPQA-D | 95,5 % | – | – |
Fugu Ultra překonává Opus 4.8 na SWE-Bench Pro a poráží Claude Fable 5 na LiveCodeBench. Na SWE-Bench Pro zatím vede Fable 5.
Důležitá poznámka: všechna tato čísla pocházejí od výrobců, ne z nezávislého testování. Fugu je příliš čerstvé na to, aby ho stihla prověřit nezávislá strana. Ber je proto jako orientační, ne jako svaté.
Proč zrovna Sakana: evoluce místo hrubé síly
Za Sakana AI stojí David Ha (dříve Stability AI) a Llion Jones, jeden ze spoluautorů zásadní práce „Attention Is All You Need" z roku 2017, na které stojí celá éra transformerů. Oba odmítají „hyperfixaci na škálování jednoho obřího modelu".
Jejich přístup se opírá o evoluční AI – techniky inspirované biologií (mutace, selekce), které optimalizují návrh celého AI systému, ne jen počet parametrů. Fugu je důkazem, že tahle filozofie umí dosáhnout frontier výkonu jinou cestou než nákupem dalších tisíců GPU. Sakana letos na jaře získala v rámci Series B okolo 200 milionů dolarů (32 miliard jenů), mimo jiné od Mitsubishi Electric.
Kde jsou hranice a háčky
Orchestrace není kouzlo zadarmo. Stojí za to znát i odvrácenou stranu:
- Latence. Když jeden úkol projde plánovačem, vykonavatelem a ověřovatelem, trvá to déle než jediné zavolání modelu. Pro chat v reálném čase to může být problém.
- Náklady se sčítají. Pokud Fugu pošle úkol třem různým drahým modelům, zaplatíš tři volání místo jednoho. Úspora vzniká jen tehdy, když orchestrátor umí levné úkoly poslat levným modelům.
- Nový jediný bod selhání. Závislost se přesouvá z jednoho modelu na jednoho orchestrátora. Když vypadne Fugu, vypadne celý tvůj systém.
- Černá skříňka. Je těžší dohledat, proč systém rozhodl tak, jak rozhodl, když rozhodnutí vzniklo napříč několika modely.
Tohle nejsou důvody, proč orchestraci odmítnout. Jsou to věci, které si musíš ohlídat, než na ni vsadíš firemní proces.
Pro koho to dává smysl
Orchestrace nejvíc pomůže tam, kde máš různorodé úkoly s různými nároky – část jednoduchá a levná, část náročná a kritická. Typicky vývoj softwaru, zpracování dokumentů, analytika nebo agentní automatizace, která běží dlouho a kombinuje víc kroků. Naopak pro jednoduchý chatbot s jedním typem dotazů je orchestrace zbytečná komplikace.
Čím se liší od běžných multi-model routerů
Možná si říkáš, že přepínat mezi modely umí i nástroje jako OpenRouter nebo knihovny typu LiteLLM. To je pravda, ale je v tom zásadní rozdíl. Tyhle nástroje přepínají model podle pravidel, která nastavíš ty: „tenhle typ dotazu pošli sem, tamten tam." Jsou to chytré přepínače, ne mozky.
Fugu jde o úroveň výš. Samo se naučilo, jak práci rozdělit, komu ji přiřadit a jak výsledky složit – a dělá to dynamicky pro každý úkol zvlášť. Nepotřebuje, abys napsal pravidla. Rozdíl je jako mezi telefonní ústřednou, která přepojuje podle tabulky, a asistentem, který sám pozná, koho má pro daný problém oslovit. Pro firmu to znamená méně ručního ladění, ale taky méně kontroly nad tím, co se přesně děje.
Co to znamená pro české firmy
Tady je nutné být upřímný. Fugu zatím není dostupné v EU ani EEA – Sakana čeká na soulad s GDPR. České firmy ho tedy dnes nasadit nemohou. Beru proto tenhle text jako analýzu trendu, ne jako návod „jak Fugu zapnout".
Přesto je signál jasný a důležitý i pro tebe:
- Orchestrace přestává být jen pro vývojáře. Myšlenka, že nad modely sedí vrstva, která vybírá nejlepší nástroj na daný úkol, se stane standardem. Ať už ji dodá Sakana, nebo někdo jiný.
- Závislost na jednom poskytovateli je riziko. Fugu je postavené tak, aby dokázalo přesměrovat práci mezi více poskytovateli. Proč je to tak zásadní, ukázal osud modelu Claude Fable 5, který americká vláda stáhla z provozu během 72 hodin.
- Výkon nemusí znamenat největší model. Pro firmu, která řeší náklady, je orchestrace cesta, jak platit za drahý model jen tam, kde se to vyplatí, a levnější nasadit jinde.
Co s tím můžeš dělat už dnes
I když Fugu v Česku nezapneš, můžeš se na svět orchestrace připravit. Začni tím, že si zmapuješ, na kterých AI modelech dnes závisíš a jak snadno bys je dokázal vyměnit. Pokud máš všechno napevno svázané s jediným API, jsi v přesně té pozici, kterou orchestrace řeší. Dál stojí za to oddělit ve svých nástrojích vrstvu „co chci udělat" od vrstvy „kterým modelem to udělám" – díky tomu budeš připravený přepnout, jakmile se objeví lepší nebo dostupnější varianta. A konečně sleduj, jestli orchestrační přístup nezačnou nabízet i hráči dostupní v EU. Princip, který Sakana ukázala, se totiž skoro jistě rozšíří dál.
Časté otázky
Je Fugu velký jazykový model jako GPT nebo Claude? Ne tak úplně. Je to model vyladěný na koordinaci a delegování práce jiným modelům. Sám není určený k tomu, aby odpovídal na všechno, ale aby řídil ty, kdo odpovídají.
Můžu Fugu používat v Česku? Zatím ne. Sakana ho neuvolnila pro EU a EEA kvůli souladu s GDPR. Sleduj vývoj, situace se může změnit.
Nahradí Fugu modely jako Claude nebo GPT? Spíš naopak. Fugu je potřebuje – volá je jako experty. Bez silných základních modelů by neměl koho dirigovat.
Je open source? Ne. Fugu je proprietární a dostupné jen přes placené API, žádné otevřené váhy Sakana neoznámila.
Závěr
Sakana Fugu není jen další model v žebříčku. Je to jiný způsob přemýšlení o tom, jak AI nasazovat – ne jako jeden vševědoucí mozek, ale jako tým specialistů s chytrým dirigentem. I když si ho v Česku zatím nevyzkoušíš, princip, který reprezentuje, bude formovat to, jak budeš s AI pracovat v příštích letech. A načasování není náhoda: přichází přesně ve chvíli, kdy se ukázalo, jak křehká umí být závislost na jediném americkém frontier modelu.