AI a programování: Proč distribuované databáze pořád nechápou kontext
Jak AI kóduje pro distribuované databáze: Problém, o kterém se nemluví
Když požádáte Claude, GPT nebo Gemini o SQL dotaz, model spoléhá na data, která viděl během tréninku. A většina z nich pochází z klasického PostgreSQL běžícího na jednom serveru. To není chyba modelů – prostě je to statistika. Jenže pokud vaše aplikace stojí na distribuované databázi typu YugabyteDB, začne se tato znalost měnit v problém.
Proto jsme se rozhodli zjistit, jak velká je tato mezera a jestli se dá nějak zmenšit.
Testování v praxi
Vybrali jsme 17 různých konfigurací modelů a spustili přes 350 hodnocení. Mezi testovanými byly:
- Claude (verze 4.5, 4.6 i 4.7)
- Gemini 3.1 Pro
- GPT-5.x od OpenAI
- Anthropic Composer 2
- Nástroje pro kódování (Cursor, Codex CLI, Claude Code CLI)
Každý model dostal úkol napsat SQL pro distribuovanou databázi. Nešlo jen o syntakticky správné dotazy. Museli se ukázat i v práci s transakcemi napříč nodey, udržováním konzistence a optimalizacích, kterými se bere v úvahu, že data jsou rozložená.
Co rozhodovalo o výsledku
Raw schopnost modelu samozřejmě vliv měla. Lepší model v přacitechnickém prostředí často d<|eos|>