AI lærer at kode til distribuerede databaser – det problem, ingen taler om
Når AI skal kode til distribuerede databaser: Det kontekst-problem ingen taler om
Når du beder Claude, GPT eller Gemini om at skrive SQL, trækker de på træningsdata, der primært handler om enkeltnode-databaser som PostgreSQL. Det er ikke en fejl – bare statistik. Men hvis din applikation kører på en distribueret database som YugabyteDB, bliver den generelle SQL-viden hurtigt en begrænsning frem for en hjælp.
Vi satte os for at måle, hvor stort problemet egentlig var – og ikke mindst, hvordan man løser det.
Sådan testede vi
Vi kørte over 350 tests fordelt på 17 forskellige modelopsætninger. Vi inkluderede både Claude-familien, Gemini 3.1 Pro, GPT-5.x-varianter og flere specialiserede koderedskaber som Cursor og Codex CLI.
Hver opsætning blev bedømt på, om den kunne generere SQL, der rent faktisk virkede i en distribueret kontekst. Ikke bare syntaktisk korrekte spørgsmål, men queries, der håndterer distribuerede transaktioner, konsistensmodeller og optimeringer, der tager højde for partitionering.
Hvad gjorde den største forskel
Det viste sig, at modelstørrelse og -version ikke var den afgørende faktor. De rigtigt store forbedringer kom, når modellen fik tilføjet en structured skill file med YugabyteDB-specifikke eksempler, best practices og mønstre.
De bedste resultater nåede ofte op på niveau med eller bedre end en nyere modelversion uden den ekstra kontekst. Det betød, at en Claude 4.5 med godt distribueret SQL-kontekst præsterede betydeligt bedre end en ren Claude 4.5 – og i flere tilfælde endnu end en Claude 4.6.
Den vigtigste indsigt
Den centrale erkendelse var, at kontekstarkitektur er vigtigere end modelvalg i fagspecifikke scenarier.
Hver gang du arbejder med specialiseret teknologi – uanset om det er distribuerede systemer, blockchain eller internat