Fra LeetCode til rigtig AI: Sådan træner FrontierSmith kodelogere til det ægte liv
Det skjulte AI-problem i kodning, ingen snakker om
Din AI-kodningshjælper knuser LeetCode-opgaver. Den håndterer grafer, dynamisk programmering og interviewspørgsmål uden problemer. Men bed den om at finpudse database-forespørgsler med begrænsede ressourcer, justere kernel-indstillinger eller løse logistik med modstridende mål – så halter den.
Årsagen? Mangel på data.
Forskere fra Frontier Labs har opdaget det: Internettet florerer af lukkede kodningsopgaver – over 100.000 konkurrenceproblemer alene. Men ægte, åbne optimeringstasks? Kun hundredvis. Det er et kæmpe hul i træningsdataene. Derfor fejler selv topmodeller på virkelighedens udfordringer uden én rigtig løsning.
FrontierSmith løser det her.
Den smarte løsning: Omskriv, skab ikke nyt
I stedet for at lade sprogmodeller finde på nye åbne problemer – dyrt og upålideligt – tager FrontierSmith et elegant trick: tag de mange lukkede opgaver og forvandle dem systematisk.
Forestil dig en minimum spanning tree-opgave med ét svar. Tilføj begrænsninger på forbindelser pr. knude, og det bliver hårdt i stor skala. Nu findes ingen perfekt løsning – kun bedre eller værre. Optimeringen vågner til live.
FrontierSmith bruger tre typer mutationer:
1. Skift målet
Fra "find det optimale" til "find det bedste inden for tid og ressourcer". Ét svar bliver en kontinuerlig jagt.
2. Stram outputtet
Tilføj realistiske begrænsninger, der gør perfekt umuligt. Småskala-opgaver bliver produktionsstørrelse. Approximation bliver nøglen.
3. Løsn inputtet
Fjern antagelser, der gjorde det let. Gør parametre generelle. Toy-data knækker på rigtige datasets.
Resultatet? Tusindvis af ægte træningsopgaver, der lærer agenter at veje alternativer, iterere og forbedre – præcis som i ægte ingeniørarbejde.
Filtreringen: Smid det kedelige væk
Ikke alle forvandlede opgaver er gode. Nogle er kun overfladiske ændringer. Andre lyder åbne, men kræver bare "brug metode X".
FrontierSmiths trick er idea divergence – måling af, om løsere tænker forskelligt.
Lukkede opgaver har én dominant strategi. Alle kører samme algoritme, bare varieret. Åbne opgaver er mangfoldige: branch-and-bound, genetiske algoritmer eller greedy med lokal søgning. Hver scorer forskelligt på testene.
Filtreringen sker i to trin:
- Semantisk tjek: En LLM-dommer analyserer strategierne bag løsningerne.
- Adfærdstjek: Sammenlign score-profiler på testcases. Lige profiler betyder samme tilgang.
Lav divergence? Udbort. Overlevende er rigtige optimeringer.
Fra idé til træningsmaskine
Efter filtrering bygger FrontierSmith kørbare miljøer:
- Dynamiske testgeneratorer til uendelige variationer.
- Verifikatorer med kontinuerlige scores, ikke ja/nej.
- Sikre sandboxes klar til produktion.
Nu har du en skalerbar pipeline. Fra hundredvis til tusindvis – eller ti tusindvis – af nyttige scenarier.
Hvorfor det betyder noget for udviklere og startups
Hvis du laver AI-værktøjer, er det her guld værd.
Nuværende agenter er stærke på klare opgaver med entydige mål. De vakler på det rodede: konfig-tuninger, ressourceoptimering, balance af begrænsninger, iteration mod "god nok" under pres.
FrontierSmith-trænede agenter ændrer tankegang. De lærer trade-offs, approximationslogik og smart iteration – færdigheder til debugging i produktion eller infrastrukturdesign.
For AI-platforme åbner det døre. Generer data i masse. For agent-startups: Takl real-world-problemer.
Det store billede
Det er del af en ny bølge i AI-træning. Vi slipper tanken om, at mennesker skal kuratere alt. I stedet bliver vi kloge på programmatisk data: Forvandl masser af simpelt (lukkede opgaver) til det sjældne (åbne optimeringer).
Ligesom syntetisk data og curriculum learning. Platforme som NameOcean investerer i AI-værktøjer af samme grund. Flaskehalsen er ikke intelligens længere – det er nyttig træningsdata.
FrontierSmith løser ikke alt, men tetter et hul. I AI-verdenens tempo er det nøglen til næste trin.