AI-kodere der lærer undervejs: sådan får real-time feedback dem til at ramme plet
Bedre AI-kodningsagenter: Real-time feedback gør forskellen
De fleste der arbejder med AI-kodningsværktøjer oplever det samme: assistenterne er dygtige, men de har brug for konstant opfølgning. De skriver kode, får en fejl og stopper så. De husker ikke, hvad der gik galt, og de kan ikke se ændringerne uden at blive guidet.
Problemet ligger ikke i selve AI-modellen. Det handler om, hvordan vi giver informationen tilbage til agenten.
Observability der faktisk bliver brugt
De fleste agent-frameworks ser observability som noget, man gemmer til senere fejlsøgning. Men hvad hvis de samme data blev brugt aktivt i agentens næste beslutning?
Det er tanken bag værktøjer som TMA1 v2, og det ændrer måden, vi arbejder med AI-assisteret udvikling på.
Den klassiske agent-loop ser sådan ud:
- Agenten beslutter sig for en handling
- Agenten udfører værktøjer (læser filer, kører kommandoer, ændrer kode)
- Agenten får resultatet tilbage
- Gentag
Men agenten mangler kontekst omkring resultatet. Den ved ikke automatisk, om bygningen lykkedes, hvilke filer der blev ændret, eller om en anden agent har været inde og pille ved filsystemet.
Fra observation til handling
Næste generation af agent-værktøjer løser dette ved at injicere kontekst automatisk. I stedet for at vente på, at agenten spørger, får den løbende besked om:
- Build-status: Passede eller fejlede den sidste kommando, og hvad var fejlen?
- Session-overblik: Hvor længe har sessionen kørt, og hvor mange tokens er brugt?
- Filændringer: Hvem ændrede hvad – agenten selv, en anden agent eller udvikleren?
- Anomalier: Gentager agenten den samme fejlede strategi, eller er konteksten ved at blive for stor?
Når systemet opdager disse mønstre, kan det give agenten et skub i den rigtige retning.
Koordination uden gruppechat
Når flere agenter skal arbejde sammen på større projekter, er traditionel gruppechat sjældent effektiv. Der bliver for meget støj og for høje omkostninger.
I stedet for at lade alle agenter snakke sammen, er det mere effektivt at lade dem arbejde i en stram cyklus: planlæg, skriv, verificér, gennemgå, gentag. Når Agent A har testet sin kode, kan Agent B gennemgå resultatet og give struktureret feedback direkte tilbage til Agent A.
Det kræver en fælles observability-lag, hvor agenterne kan dele kontekst gennem standardiserede protokoller som Model Context Protocol.
Sådan bygger man feedback-løkken
For at implementere dette i praksis skal man have:
- Dækkende hooks på alle kritiske tidspunkter – session start, før hver prompt, efter hvert tool-kald.
- Korrekt attribution af filændringer, så det er tydeligt, hvem der ændrede hvad.
- Struktureret kontekst der er let at parse for agenten – metadata, statistik, build-status og eventuelle advarsler.
- MCP-server integration der lader agenter forespørge på projekt- og build-tilstand.
Hvad betyder det i praksis?
Når agenterne får direkte feedback, arbejder de mere effektivt. De genkender hurtigere, når en strategi ikke virker, undgår at gentage fejl og bruger færre tokens. De bliver bedre til at samarbejde både med mennesker og andre agenter.
Det er stadig et ungt område, men mønsteret er klart: observability der føres tilbage ind i beslutningsprocessen er det, der gør agenterne fra passive værktøjer til reelle samarbejdspartnere.
Hvad sker der nu?
Vi kommer til at se bedre standarder for kontekstinjektion, mere avanceret anomalidetektion og tættere integration med eksisterende workflows som CI/CD og versionsstyring.
Hvis du bygger med AI-agenter i dag, så spørg dig selv: Hvilken observation mangler agenten lige nu? Hvilken kontekst ville ændre dens næste beslutning? Det er ofte der, de største forbedringer ligger.