AI-kodingagenter som lærer av egne feil – i sanntid
Hvordan sanntidsdata gjør AI-kodeagenter mer selvstendige
De fleste som jobber med AI-kodeassistenter har opplevd det samme: verktøyene er flinke, men de må passes på. De skriver kode, får en feilmelding – og så stopper det. De husker ikke hva som feilet sist, ser ikke hvilke filer som ble endret, og trenger at du peker på loggene.
Problemet ligger ikke i selve AI-modellen. Det ligger i hvordan vi gir den informasjon tilbake.
Observabilitet som faktisk brukes
De fleste rammeverk for kodeagenter logger bare det som skjedde, slik at vi mennesker kan feilsøke senere. Men hva om de samme loggene ble sendt rett tilbake til agenten som neste beslutningsgrunnlag?
Det er tanken bak verktøy som TMA1 v2. I stedet for å vente på at agenten skal spørre om status, får den automatisk oppdatert kontekst.
Tradisjonelle løkker ser slik ut:
- Agenten bestemmer seg for neste steg
- Den kjører verktøy (leser filer, kjører kommandoer, endrer kode)
- Den får resultatet tilbake
- Løkken gjentas
Men det mangler noe viktig: agenten får ikke vite hva som skjedde rundt resultatet. Den vet ikke om bygget gikk gjennom, om noen andre endret filer samtidig, eller om den holder på å gjenta samme feilstrategi.
Hva agenten egentlig trenger å vite
Neste generasjon verktøy løser dette ved å mate inn kontekst automatisk:
Byggstatus: Gikk siste kommando gjennom, eller dukket det opp feil? Agenten bør se feilmeldingen med én gang.
Sesjonsoversikt: Hvor lenge har økten pågått? Hvor mange tokens er brukt? Når konteksten blir for stor, bør agenten selv foreslå å komprimere.
Filendringer: Systemet kan skille mellom endringer agenten selv har gjort og endringer som kommer fra deg eller andre agenter. Det hindrer misforståelser om hvem som endret hva.
Fastkjøringsmønstre: Når agenten redigerer samme fil gjentatte ganger uten at feilen endres, eller når token-bruken skyter i været, kan systemet flagge at det trengs en ny tilnærming.
Flere agenter som jobber sammen
Når flere agenter skal samarbeide om større prosjekter, fungerer ikke vanlige gruppechatter. Det blir for mye støy og for høye kostnader. Kodearbeid følger en stram syklus: planlegg, skriv, test, gjennomgå, gjenta.
Det som trengs er en felles observasjonsflate. Gjennom protokoller som Model Context Protocol kan en agent hente ut nøyaktig den informasjonen den trenger fra en annen agents økt – uten å måtte lese gjennom alt.
Slik bygger du en god feedback-løkke
For at dette skal fungere i praksis, må du ha:
- Hooks overalt: Logging som slår inn ved sesjonsstart, før hver prompt, etter hvert verktøykall og før kontekstkomprimering.
- Sporing av endringer: Når filer endres, må du vite hvem som sto bak. En kort tidsvindu rundt filsystem-hendelser kombinert med verktøylogger er ofte nok.
- Strukturert kontekst: Ikke fritekstlogger, men rene, maskinlesbare blokker med sesjonsdata, token-bruk og bygstatus.
- MCP-server: En sentral server som lar agenter spørre om prosjektstatus og andre agenters arbeid gjennom ett standardisert grensesnitt.
Hva endres i praksis
Når agentene får se hva som akkurat skjedde, blir de raskere til å rette feil, unngår å gjenta samme strategi, og samarbeider bedre både med mennesker og andre agenter. De bruker også færre tokens fordi de selv vet når det er på tide å rydde opp i konteksten.
Dette er fortsatt et nytt felt, men mønsteret er tydelig: observabilitet som mates tilbake til beslutningsprosessen er det som skiller verktøy som må passes på fra agenter som faktisk kan jobbe selvstendig.
Veien videre
Fremover vil vi se bedre standarder for hvordan kontekst injiseres, mer avansert deteksjon av fastkjøringsmønstre, og tettere integrasjon med CI/CD og versjonskontroll. Selve modellene endres kanskje ikke mye – men infrastrukturen rundt dem vil gjøre den største forskjellen.
Hvis du bygger med AI-agenter i dag, spør deg selv: hvilken observasjon mangler agenten akkurat nå? Hvilken kontekst ville endret neste beslutning? Svaret ligger ofte der de største gevinstene skjuler seg.