Sandheden om AI-kodningsagenter: Hvad 6000+ ægte developer-sessioner afslører
Sandheden om AI-kodningsagenter: Hvad 6.000+ ægte developer-sessioner viser
AI-kodningsagenter lover at revolutionere udvikling. Mindre kode at skrive. Hurtigere lanceringer. Maskinerne tager det kedelige arbejde.
Men ingen har målt, hvad udviklere rent faktisk laver med dem. Indtil nu.
Datasættet SWE-chat har logget over 6.000 rigtige kodningssessioner fra produktion. Resultaterne er spændende, bekymrende og væltende alt, vi troede om samarbejde mellem mennesker og AI i softwareudvikling.
"Vibe coding" bliver stort – og det bekymrer sikkerhedseksperter
Datasættet viser tre klare samarbejdsformer:
- Kun menneske (22,7 %): AI forklarer, men udvikleren skriver koden
- Samarbejde (36,5 %): Fælles arbejde med gensidig finpudsning
- Vibe coding (40,8 %): AI laver næsten alt; udvikleren godkender kun
Den sidste type vokser lynhurtigt. Vibe coding har fordoblet sig på tre måneder og er nu den mest udbredte måde at arbejde på.
Problemet? Vibe-coded commits har 9 gange flere sikkerhedshuller end menneskelig kode.
Tænk over det. Når udviklere lader AI styre tastaturet fuldt ud, går det hurtigere – men med massivt flere fejl. Alle former tilføjer flere sårbarheder, end de fjerner. Vibe coding er værst.
Den hårde realitet: De fleste AI-koder kasseres
Hvorfor ender 55,7 % af AI-genereret kode aldrig i produktion, hvis udviklere elsker værktøjerne?
Dataene viser konstant modstand. 44 % af interaktionerne stopper med afbrydelse eller afvisning fra brugeren. AI stiller sjældent spørgsmål tilbage – kun i 1,4 % af runderne.
Det ligner en samtale, hvor den ene side taler i vasken.
Mønsteret er tydeligt: Udviklere bruger AI til at udforske idéer og iterere hurtigt, ikke som en autopilot til kode. Det er som en suppede gummiand, der hjælper med at tænke – de fleste forslag ryger i skraldespanden, mens de gode finpudses.
Hvad udviklere virkelig søger fra AI
Overraskende nok: Den største grund til at bruge AI er ikke at skrive kode – det er at forstå den.
19 % af prompts beder om forklaringer på eksisterende kode, mere end kodegenerering. Udviklere bruger AI som reverse-engineering-værktøj, dokumentationsgenerator og hurtig onboarding til ukendte kodebaser.
Vi markedsfører det som "skriv mindre kode", men udviklere vil have "hjælp mig til at forstå bedre".
Ekspert-nitpicker-fælden
47 % af vibe-coding-brugere er "ekspert-nitpickers" – udviklere, der holder sig involveret og retter smådetaljer i hvert AI-forslag.
Det er ineffektivt. Hvis du alligevel gennemgår hver linje, hvorfor vibe code overhovedet? Dataene peger på, at samarbejdsmodus er bedre: højere effektivitet, lavere sikkerhedsrisiko.
Nitpickerne får faldende afkast. De bruger hjernekraft på at rette AI-kode, de selv kunne have skrevet – bare lidt langsommere.
Konkrete fiaskoer fra virkeligheden
Datasættet har ægte mislykkede sessioner. Et eksempel: En udvikler beder AI fikse trege animationer i en iOS-app. AI ændrer det forkerte – enkeltkort-stagger i stedet for container-animationen.
Efter flere rettelser ender det uden løsning. Ingen commits. AI forstår ikke rumlig kontekst eller prioriteringer.
En anden session: En nitpicker micro-styrer: "Lav ikke ny funktion", "inlin UUID-kaldet", "omdøb konstanten". Udvikleren er mere code reviewer end programmer.
Hvad det betyder for dit team
Overvejer I AI-kodningsagenter? Her er data-drevne råd:
Brug til forståelse, ikke skrivning: AI er stærkere til at forklare kode end at lave den. Bedre til docs end nyopbygning.
Hold jer til samarbejde: De 36,5 % sessioner med gensidig raffinering balancerer sikkerhed, hastighed og tilfredshed bedst. Vibe coding frister, men risikerer for meget.
Budget tid til review: Kør Semgrep, Snyk eller lignende på AI-kode. 9x flere huller sker i produktion nu.
Mål det, der lander: Som i datasættet kasseres 55 % af forslagene. Det er ikke fiasko – det er værktøjet i aktion. Vurder hit-rate, ikke mængde.
Det store billede
SWE-chats styrke er ærligheden. Det fanger rigtige udviklere i ægte flows, der træffer ægte valg om AI-kode.
Det viser, at AI-hype er for optimistisk. Maskiner skriver ikke kode alene. Udviklere bruger dem som interaktive tænkeværktøjer, kasserer det meste og holder sig engagerede.
Agenternes er stærke. Men ikke magi. De, der lykkes, ser AI som partner – skeptiske og aktive.
Dataene beviser det.
Vil du dykke dybere? Hele SWE-chat-datasættet er offentligt. Hvis du bygger på AI-agenter, brug disse mønstre til din roadmap. At vide, hvordan udviklere virkelig arbejder, slår gæt hver gang.