AI-kodingrevolusjonen er her: Hva som funker (og ikke) i agent-drevet utvikling
AI-kodingrevolusjonen er her: Hva som funker – og hva som ryker
AI i koding var jo science fiction for et øyeblikk siden. Nå er det hverdag. Verktøyene har vokst opp. De er ikke lenger hype. De er verktøy i ekte prosjekter. Utviklere bruker dem i workflowen sin. Og ja, det går på skinner – med noen bulker.
Spennende tider. Men også en realitetsjekk.
Rask shipping = kaos noen ganger
Å pushe features lynraskt høres kult ut. Til det går galt.
Claude Code fra Anthropic fikk kjenne på det i april. Tre feil på en måned:
Reasoning-nerfingen (mars til april): De skrøt ned default-innstillinger for å spare tid. Brukere kokte. Modellen var fin. Innstillingene sugde. Utviklere merker slikt med en gang.
Idle-buggen: Sessioner som lå stille lenge mistet kontekst gang på gang. Tenk å debugge kode mens AI glemmer hva du sa. Ren mareritt.
Pratete prompt-fiasken (midten av april): Endring for kortere svar ødela kodekvalitet. Revert etter dager.
Tre smell på 30 dager? De jakter features hardt. Anthropic innrømmet det. Lover mer intern testing fremover. Poenget: Smarte modeller trenger solid drift.
Features som faktisk hjelper
Likevel: Oppdateringstakten er vill.
Auto-review og focus modes fjerner støy. Skriv kode, slå på /focus, se bare resultatet. Ren flyt. /ultrareview gir dedikerte bugjakter (tre gratis i måneden for Pro/Max).
Permission-scanning (/fewer-permission-prompts) er smart. Sjekker bash og MCP-kommandoer, godkjenner trygge på forhånd. Mindre klikking.
Codex med Chrome-plugin lar agenter ta browser-oppgaver. Perfekt for QA, testing, datainnsamling. Uten egen infra.
Managed Agents "drømmer" nå – gjennomgår gamle sessioner for å lære dine oppgaver. Kontinuerlig læring. Webhooks og multiagent-styring på vei.
Token-visning (/usage) viser hvor ressursene går. Essensielt med variable kostnader.
Tillit er nøkkelen (spesielt for hosting)
Her treffer det oss i hosting-bransjen, som NameOcean. Å slippe AI-agenter løs på maskinen din krever ekte sikkerhet. Ikke bare sandbokser.
Codex jobber i browseren. Claude sender push og kjører kommandoer. Sikkerheten må være innebygd i modellen – den skal ikke ødelegge av seg selv.
Forsker Boaz Barak (OpenAI) kjører Codex "YOLO" uten problemer. Men menneskelig forsiktighet er lett å spotte.
Langsiktig: Modeller som gjør rett fra starten. Ikke perfekte bur.
For hosting-folk betyr det:
- Dypere rettigheter for agenter på cloud-infra enn for mennesker
- API-er med logg på beslutninger, ikke bare handlinger
- Tillit bygges på innsyn – logger, resonnering, forklaringer
Hva du bør gjøre nå
AI-agenter er produksjonsklare for mye. Men hold øye. Feil skjer sjeldnere, men de finnes.
Roadmapen er aggressiv. Anthropic shipper månedlig. Codex akselererer. Auto mode utvides.
Utviklere og startups: Bruk dem nå. Ikke snakk. Gapet mellom proffer og toy-brukere vokser.
Infra-leverandører: Agent-vennlige features som audit-logger, finmasket access, session-minne og transparent resonnering er minimumskrav.
Revolusjonen er i gang. Nå handler det om å levere.