Webwright: Fra klik til kode – fremtidens web-automation
Fra klik til kode: Webwright ændrer måden, vi automatiserer web på
De fleste kender følelsen af at se en bot arbejde sig gennem en hjemmeside – klik efter klik, langsomt og mekanisk. Det virker, men det er også begrænset. Forskere fra Microsoft og University of Hong Kong har fundet en anden vej: Hvad hvis AI-agenter i stedet fik adgang til en terminal og bare skrev kode?
Begrænsningerne ved traditionelle web-agenter
Den klassiske tilgang bygger på trin-for-trin-beslutninger. Agenten ser skærmen, vælger næste handling, udfører den og gentager processen. Det lyder fornuftigt, men det skaber flere problemer i praksis.
Uden overblik bliver agenten reaktiv. Den kan ikke planlægge en hel arbejdsgang på forhånd, men må tage små beslutninger undervejs med begrænset indsigt i det endelige mål. Samtidig bliver navigationen ineffektiv, når komplekse sider skal gennemgås ved at prøve sig frem. Og når noget uventet dukker op – en ændret layout, et nyt felt eller en pop-up – bryder systemet ofte sammen.
Opgaver som flybooking, onlineindkøb eller udfyldelse af lange formularer bliver hurtigt tunge at håndtere på denne måde.
Webwright: Kode i stedet for klik
Webwright vender tankegangen om. I stedet for at forudsige enkeltstående handlinger får agenten en terminal at arbejde i. Her kan den:
- Starte og styre flere browsere på én gang
- Skrive rigtig kode til at styre siderne
- Returnere resultater som eksekverbar kode frem for isolerede kommandoer
Det betyder, at agenten ikke længere siger "klik på denne knap". Den kan skrive et script, der analyserer alle søgefelter, vælger det mest relevante, udfører handlingen og behandler resultatet – alt i én arbejdsgang.
Fordelene ved kodebaseret automatisering
Når agenten arbejder med kode, kan den planlægge på forhånd. Den kan tage højde for mulige fejl og strukturere komplekse opgaver, før den begynder. Samtidig bliver udforskningen mere intelligent, fordi agenten kan læse sidens struktur direkte i stedet for at gætte sig frem.
Hvis layoutet ændrer sig, eller et nyt felt dukker op, tilpasser koden sig. Det giver en fleksibilitet, som klik-baserede systemer sjældent kan matche. For udviklere og DevOps-teams føles det naturligt – det minder om den måde, man normalt løser problemer på: Skriv et script, der håndterer kompleksiteten.
Bedre resultater i praksis
Forskerne har testet Webwright på konkrete opgaver som flyreservationer og e-handel. Sammenlignet med traditionelle metoder klarer den sig bedre både på hastighed og på succesrate. Færre handlinger kræves, og flere opgaver bliver løst korrekt.
Det har betydning, når automatisering skal bruges i stor skala. Selv små forbedringer bliver vigtige, når de gentages millioner af gange.
Hvad det betyder for hosting og infrastruktur
Når AI-agenter bliver mere avancerede, stiller det også nye krav til den underliggende infrastruktur. Pålidelig DNS, stærk SSL-beskyttelse og hurtig hosting bliver endnu vigtigere, når systemer selv navigerer rundt på nettet.
Samtidig åbner tilgangen nye muligheder for automatiseret API-testning, dataudtræk og low-code-løsninger.
Konklusion
Webwright viser, at den bedste automatisering ikke nødvendigvis kommer af at forenkle grænsefladen. Den kommer af at give agenten de rigtige værktøjer. En terminal er ikke bare et gammelt udviklerredskab – det er en måde at lade intelligente systemer tænke strategisk og tilpasse sig undervejs.
Fremtidens webautomatisering handler ikke om at forudsige det næste klik. Den handler om at skrive bedre kode.