Cum trec agenții web din browser în terminal și schimbă automatizarea

Cum trec agenții web din browser în terminal și schimbă automatizarea

Mai 26, 2026 web automation ai agents terminal tools playwright code generation browser automation ai development devops

De la sesiuni în browser la cod: cum agenții web care lucrează direct în terminal schimbă automatizarea

Majoritatea oamenilor își imaginează agenții AI pentru web ca pe niște entități care controlează browserul pas cu pas. Clicuri, scroll, completări de formulare — totul se întâmplă într-o singură sesiune lungă. Dar tocmai această abordare devine o limitare.

Problema sesiunilor persistente

Când agentul rămâne legat de același browser, fiecare pas depinde de cel anterior. Dacă apare o eroare, devine greu să înțelegi ce s-a întâmplat. Nu poți izola o parte din flux, nu poți relua doar o secțiune, iar sesiunea se umple cu tot felul de stări intermediare.

Rezultatul e previzibil:

  • Complexitate acumulată în timp
  • Depanare greoaie
  • Imposibilitatea de a refolosi soluții deja găsite

Webwright: browsere de unică folosință, cod persistent

Webwright inversează logica. În loc să păstreze browserul activ, creează instanțe noi de fiecare dată când e nevoie. Browserul devine un instrument temporar. Ce rămâne în urmă e codul, logurile, capturile de ecran și fișierele din spațiul de lucru local.

Trei principii de bază

1. Cod în loc de acțiuni primitive

În loc de secvențe lungi de comenzi de tipul „clic → așteptare → tastare”, agentul construiește funcții reutilizabile. Selectarea unei date, completarea unui formular sau extragerea de date devin bucăți de cod pe care le poți apela de mai multe ori.

2. Artefacte care rămân

Fiecare sarcină produce ceva concret: scripturi de explorare, loguri, capturi de ecran, un program final. Aceste fișiere rămân în folderul de lucru și pot fi verificate, partajate sau refolosite.

3. Arhitectură simplă

Sistemul e format din trei componente: un runner, un model și un mediu terminal. Cam 1000 de linii de cod. Fără straturi complicate de orchestrare. Doar un ciclu clar între model și mediu.

Cum funcționează bucla

Runnerul trimite sarcina și starea curentă către model. Modelul răspunde cu o comandă bash, de obicei un script Playwright. Mediul execută comanda și returnează rezultatele. Bucla se repetă până când agentul produce un script final, îl rulează într-un mediu curat și își verifică singur rezultatele.

Performanțe reale

Pe benchmarkuri cu site-uri active, Webwright a obținut:

  • 60.8% acuratețe pe Odyssey — o îmbunătățire de 35% față de soluțiile anterioare
  • 86.7% pe Online-Mind2Web, pe 136 de site-uri diferite
  • 66.2% chiar și cu modele mai mici, când folosește tool-uri reutilizabile

Controlul accesului la terminal

Accesul complet la terminal e puternic, dar riscant. Webwright adaugă câteva reguli simple:

  • Agentul nu poate declara succesul până nu rulează scriptul final într-un mediu proaspăt
  • Istoricul lung se condensează periodic pentru a nu depăși limitele de context
  • Scripturile rezolvate pot fi transformate în tool-uri CLI și refolosite

Ce înseamnă asta pentru dezvoltatori

Separă inteligența agentului de mediul de execuție. Folosește sesiuni temporare, dar păstrează rezultatele. Construiește funcții în loc de lanțuri de acțiuni. Și verifică de două ori înainte de a considera o sarcină încheiată.

Browserul e temporar. Terminalul e spațiul unde rămâne munca reală.

Read in other languages:

RU BG EL CS UZ TR SV FI PT PL NB NL HU IT FR ES DE DA ZH-HANS EN