Терминалът поема браузъра: как уеб-агентите сменят автоматизацията

Терминалът поема браузъра: как уеб-агентите сменят автоматизацията

Май 26, 2026 web automation ai agents terminal tools playwright code generation browser automation ai development devops

От браузъра към кода: как агентите, които работят в терминала, променят уеб автоматизацията

Повечето хора си представят уеб автоматизацията като AI агент, който управлява браузър – клика, попълва форми и скролва страници в една дълга сесия. Това изглежда логично, но може би точно тук е проблемът.

Защо stateful браузърите пречат

Класическите агенти са обвързани с браузърната сесия. Всяко действие зависи от предишното и ако нещо се обърка, трябва да дебъгваш цялата верига от взаимодействия. Няма ясно разделение между логиката на агента и средата, в която работи.

Това води до няколко конкретни проблема:

  • Натрупване на състояние – дългите сесии стават все по-сложни и трудни за предвиждане
  • Трудно дебъгване – трудно е да провериш или повториш само част от задачата
  • Липса на повторно използване – всяка задача започва от нулата

Webwright: еднократни браузъри, траен код

Webwright обръща подхода. Вместо да поддържа една браузърна сесия, агентът създава нови инстанции, когато му трябват. Браузърът се използва, инспектира и се изхвърля. Остава кодът, логовете, скрийншотите и файловете в работната директория.

Браузърът става инструмент за еднократна употреба. Истинският резултат е кодът, който агентът пише.

Трите основни принципа

1. Код вместо примитивни действия
Вместо дълги последователности от кликове и изчаквания, агентът създава функции. Избор на дата, попълване на форма или извличане на данни стават преизползваеми функции, а не поредица от browser actions.

2. Трайни артефакти
Всяка задача генерира скриптове, логове и скрийншоти, които остават в работната папка. Това е мястото, където се натрупва стойността – може да се проверява, споделя и използва повторно.

3. Минимална архитектура
Системата е умишлено проста: Runner, Model Endpoint и terminal среда. Около 1000 реда код. Без сложни multi-agent системи, само директна обратна връзка.

Как работи цикълът

  1. Runner подава задачата, състоянието на workspace-а и последните наблюдения към модела
  2. Моделът връща мислене и bash команда – обикновено Playwright скрипт
  3. Средата изпълнява командата и връща резултати, логове, скрийншоти или грешки
  4. Цикълът се повтаря, докато агентът не създаде финален скрипт, който се тества отново в чиста директория

Просто и без сложни маршрутизации.

Резултати от тестовете

Webwright показва силни резултати на реални задачи:

  • 60.8% точност на Odyssey benchmark – с 35.1% подобрение спрямо предишния рекорд
  • 86.7% точност на Online-Mind2Web на 300 задачи от 136 различни сайта
  • 66.2% точност дори с по-малки модели като Qwen 3.5-9B, когато се използват преизползваеми инструменти

Как се контролира достъпът до терминала

Пълният достъп до терминала носи рискове. Webwright добавя няколко предпазни механизма:

Premature Done Gate – агентът не може да обяви успех, докато не генерира финален скрипт, не го тества в нова среда и не премине собствената си проверка.

Context Compaction – дългите истории се компресират периодично, за да не се превиши контекстът, докато артефактите остават в workspace-а.

Reusable Tools – решените задачи се превръщат в CLI инструменти, които могат да се споделят и използват повторно.

Какво означава това за разработчиците

Ако работиш с автоматизация или AI агенти, Webwright предлага няколко важни урока:

  • Разделяй интелигентността на агента от изпълнителната среда
  • Използвай disposable сесии, но запазвай резултатите
  • Създавай функции вместо вериги от примитивни действия
  • Агентът трябва да докаже, че може да повтори решението си

Терминалът тук не е просто интерфейс – той е работното пространство, където кодът и артефактите остават. Браузърът е временен, терминалът – постоянен.

По-широката перспектива

Webwright показва различен подход към уеб автоматизацията: вместо да се строят сложни state machines, агентът пише код. Браузърът става disposable, а workspace-ът – durable.

Ако работиш с агентни системи или уеб автоматизация, тази философия си заслужава внимание. Кодът е на GitHub, резултатите са убедителни, а идеята е проста: терминалът е всичко, от което се нуждаеш.

Read in other languages:

RU EL CS UZ TR SV FI RO PT PL NB NL HU IT FR ES DE DA ZH-HANS EN