Brauzer seanslaridan kodgacha: Terminal asosidagi agentlar avtomatlashtirishni qanday o‘zgartirmoqda

Brauzer seanslaridan kodgacha: Terminal asosidagi agentlar avtomatlashtirishni qanday o‘zgartirmoqda

May 26, 2026 web automation ai agents terminal tools playwright code generation browser automation ai development devops

Brauzer Sessiyasidan Koddan: Terminal Asosidagi Web Agentlar Avtomatlashtirishni Qanday Oʻzgartirmoqda

Web avtomatlashtirish deyilsa, koʻpchilik AI agent brauzerni boshqarib, sahifalarda bosib, yozib, aylantirib ishlaydi deb oʻylaydi. Bu eng oddiy yoʻl. Lekin aynan shu yondashuv avtomatlashtirishni cheklab qoʻyishi mumkin.

Stateful Brauzerlarning Muammosi

Anʼanaviy web agentlar bitta brauzer sessiyasiga bogʻliq. Har bir harakat oldingisiga bogʻliq boʻladi. Xatolik chiqsa, butun zanjirni tekshirish qiyin. Agent keyingi bosish yoki yozishni oldindan aytib beradi, lekin qaror qabul qiluvchi intellekt bilan uni bajaruvchi muhit oʻrtasida aniq chegaralar yoʻq.

Bu holat quyidagi muammolarni keltirib chiqaradi:

  • Holat shishishi: Uzoq sessiyalarda murakkablik va kutilmagan holatlar ortib boradi
  • Nosogʻlom debugging: Vazifaning alohida qismlarini tekshirish yoki qayta ishlatish qiyin
  • Qayta foydalana olmaslik: Har bir vazifa noldan yechiladi, hatto oʻxshash muammolar avval hal qilingan boʻlsa ham

Webwright: Bir Martalik Brauzerlar, Doimiy Kod

Webwright yondashuvi butunlay boshqacha. Agent bitta brauzer sessiyasini uzoq saqlab turmaydi. Kerak boʻlganda yangi brauzer ochadi, maʼlumot oladi va tashlab yuboradi. Saqlanib qoladigan narsa — brauzer holati emas, balki kod, loglar, skrinshotlar va natijalardir. Ular sizning mahalliy workspaceingizda qoladi.

Yaʼni brauzer — bu faqat ishlatib, keyin tashlab yuboriladigan vosita. Asosiy natija — shu vositadan foydalanish uchun yozilgan kod.

Yondashuvning Uchta Asosiy Tamoyili

1. Kod Primitivlardan Ustun "Buttonni bos → kut → matn yoz → submitni bos" kabi uzoq zanjirlar oʻrniga, Webwright agentlarga qayta ishlatiladigan funksiyalar yaratish imkonini beradi. Sana tanlash, forma toʻldirish, filtrlash, taqqoslash, maʼlumot olish — bular oddiy brauzer harakatlari emas, balki sikllar va funksiyalar shaklida yoziladi. Natijada toza va oson saqlanadigan avtomatlashtirish hosil boʻladi.

2. Doimiy Saqlanadigan Artefaktlar Har bir vazifa doimiy natija yaratadi: tadqiqot skriptlari, harakat loglari, muhim nuqtalardagi skrinshotlar va oxir-oqibat qayta ishlatiladigan vazifa dasturi. Bu workspace — asosiy qiymat shu yerda. U tekshirilishi, boʻlishishi va kelajakdagi avtomatlashtirish uchun asos boʻlishi mumkin.

3. Ataylab Soddalashtirilgan Arxitektura Butun tizim ataylab kichik qilingan: Runner, Model Endpoint va terminal Environment. Hammasi shu. Taxminan 1000 qator kod. Murakkab multi-agent tizimlar yoʻq. Oddiygina qayta aloqa tsikli.

Tsikl Qanday Ishlaydi

Webwrightning asosiy soddaligi shu:

  1. Kontekst yuborish: Runner vazifa, workspace holati va oxirgi kuzatishlarni modelga yuboradi
  2. Bash chiqarish: Model oʻylash jarayoni va shell buyruqni qaytaradi — koʻpincha Playwright skripti
  3. Kuzatishlarni qaytarish: Muhit buyruqni bajaradi va natija, loglar, skrinshotlar, fayllar yoki xatolarni qaytaradi
  4. Takomillashtirish va tugatish: Tsikl agent yakuniy skript yaratmaguncha, uni yangi papkada qayta ishlatmaguncha va oʻz-oʻzini tekshirishdan oʻtkazmaguncha davom etadi

Murakkab marshrutlash yoʻq. Oddiygina terminal, model va oʻsib boruvchi workspace.

Natijalar

Haqiqiy web vazifalarda Webwright quyidagi natijalarni koʻrsatdi:

  • Odyssey benchmarkida 60.8% aniqlik — oldingi eng yaxshi natijadan 35.1% yaxshiroq
  • Online-Mind2Webda 136 ta saytdagi 300 ta jonli vazifada 86.7% aniqlik, 100 qadamlik chegarada
  • Hatto kichikroq Qwen 3.5-9B modeli bilan ham qoʻshimcha vositalar bilan 66.2% aniqlik

Bu sunʼiy testlar emas. Bu haqiqiy saytlar, jonli vazifalar va murakkablik.

Terminal Harakatlaridagi Tartibsizlikni Boshqarish

Agentga toʻliq terminal huquqini berish kuchli, lekin xavfli ham. Webwright xavfsizlik uchun bir nechta cheklovlar qoʻygan:

Vaqtidan Oldin Tugashni Toʻxtatish: Agent muvaffaqiyat haqida eʼlon qilishdan avval yakuniy skript yaratishi, uni yangi muhitda qayta ishlatishi, loglar va skrinshotlarni olishi va oʻz-oʻzini tekshirishdan oʻtkazishi kerak.

Kontekst Siqish: Uzoq kod yozish jarayonlari kontekst chegarasidan oshib ketishi mumkin. Webwright vaqti-vaqti bilan tarixni qisqacha xulosaga aylantiradi, lekin aniq artefaktlar workspace da qoladi.

Qayta Ishlatiladigan Vositalar: Bir marta yechilgan vazifa skripti parametrli qilinib, CLI vositasi sifatida eksport qilinishi, boshqa agentlar bilan boʻlishilishi va qayta kashf qilinmasdan ishlatilishi mumkin.

Nima Uchun Bu Ishlab Chiquvchilar Uchun Muhim

Agar siz avtomatlashtirish tizimlari, web skreyperlar yoki AI yordamli ish oqimlarini qurayotgan boʻlsangiz, Webwright yondashuvi quyidagi saboqlarni beradi:

  • Vazifalarni ajrating: Agent intellektini bajaruvchi muhitdan ajrating
  • Oʻzgarmaslikni qoʻllang: Bir martalik sessiyalardan foydalaning, natijani saqlang
  • Zanjir emas, funksiya yarating: Oddiy harakatlar ketma-ketligi oʻrniga funksiyalar va sikllar yarating
  • Gʻalaba deb eʼlon qilishdan avval tekshiring: Agentlarga yechimlarini toza qayta ishlatishni isbotlash imkonini bering

Bu yerda terminal shunchaki interfeys emas — bu workspace. Kod shu yerda yashaydi, loglar shu yerda toʻplanadi, artefaktlar shu yerda saqlanadi. Brauzer — vaqtinchalik, terminal — doimiy.

Umumiy Manzara

Web avtomatlashtirish tarixan murakkabroq holat mashinalarini qurish haqida boʻlgan. Webwright boshqa yoʻlni taklif qiladi: agent holatni boshqarish oʻrniga kod yozsin. Brauzerni bir martalik qiling. Workspace ni doimiy qiling.

Bu hali boshlangʻich bosqich, lekin bu yondashuv ishonchliroq, saqlash osonroq va qayta ishlatiladigan AI tizimlarini qurishga yordam berishi mumkin — nafaqat web vazifalar uchun, balki agent oʻrganishi, takrorlashi va oʻrganishi kerak boʻlgan har qanday muammo uchun.

Agar siz agent tizimlari, web avtomatlashtirish yoki AI yordamli dasturlash ustida ishlayotgan boʻlsangiz, Webwrightning terminal asosidagi yondashuvini oʻrganishga arziydi. Kod GitHubda, natijalar yaxshi, falsafa esa oddiy: terminal — bu hammasi kerak boʻlgani.

Read in other languages:

RU BG EL CS TR SV FI RO PT PL NB NL HU IT FR ES DE DA ZH-HANS EN