Terminal'den Tarayıcıya: Web Otomasyon Devrimini Yaratabilecek Misiniz?

May 26, 2026 web automation ai agents terminal tools playwright code generation browser automation ai development devops

Terminal'den Kod Yazına: Web Ajanları Otomasyonu Nasıl Yeniden Şekillendiriyor

Otomasyon denilince akla gelen ilk görüntü, bir yapay zeka ajanının tarayıcıyı kontrol etmesi: tıklama, yazma, sayfaları kaydırma—hep tek bir oturumda. Mantıklı gelir. Peki ya bu yaklaşım aslında otomasyonun önündeki en büyük engel olsa?

Tarayıcı Oturumlarının Sorunu

Geleneksel web ajanları, tarayıcı oturumlarına mahkûm birer pilot gibidirler. Her hareket önceki harekete bağlı, bir şey yanlış giderse karmakarışık etkileşimleri çözmek zorlaşır. Ajan bir sonraki tıklamayı, yazıyı ya da kaydırmayı sırasıyla tahmin eder, ama kararları veren yapay zeka ile bu kararları uygulayan ortam arasında net bir ayrım yoktur.

Bu da gerçek sorunlara yol açar:

Durum karmaşıklığı: Uzun oturumlar çoğaldıkça beklenmeyen durumlar çoğalır
Hata ayıklama güçlüğü: Görevin bir kısmını incelemek veya yeniden çalıştırmak kolay değildir
Yeniden kullanım yok: Benzer sorunlar çözülmüş olsa da her görev sıfırdan yapılır

Webwright Felsefesi: İatılabilir Tarayıcılar, Kalıcı Kod

Webwright her şeyi tersine çevirir. Tek bir tarayıcı oturumunu canlı tutmak yerine, ajan gerektiğinde yeni tarayıcı örnekleri açar—inceleyip kapatır. Hayatta kalan tarayıcı durumu değil, sizin bilgisayarınızdaki kodlar, loglar, ekran görüntüleri ve sonuçlardır.

Böyle düşünün: tarayıcı tek kullanımlık bir araç. Asıl ürün onu kullanmak için yazdığınız kod.

Üç Temel Sütun

1. İlkel Aksiyon Zinciri Değil, Kod

Webwright ajanlarına, "butona tıkla → bekle → metin yaz → gönder butonuna tıkla" gibi uzun komut zincirleri yerine yeniden kullanılabilir fonksiyonlar yazmayı sağlar. Tarih seçimi, form doldurma, filtreleme, karşılaştırma, veri çıkarma—bunların hepsi döngü ve fonksiyon haline gelir. Sonuç: temiz, okunabilir otomasyon.

2. Kalıcı Çıktılar

Her görev sonunda kalıcı yapıtlar kalır: keşif scriptleri, aksiyon logları, önemli noktalardaki ekran görüntüleri, ve sonunda yeniden kullanılabilir bir program. Bu çalışma alanı gerçek değerin barındığı yerdir. Denetlenebilir, paylaşılabilir, ve gelecek otomasyonlar için temel olabilir.

3. Kasıtlı Olarak Sade Bir Mimari

Sistem çok kasıtlı olarak küçüktür: bir Runner, bir Model Endpoint, ve terminal Environment. Hepsi bu. Yaklaşık 1000 satır kod. Çoklu ajan orkestrasyonu yok, karmaşık planlama hiyerarşileri yok. Sadece sıkı bir geribildirim döngüsü.

Sistem Nasıl Çalışıyor?

Webwright'ın merkezindeki zarafet böyle işler:

Bağlam Gönder: Runner, görevi, çalışma alanının durumunu ve son gözlemleri modele iletir
Bash Komutunu Döndür: Model, düşüncesini ve (genellikle Playwright scriptini) terminal komutunu geri gönderir
Sonuç Al: Ortam komutu çalıştırır, çıktı, log, ekran görüntüsü veya hata döndürür
Düzelt ve Bitir: Ajan nihai scripti yazıncaya, temiz bir klasörde çalıştıracağına ve kendi kontrol mekanizmalarını geçtiğine dek döngü tekrarlanır

Karmaşık yönlendirmeler yok, karar ağaçları yok. Terminal, model, ve büyüyen bir çalışma alanı—bu kadar.

Gerçek Sonuçlar

Canlı web görevlerinde test edildiğinde Webwright ciddi başarılar gösteriyor:

Odyssey uzun görevler ölçütünde %60.8 başarı—önceki rekordan %35.1 daha iyi
Online-Mind2Web'de 136 farklı site, 300 canlı görev üzerinde %86.7 başarı
Qwen 3.5-9B gibi daha küçük modellerde bile, özel araçlar kullanılınca %66.2 başarı

Bunlar oyuncak testler değil. Gerçek siteler, gerçek görevler.

Terminal Erişiminin Risklerini Yönetmek

Bir ajana tam terminal erişimi vermek güçlü—ve tehlikeli. Webwright işleri güvenli ve mantıklı tutmak için asgari düzeyde kontrol ekler:

Erken Başarı Kontrolü: Ajan sonuç ilan edemez, ta ki son scripti yazıncaya, temiz bir ortamda çalıştırmadığına, logları ve ekran görüntülerini kaydetmediğine ve kendi kontrolünü geçmediğine.

Bağlam Sıkıştırması: Uzun kod sıraları bağlam limitini aşabilir. Webwright tarihi periyodik olarak özetler, ama yapıtlar çalışma alanında somut kalır. Bağlamınız yönetilebilir, yapıtlarınız somut.

Yeniden Kullanılabilir Araçlar: Çözülmüş bir görev, parametreli hale gelir, CLI aracı olarak dışa aktarılır, diğer ajanlarla paylaşılır ve yeniden keşfedilmez. Aynı sorunu iki kere çözmüyorsunuz.

Geliştiriciler İçin Neden Önemli?

Otomasyon sistemleri, web scraper'lar ya da yapay zeka destekli iş akışları geliştiriyorsanız, Webwright'ın yaklaşımından öğrenecek çok var:

Endişeleri ayır: Ajan zekasını çalışma ortamından ayrı tutun
Tek kullanımlık düşün: Oturumları atın, ürünü saklayın
Zincirleme değil, oluştur: İlkel aksiyon dizileri yerine fonksiyon ve döngü yazın
Sonuç ilan etmeden doğrulayın: Ajanları çözümlerini temiz çalıştırabilmelerine dair ikna edin

Terminal burada sadece bir arayüz değil—çalışma alanının kendisidir. Kodun yaşadığı, logların biriktiği, yapıtların kaldığı yer. Tarayıcı geçici; terminal kalıcı.

Daha Geniş Perspektif

Web otomasyonu tarihçesinde genellikle daha sofistike state makineleri inşa etmek vardı. Webwright başka bir yol öneriyor: ajanı tarayıcı durumunu değiştirmek yerine kod yazmaya yönelt. Tarayıcıyı kullan-at yap. Çalışma alanını dayanıklı tutun.

Henüz erken, ama daha güvenilir, bakımı kolay, yeniden kullanılabilir yapay zeka sistemleri inşa etmenin—sadece web görevleri için değil, ajanın keşfetmesi, iterasyon yapması ve öğrenmesi gereken herhangi bir problem için—yolunu işaret ediyor.

Web otomasyonu, ajan sistemleri ya da yapay zeka destekli geliştirme üzerinde çalışıyorsanız, Webwright'ın terminal-merkezli yaklaşımına değer katılmaya değer. Kodu GitHub'da bulabilir, sonuçlar güçlü, ve felsefe taze: gereken tek şey bir terminal.

Read in other languages:

RU BG EL CS UZ SV FI RO PT PL NB NL HU IT FR ES DE DA ZH-HANS EN