Agentes web que vivem no terminal: do navegador ao código sem sair do prompt
Agentes Web que Escrevem Código: Por Que o Terminal Está Substituindo o Navegador
A maioria das ferramentas de automação web funciona de um jeito só: o agente controla um navegador aberto, clica, preenche formulários e segue em frente. Parece natural, mas essa abordagem carrega um problema estrutural que limita o que os agentes conseguem fazer.
Sessões Longas, Problemas Maiores
Quando um agente fica preso a uma única sessão de navegador, tudo vira sequência. Um erro no meio do caminho significa refazer tudo. Além disso, o histórico cresce sem parar, os casos de borda se acumulam e fica difícil reutilizar qualquer coisa que foi feito.
Isso gera três dificuldades concretas:
- Acúmulo de estado: quanto mais tempo a sessão dura, mais difícil fica entender o que está acontecendo
- Depuração complicada: não dá para isolar uma etapa sem afetar as outras
- Falta de reaproveitamento: cada tarefa começa do zero, mesmo que problemas parecidos já tenham sido resolvidos
Webwright: Navegadores Descartáveis, Código que Fica
A proposta do Webwright é inverter essa lógica. Em vez de manter um navegador vivo durante toda a execução, o agente cria instâncias novas conforme a necessidade. Ele inspeciona, extrai o que precisa e descarta. O que realmente importa não é o navegador — é o código, os logs e os arquivos que sobram no ambiente local.
A ideia central é simples: o navegador vira uma ferramenta temporária. O produto final é o script que o agente escreve para usar essa ferramenta.
Três Princípios do Projeto
1. Código em vez de comandos isolados
Em vez de uma sequência longa de cliques e esperas, o Webwright incentiva a criação de funções reutilizáveis. Selecionar datas, preencher formulários, aplicar filtros — tudo vira código que pode ser test<|eos|>