A Verdade Sobre Agentes de IA para Código: O Que 6 Mil Sessões Reais de Devs Revelam
A Verdade Sobre Agentes de IA para Código: Lições de Mais de 6 Mil Sessões Reais de Devs
Todo mundo fala que agentes de IA vão revolucionar a programação. Menos código manual. Entregas mais rápidas. Deixe a máquina cuidar do básico.
Mas ninguém analisava o que os devs de fato fazem com essas ferramentas. Até agora.
O dataset SWE-chat registrou mais de 6 mil sessões reais de programação com IA em ambientes de produção. Os resultados surpreendem, incomodam e derrubam mitos sobre como humanos e IA trabalham juntos no código.
O Boom do "Vibe Coding" e o Alerta dos Especialistas em Segurança
Os dados mostram três padrões claros de interação:
- Modo só humano (22,7%): IA explica, mas o dev escreve tudo
- Modo colaborativo (36,5%): Troca de ideias, refinamentos mútuos
- Vibe coding (40,8%): IA gera quase tudo; dev só aprova
Esse último explode. Em três meses, dobrou e virou o mais usado.
O problema? Commits de vibe coding trazem 9 vezes mais vulnerabilidades de segurança que código escrito só por humanos.
Pense nisso. Delegar tudo à IA acelera, mas multiplica falhas graves. Todo modo adiciona mais riscos do que resolve, mas vibe coding é o pior.
A Realidade Incômoda: Mais da Metade do Código de IA Vai para o Lixo
Se devs adoram essas ferramentas, por que 55,7% do código gerado pela IA nunca entra em produção?
Eles interrompem ou rejeitam em 44% das interações. Já a IA pergunta para esclarecer em só 1,4% dos casos.
É como um papo onde um fala sem ouvir o outro.
Devs usam IA para testar ideias rápido e explorar opções, não para copiar e colar. Ferramentas viram "patos de borracha turbinados": a maioria das sugestões some, só as boas sobrevivem.
O Que Devs Querem de Verdade da IA
Surpresa: o pedido número 1 não é gerar código — é entender código.
19% das prompts pedem explicações de código existente, mais que geração. IA vira ferramenta de engenharia reversa, geradora de docs e aceleradora de onboarding em bases desconhecidas.
Vendemos "escreva menos", mas devs pedem "me ajude a compreender".
O Problema do "Nitpicker Expert"
47% dos usuários de vibe coding são "nitpickers experts": devs que ficam de olho em tudo, corrigindo detalhes mínimos.
Isso é pouco eficiente. Se vai revisar linha por linha, por que não colabora? Dados mostram que modo colaborativo equilibra segurança, custo e satisfação melhor.
Esses experts perdem tempo em retornos decrescentes. Gastam energia revisando o que poderiam codar sozinhos — só mais devagar.
Exemplos Reais de Fracasso
O dataset tem sessões que deram errado. Um dev pediu fix em animações lentas de app iOS. A IA mexeu no stagger de cards individuais, ignorando a animação do container.
Após várias correções, nada resolvido. Sem commit. IA falhou no contexto espacial e na priorização.
Outro caso: um nitpicker expert em micro-ajustes nonstop — "não crie função separada", "inline o UUID", "mude o nome da constante". O dev virou mais reviewer que programador.
Lições para Sua Equipe
Avaliando agentes de IA? Dados indicam:
Priorize compreensão, não geração: IA brilha explicando e documentando, mais que criando do zero.
Fique no colaborativo: Os 36,5% de sessões com ida e volta acertam em segurança, eficiência e satisfação. Vibe coding atrai, mas arrisca demais.
Reserve tempo para revisão: Use Semgrep, Snyk ou similares em código de IA. O salto de 9x em vulnerabilidades é real, em produção.
Meça o que vai ao ar: Como no dataset, descarte 55% das sugestões. Não é defeito — é o uso certo. Avalie acertos, não volume.
O Panorama Geral
O valor do SWE-chat está na crueza. Captura devs reais, fluxos reais, escolhas reais com IA.
Desmascara o hype excessivo. Não é IA codando sozinha. É devs usando máquinas como ferramentas de pensamento interativo, jogando fora a maioria, ficando no controle.
Agentes são potentes. Não mágicos. Quem vence trata IA como parceiro, com ceticismo e engajamento ativo.
Os dados confirmam.
Quer ir mais fundo? O dataset SWE-chat é público. Se constrói ferramentas sobre IA, use esses padrões para guiar seu roadmap. Entender o uso real vale mais que apostas.