AI Kodlama Aracıları Gerçeği: 6.000+ Geliştirici Oturumundan Neler Öğrendik?
AI Kod Yazma Ajanları Gerçeği: 6.000'den Fazla Geliştirici Oturumundan Neler Öğrendik
AI kodlama ajanlarının geliştirmeyi bambaşka bir seviyeye taşıyacağını hepimiz duyduk. Daha az kod yaz, daha hızlı yayına al, kalıp işleri makinelere bırak.
Ama kimse şu ana kadar gerçekten ölçmedi: geliştiriciler bu ajanlarla ne yapıyorlar?
SWE-chat isimli yeni bir veri seti, AI ajanlarını üretim ortamında kullanan 6.000'den fazla gerçek kodlama oturumunu takip etti. Bulgular büyüleyici, rahatsız edici ve yazılım geliştirmede insan-yapay zeka işbirliği hakkında bildiğimiz her şeyi sorgulatıyor.
"Vibe Kodlama" Çağı—Ve Neden Güvenlik Uzmanlarını Endişelendiriyor
Veri seti, insan-AI işbirliğinin üç farklı şeklini ortaya koymakta:
- Sadece insan modu (%22.7): AI açıklama yapar ama kod insanlar yazıyor
- İşbirlikçi mod (%36.5): Paylaşımlı yazarlık, ileri-geri iyileştirmeler
- Vibe kodlama (%40.8): Ajan hemen her şeyi yazıyor, insanlar sadece onaylıyor
Son kategori hızla büyüyor. Vibe kodlama oturumları sadece üç ayda iki katına çıktı ve artık en yaygın işbirliği deseni haline geldi.
İşte tuzak: vibe kodlamayla yapılan commitler, tamamen insan tarafından yazılan koddan 9 kat daha fazla güvenlik açığı içeriyor.
Bunu sindire bilelim. Geliştiriciler klavyeyi tamamen AI'ye verdiğinde, sadece daha hızlı kod göndermiyor—çok daha fazla güvenlik hatasıyla kod gönderüyor. Tüm modlar açıkları artıyor, ama vibe kodlama özellikle sorunlu.
Rahatsız Edici Gerçek: AI'nin Yazdığı Kodun Çoğu Atılıyor
Geliştiriciler AI ajanlarını bu kadar seviyorsa, neden ajanın oluşturduğu kodun %55.7'si hiç üretime girmemiş?
Veriler geliştiricilerin sürekli geri çekildiğini gösteriyor. AI etkileşimlerinin %44'ü kullanıcı müdahalesi veya reddedilmesiyle sonuçlanıyor. Bu arada ajanlar nadiren açıklayıcı sorular soruyor—geri çekilme yalnızca dönüşlerin %1.4'ünde oluşuyor.
Sanki bir kişi diğerini devamlı dinlemeden konuşan bir konuşma izliyorsunuz.
Desen çok net: geliştiriciler AI ajanlarını olasılıkları keşfetmek ve hızla yinelemek için kullanıyor, hands-off bir çözüm olarak değil. Bu araçları turbo güçlendirilmiş bir kauçuk ördek gibi görüyor, çoğu öneriri atıp vaadedenleri geliştiriyor.
Geliştiriciler AI'den Gerçekten Ne İstiyor
İşte sürpriz bir bulgu: geliştiricilerin AI ajanlarına promtt verme nedeni kod yazmak değil, kodu anlamak.
Tüm promptların %19'u ajanlardan mevcut kodu açıklamasını istiyor, kod yazma isteklerini geride bırakıyor. Geliştiriciler AI'yi tersine mühendislik aracı, dokümantasyon üreticisi, bilinmeyen kod tabanlarına hızlıca uyum sağlamanın yolu olarak kullanıyor.
Oysa biz bu araçları pazarlarken "daha az kod yaz" diyorduk, geliştiriciler aslında "daha iyi anlayışa yardım et" diyordu.
Uzman Nit-Picker Sorunu
Vibe kodlama kullanıcılarının %47'si araştırmacıların "uzman nit-picker" dediği tipte—her AI önerisini inceleyip, sık sık küçük detayları düzelten, aktif şekilde işin içinde kalan geliştiriciler.
Aslında bu verimsiz. Her satırı gözden geçirceksen ve düzelteceksen, neden vibe kodlama kullanıyorsun? Veriler çoğu geliştiricinin daha düşük risk ve daha iyi verimlilikle işbirlikçi mod tercih etmesi gerektiğini gösteriyor.
Uzman nit-picker'lar azalan verim elde ediyor. Kendileri yazabilecekleri AI kodunu incelemek için bilişsel enerji harcıyor—sadece daha yavaş yapıyor.
Gerçek Başarısızlık Örnekleri
Veri seti başarısız oturumları da içeriyor. Bir örnek: bir geliştirici bir ajanlardan iOS uygulamasındaki yavaş animasyonları düzeltmesini istedi. Ajan hep yanlış parametreyi değiştirmeye devam etti—bireysel kart sırasını container animasyonu yerine.
Birkaç düzeltmeden sonra oturum sonuç vermeden bitti. Hiç commit yok. Ajan mekansal bağlamı anlayamadı veya problemi çözeceğini sorunu belirleyemedi.
Başka bir oturum da uzman bir nit-picker'ın merhametsiz mikro-düzeltmeleriyle boğuştuğunu gösteriyor: "ayrı bir fonksiyon oluşturma," "UUID çağrısını inline yap," "bu sabiti yeniden adlandır." Geliştirici daha çok kod gözlemcisidir.
Takımınız İçin Bu Ne Anlama Geliyor
AI kodlama ajanlarını takımınız için değerlendiriyorsan, veriler şunları gösteriyor:
Ajanları anlama için kullan, yazım için değil: Kod oluşturmaktan daha iyi kod açıklıyor. Yaratımdan daha iyi dokümantasyon sağlıyor.
İşbirlikçi moda sadık kal: Ileri-geri iyileştirme içeren %36.5'lik oturumlar güvenlik, verimlilik ve geliştirici memnuniyeti açısından ideal balansı sağlıyor. Vibe kodlama çekici görünüyor ama kabul edilemez risk taşıyor.
Gözden geçirme masrafını planla: AI tarafından yazılmış kodu kullanırsan, güvenlik incelemesi için zaman ayır. Semgrep, Snyk veya benzer araçları çalıştır. %9 oranındaki açık artışı teorik değil—şu anda üretimde oluyor.
Gerçekten yayına çıkanları ölç: Bu veri setindeki geliştiriciler gibi, AI önerilerinin %55'ini muhtemelen atacaksın. Bu başarısızlık değil—araç çalışıyor. Ajanları çıktı hacmi değil, başarı oranıyla değerlendir.
Daha Geniş Resim
SWE-chat'ı değerli kılan sadece rakamlar değil—dürüstlüktür. Bu veri seti gerçek geliştiricileri gerçek iş akışlarında, AI kodu hakkında gerçek kararlar alırken yakalar.
AI ajanları etrafındaki anlatının aşırı iyimser olduğunu gösteriyor. Gözetimsiz makineleri kod yazarken izlemiyoruz. Geliştiricileri makineleri etkileşimli düşünme araçları olarak kullanırken izliyoruz, çoğu öneriyi atıyor, her kararda derin düzeyde yer alıyor.
Ajanlar güçlü. Ama sihirli değildir. Bu çağda başarılı olacak geliştiriciler vibe kodlamaya teslimiyet olanlar değil—AI'yi işbirlikçi bir ortağı olarak gören, şüpheci kalan ve aktif olarak ilgili olanlar.
Veriler bunu kanıtlıyor.
Daha derine dalmak ister misin? Tam SWE-chat veri seti herkese açık, ve AI ajanları üzerinde araç geliştiriyorsan, burada ortaya çıkan etkileşim desenleri ürün yol haritanı için dikkate alınmalı. Geliştiricilerin bu araçları gerçekte nasıl kullandığını anlamak her zaman tahmin etmekten daha iyi.