Pravda o AI kódovacích agentech: Co odhalují tisíce relací skutečných developerů
Pravda o AI kódovacích agentech: Co odhalují data z více než 6 000 reálných session vývojářů
Všichni slyšíme sliby: AI agenti změní vývoj kódu. Méně psaní. Rychlejší nasazení. Robotům necháme rutinu.
Nikdo ale nedotýkal měřit, co vývojáři s těmito agenty opravdu dělají. Až teď.
Nový dataset SWE-chat zachytil přes 6 000 skutečných kódovacích session z produkčního prostředí. Výsledky jsou šokující, nepříjemné a burcují všechny představy o spolupráci člověka s AI v softwaru.
Vzestup "vibe kódování" – noční můra pro bezpečnostníky
Data ukazují tři hlavní styly spolupráce:
- Pouze člověk (22,7 %): AI jen vysvětluje, kód píše vývojář
- Spolupráce (36,5 %): Obousměrné vylepšování, sdílené autorství
- Vibe kódování (40,8 %): AI píše téměř vše, člověk jen schvaluje
Ten poslední exploduje. Za tři měsíce se zdvojnásobil a je teď nejběžnější.
Problém? Vibe kódy nesou 9x více bezpečnostních chyb než čistě lidský kód.
Přemýšlejte o tom. Když vývojáři předají klávesnici AI, jdou rychleji – ale s obrovskými bezpečnostními dírami. Každý styl přidává víc chyb, než řeší. Vibe kódování je pak katastrofa.
Nelíbilá realita: Většina AI kódu končí v koši
Proč, když vývojáři AI milují, nikdy nedostane do produkce 55,7 % jejich kódu?
Vývojáři neustále zasahují. V 44 % interakcí přerušují nebo odmítají AI. Agenti se ptájí na upřesnění jen v 1,4 % případů.
Je to jako rozhovor, kde jeden mluví a druhý ho ignoruje.
Vývojáři AI berou jako nástroj na zkoumání nápadů a rychlé iterace. Ne na plnoautomatické kódování. Používají je jako super gumičkové kachničky – většinu návrhů vyhodí, dobré vylepší.
Co vývojáři od AI opravdu chtějí
Překvapivý fakt: Nejčastější požadavek není napsat kód – je to vysvětlit ho.
19 % promptů žádá vysvětlení existujícího kódu. Překonává generování kódu. AI slouží k reverznímu inženýrství, tvorbě dokumentace nebo rychlému nástupu do cizích projektů.
Prodáváme je jako "méně psaní kódu". Vývojáři ale říkají: "Pomoz mi pochopit."
Past "expertních mravokrajců"
47 % lidí ve vibe kódování jsou "expert nitpickers" – vývojáři, kteří všechno kontrolují, opravují detaily.
To je neefektivní. Pokud budete recenzeovat každou řádku, proč vibe kódovat? Data radí spolupráci – lepší efektivita, nižší riziko.
Ti mravokrajci plýtvají silami na kontrolu kódu, který by napsali rychleji sami. Jen pomaleji.
Skutečné příklady selhání
Dataset má reálné neúspěšné session. Například: Vývojář chtěl opravit pomalé animace v iOS appce. AI pořád měnila špatný parametr – stagger karet místo kontejneru.
Po opakovaných opravách? Žádný commit. AI nepochopila prostorový kontext ani prioritu.
Další: Expert mravokrajcův říká: "Nefabrikuj funkci," "inline UUID," "přejmenuj konstantu." Spíš reviewer než programátor.
Co to znamená pro váš tým
Hodnotíte AI agentů? Tady jsou rady z dat:
Používejte na pochopení, ne psaní: Lepší vysvětlují kód než ho generují. Dokumentace nad tvorbu.
Držte se spolupráce: 36,5 % session s vylepšováním je ideál – bezpečné, efektivní, vývojáři spokojeni. Vibe kódování láká, ale riskuje vše.
Plánujte review: Na AI kód pusťte Semgrep, Snyk. 9x více chyb je realita v produkci.
Měřte, co se nasadí: Vyhodíte 55 % návrhů? To není chyba – to je účel. Hodnoťte úspěšnost, ne objem.
Širší pohled
SWE-chat není jen čísla – je upřímný. Chytá reálné vývojáře v reálných workflow, s reálnými rozhodnutími.
Odhaluje přehnaný optimismus kolem AI agentů. Ne píšou kód bez dozoru. Slouží jako interaktivní nástroje na myšlení, většinu návrhů vyhodíme, zůstáváme u kormidla.
AI jsou silné. Ale ne kouzelné. Úspěšní budou ti, kdo je berou jako partnery – se skepsí a aktivní rolí.
Data to potvrzují.
Chcete víc? Plný SWE-chat dataset je veřejný. Pokud stavíte na AI agentech, tyhle interakční vzory ovlivní vaši roadmap. Znát, jak vývojáři opravdu pracují, bije dohady.