Proč AI kódovací agenti potřebují lepší plány (ne lepší modely)
Paradox AI v programování: Proč kód zpočátku září, pak se ztrácí
Použil jste v posledních letech Claude nebo ChatGPT na psaní kódu? Tyto nástroje píšou funkční řešení rychleji než většina lidí. Zvládnou refaktoring přes více souborů, vygenerují testy a poslouchají složité pokyny i v cizím kódu. První pull request od AI vypadá jako od profíka.
Pak přijde desátý.
A najednou se to mění. Kód běží, testy projdou. Ale chyba handling je příliš optimistický. Názvy funkcí se rozjíždějí. Objevují se duplicitní abstrakce vedle starých. Každá změna sama o sobě dává smysl. Společně ale ničí celkovou strukturu kódu.
Není to chyba modelu. Je to o tom, jak je používáme.
Hlavní problém: Jak přesně říkáte, co chcete
Výzkumy to potvrzují: když AI překročí určitou úroveň, kvalita kódu závisí jen na tom, jak úplné jsou vaše specifikace.
Představte si to jednoduše. Dáte modelu detailní zadání – s chybami, názvy, architekturou, stavy a okrajovými případy – a dostanete čistý kód. Napíšete jen „přidej autentizaci“, a výsledek funguje, testy projdou, ale zavádí skrytý dluh.
Model se nehloupne. Jen nedostane plnou informaci.
Proč se přesnost ztrácí
Mezera mezi běžnou řečí a spustitelným kódem se zdá malá, ale rychle roste:
Přirozený jazyk je volný. „Přidej autentizaci“ skrývá spoustu rozhodnutí. Jaký model identity? Co s expirovanými tokeny? Role nebo atributy pro přístup? Kde kontrolovat práva? Co logovat? Jaké chyby ukazovat klientům? Jak to zapojit do databáze, API a testů?
Člověk se zeptá. AI vyplní mezery z tréninku – logické, ale jen lokálně. Tyto volby se usadí v kódu neviditelně.
Kódování má pravidla, prompt ne. Kompilátor a testy vás nutí být přesný. Prompt ale pojme nejasnost. Model neřekne „to nestačí“. Prostě doplní a pokračuje.
Výsledek? Z přísného kódu přejdete do volného textu, ale výstup musí být přísný. Nejasnost se schová v architektuře.
Velký rozsah ničí konzistenci. I s dokonalým zadáním je těžké udržet souhru přes desítky souborů. Kontext má limity. Model volí, co si pamatovat. Chyby se hromadí.
Důkaz: Studie od Alibaba
Není to teorie. Alibaba testovala 18 AI modelů na 100 reálných projektech po 233 dní a 71 commitů. 75 % agentů zhoršovalo kvalitu rychleji a rychleji. Každý commit fungoval, testy OK. Ale poruchy starých testů rostly.
Modely se nerozpadaly. Kódové báze ano. Lokálně super, globálně chaos.
Co to znamená pro vaši práci
Používáte AI v praxi? Zde jsou tipy:
Berte AI jako juniora, ne architekta. Čím detailnější zadání, tím líp. Pište:
- Dokumenty o architektuře před promptem
- Strategie pro chyby jasně
- Pravidla názvů a vzorů
- Co recyklovat z existujícího
- Stavy a okrajové případy
- Testovací plán
AI zesiluje vaši architekturu. Čistý kód? Prodlužuje ho. Chaos? Zrychlí ho.
Review je nutnost. Lidé musí chytit skryté předpoklady.
Git historie jako specifikace. Každý commit má vyprávět o záměru.
Šance v tom
Dobrá zpráva: Problém není v modelech. Dokážou skvělý kód s plným zadáním.
Klíč k úspěchu? Lepší specifikace – docs, prompty, review. To se dá naučit a zlepšuje se.
Vaši AI agenti nejsou vadní. Jen podspecifikovaní. Opravte to a uvidíte.
Pro uživatele NameOcean
Stavíte na NameOcean cloud s AI? Specifikace jsou klíčové. Dokumentujte domain routing, DNS propagation, SSL management a API design před promptem. Přesné plány zajistí, že AI kód perfektně zapadne do vaší deployment pipeline.