AI-aikakauden arvio-ongelma: Miksi vaistosi voi olla oikeassa
Arvioinnin haasteet AI-avusteisessa koodauksessa
Muistatko ajan, kun pystyit sanomaan projektipäällikölle suoraan: "Tämä toiminto on valmis kahdessa viikossa"? Nykyään se tuntuu menneiltä ajoilta. Agenttipohjainen koodaus – jossa AI ei vain täydennä koodia vaan suunnittelee ja toteuttaa ratkaisuja – on sekoittanut kaikki perinteiset aikatauluarviot.
Vanha kaava, joka toimi sentään suuntaa-antavasti
Aiemmin kehitys nojasi pelkkään ihmistyöhön. Arviointi seurasi yksinkertaista kaavaa:
- Koodipohjan tuntemus + Suunnittelun monimutkaisuus + Kirjoitusnopeus + Testaus- ja korjausaika = Arvioitu aikataulu
Tiesit koodipohjan sudenkuopat. Authentikointi toimi moitteetta, mutta tietokantaskema oli sotku. Laskit tunnit refaktorointiin, edge caset ja päivittäisen tuottavuuden. Arviot lipsuivat 20–40 prosenttia, mutta ne osuivat suuntaan.
AI-agentit muuttaavat pelin säännöt
Käytä samaa tehtävää AI-koodausassistentin kanssa. Muuttujat menevät sekaisin:
Ymmärtääkö se koodipohjasi heti? Riippuu dokumentaatiosta, konteksti-ikkunan koosta ja mallin soveltuvuudesta teknologiaasi.
Ehdottaako se parhaan ratkaisun kerrasta? Jos malli osuu napakasti, homma hoituu tunneissa. Jos tarvitaan iterointia ja prompttien viilausta, päiviä menee.
Paljonko sinun pitää korjella? AI-koodi vaatii usein räätälöintiä, tietoturvan tiukennusta ja integrointia, jota agentti ei osannut ennakoida.
Totuus on tämä: Liikaa hallitsemattomia tekijöitä kehittäjän näkökulmasta.
"Vibrausarvioiden" salaisuus
Moni kehittäjä vaikenee tästä: teemme enemmän fiilispohjaista arviointia kuin myönnämme. Siis:
- Arvioimme AI:n vasteajan sijaan toiminnon monimutkaisuuden.
- Toivomme, että malli tajuaa asian kerrasta, emmekä varaudu kierroksiin.
- Aliarvioimme AI-koodin liittämistä vanhaan systeemiin.
- Liioittelemme kykyämme bongata hallusinaatioita tai tietoturva-aukkoja nopeasti.
Ei laiskuutta – perinteiset työkalut eivät sovi tähän maailmaan.
Mitä käytännössä toimii
Kamppailetko aikataulujen kanssa? Kehittäjät vannovat näihin:
1. Mitata AI:n perustoimivuus ensin
Testaa pieniä toimintoja workflow'ssasi. Kroonaa inferenssiaika, iterointikerrat ja korjaukset. Saat dataa, ei arvauksia.
2. Erottele ihmistyö ja koneaika
Älä arvioi yhtenä klokkina. Jaa osiin:
- AI-aika: Prompttaus, inferenssi, ensituotos.
- Ihmisaika: Koodin tarkistus, tietoturva, refaktorointi.
- Integrointiaika: Liittäminen systeemeihin, testaus, debuggaus.
Näin arvioit hallitsemiasi osia tarkemmin.
3. Rakenna kontekstipaketit
AI kompuroi ilman taustatietoa. Käytä 2–3 tuntia arkkitehtuuridokuihin, koodisääntöihin ja esimerkkeihin. Tulokset paranevat, iterointia vähemmän – kokonaisaika lyhenee.
4. Hyväksy epävarmuus puskureilla
Unohda tarkat luvut. Sano "3–8 päivää mallin tehokkuudesta riippuen" 5 päivän sijaan. Rehellisempää ja hyödyllisempää.
5. Seuraa ja viilaa prosessia
Jokaisella tiimillä oma paras workflow. Jotkut diggaavat syviä promptteja, toiset iterointia. Mittaa stackillesi ja tiimillesi, päivitä arviot tulosten perusteella.
Laajempi näkökulma
Epämukavuutesi ei tarkoita virhettä. Se kertoo, että softan arvioinnin pohja muuttuu. Siirrymme kysymyksestä "Kuinka kauan ihmisiltä menee koodata?" muotoon "Kuinka kauan AI:lla menee ymmärtää, ehdottaa ja ihmisillä validoida/integroida?"
Ennustettavuus heikkenee, koska tekijät vaihtelevat:
- Mallin laatu ja nopeus.
- Ongelman sopivuus koulutustietoihin.
- Koodipohjan dokumentaatio.
- Tiimin ohjaustaidot AI:lle.
Positiivinen puoli
Toisaalta: kun AI osuu kerrasta – ja se tapahtuu yllättävän usein – toimitus lyhenee viikoista päiviin. Vaihtelu kasvaa, mutta keskimääräinen tahti kiihtyy.
Tunnusta vaihtelu, mittaa se ja päivitä mielikuvat.
Jatkossa menestyvät näin
Menestyjät eivät pidä kiinni vanhoista tavoista. He:
- Myöntävät arvioinnin sotkuisemmaksi.
- Mittaavat AI-workflow'taan pakkomielteisesti.
- Kehittävät kontekstia ja promptteja.
- Antavat leveämpiä mutta rehellisiä haarukoita.
- Keskittävät nopeaan toimittamiseen ja oppimiseen.
Fiilispohjaisuus ei ole bugi – se on uusi normaali älykkäässä kehityksessä, jossa arvioimme koneen rinnalla.