Reality Check Week: AI-coding botst hard op beveiligingsmuur
Week van de Realiteit: AI-Coding Botst op Beveiligingsmuren
Eind april 2026 kreeg de wereld van AI-ondersteund programmeren een harde les. We hebben krachtige tools neergezet, maar beveiliging hinkt achterop. Vijf grote onthullingen en onderzoeken schetsen een branche die worstelt met razendsnelle innovatie en opgebouwde schulden.
Die Zorgwekkende Cijfers
Het belangrijkste getal dat je wakker moet houden: 20% van apps uit AI-codingtools heeft serieuze beveiligingslekken. Geen theorie, maar live in productie, meldde Wiz Research op Google Cloud Next.
Onder de motorkap vind je rampspoed: kapotte toegangscontroles, openstaande data-endpoints, gelekte credentials in gegenereerde code. Duizenden apps lopen ermee rond, rechtstreeks overgenomen van hun AI-hulpen.
En let op: die 20% is waarschijnlijk nog gunstig. Ander onderzoek wijst op een nog slechtere score.
De Benchmark die Echt Zetelt: 23,8%
SecureVibeBench testte 105 programmeeruitdagingen, gebaseerd op echte kwetsbaarheden uit de OSS-Fuzz-database. AI's moesten problemen oplossen zonder de bekende CVE-fout te herhalen.
Vijf AI-agents deden mee: OpenHands, Claude Sonnet 4.5 en drie concurrenten. Topscore: 23,8% werkende én veilige code.
De rest – 76,2% – leverde rommel op: niet-werkende code, herhaalde lekken, of allebei.
Geen trucje. De test gebruikte echte fuzzing-tools voor dynamische checks, geen simpele linters. Denk aan overflows, bufferfouten en race conditions – bugs die CVEs worden.
Waar Komt Dit Vandaan?
Deze week viel een patroon op. Wiz bouwt scanners rechtstreeks in IDE's. Red Gate deelt een casestudy over vijf valkuilen in AI-databasecode, met Replit's productiedebacle als schoolvoorbeeld. Lovable gaf zelf toe: 10% van hun gegenereerde code deugt niet.
De bouwers erkennen het probleem en pakken het aan met controles.
Maar niet iedereen kan dat. Grotere spelers als Wiz, Red Gate en Vercel hebben scanning en guardrails. En de solo-ondernemer met Cursor voor een sideproject? Of de niet-tech CEO die interne tools 'vibe-codet'?
(Overigens: The New Stack interviewde C-level execs met 'LLM-only' ontwikkeling. Een CEO runt een BBS op 23 MB RAM, al een jaar zonder incidenten. Mooi verhaal, maar survivor bias?)
Het Ineenstorten van Vertrouwen
Forrester's analyse framet de Vercel/Context.ai-breach als logisch gevolg van scheve verantwoordelijkheid. Kritiekpunt: optionele labels voor 'gevoelige' environment variables duwen beveiliging op devs.
Dieperliggend: SaaS-randbeveiliging is illusie. Als je platform code genereert, secrets bewaart en logt – en devs een LLM vertrouwen – vervaagt de trust boundary.
Actie voor Jouw Stack
Bouw je met AI-coding? Pas je aanpak aan:
1. Ga uit van bugs in gegenereerde code. Test als bij een junior dev: SAST, dynamische scans, fuzzing.
2. Maak inventaris van AI-tools. Wiz's AI-BOM is slim: track models als Claude, Copilot, Cursor, Gemini. Ze verschillen in beveiliging en data.
3. Eis betere defaults. Handmatig labelen van secrets? Rode vlag. Beveiliging moet standaard aan, scanning automatisch.
4. Reken op die 76%. Met 23,8% succes, koppel AI aan reviews, static analysis en runtime protections. AI alleen is niet genoeg.
5. Focus op risicogebieden. Databases, auth en API's hebben de grootste impact. Begin daar.
De Positieve Spin
Dit is geen aanval op AI-ontwikkeling. CEO's als Moshe Bar en OutSystems' baas tonen aan: snelheid zonder kwaliteitsverlies lukt, mits je het inbouwt.
Sleutel: 'mits je het inbouwt'.
Dus:
- Scanners in je AI-IDE voor commits
- Auto-remediation via extensies
- Live lijst van AI-models en frameworks
- Test AI-code als externe libs
- Druk vendors op impliciete beveiliging
Wiz's Red Agent, Red Gate's patronen en SecureVibeBench zijn geen noodsignaal, maar broodnodige infra. Alleen: we bouwen het nu, náást massale uitrol.
Patroon van de week: late wake-up, snelle fix. Hoeveel apps slepen die 20% lekken mee?
De Kernpunten
Wiz op Google Cloud Next: Drie-in-één: Red Agent (aanvals-tests), AI-BOM (inventaris), inline scanning voor Lovable-code. Remediation nu native in Claude Code en Cursor. 20% AI-apps met lekken.
SecureVibeBench: 105 C/C++-tasks uit 41 OSS-Fuzz-projecten. Functionaliteit + beveiliging? Top: 23,8%. Rest faalt of herhaalt CVEs.
Red Gate Database-analyse: Vijf falende patronen in AI-dbcode. Voorbeelden: Replit-deletie, Lovable's 10% lekken.
CEO Vibe-Coding: Codenotary CEO bouwde BBS met 500 users, 23 MB RAM, nul incidents. OutSystems CEO testte Claude vs eigen platform.
Forrester's Frame: Vercel/Context.ai-breach eindigt SaaS-randdenken. Platforms die generatie, secrets en logs mixen, breken shared responsibility.
Deze week leerde ons: AI-coding werkt, boost productiviteit, en we leren – soms pijnlijk – het veilig te maken.