Costruire la fiducia negli AI agent locali: l’architettura OATs per uno sviluppo sicuro e osservabile

Costruire la fiducia negli AI agent locali: l’architettura OATs per uno sviluppo sicuro e osservabile

Mag 18, 2026 ai agents local models developer tools automation security open source coding agents infrastructure

Come costruire fiducia negli agenti AI locali: l’architettura OATs per uno sviluppo sicuro e trasparente

Stiamo vivendo un momento cruciale nello sviluppo assistito dall’AI. Modelli locali come FunctionGemma e Qwen sono ormai in grado di usare strumenti, eseguire codice e portare avanti flussi di lavoro complessi. Ma quanto più un agente diventa autonomo, tanto più diventa essenziale mantenere il controllo su ciò che fa.

Il rischio dell’automazione senza regole

Prova a immaginare questo scenario: dai all’agente il compito di rifare la struttura di un’applicazione e vai a dormire. Al mattino scopri che ha lanciato centinaia di tool call, modificato schemi di database, riorganizzato API e frontend. Il problema non è tanto quello che ha cambiato, ma il fatto che non esiste traccia chiara di quali decisioni abbia preso e se quelle modifiche fossero davvero sicure.

Un caso reale ha visto tabelle di database sparire da ambienti di test dopo una notte di lavoro dell’agente. Nessuna spiegazione, nessun log utile. Solo silenzio. È proprio in questi momenti che emerge il lato oscuro degli agenti autonomi: potenza senza governance diventa un rischio concreto.

OATs: un protocollo per rendere visibile e controllabile l’attività degli agenti

L’approccio Open Agent Tools (OATs) nasce proprio per risolvere questo problema. Invece di costruire soluzioni personalizzate per ogni progetto, offre un’architettura standard che mette insieme capacità e responsabilità.

L’idea centrale è semplice: tenere tutti gli strumenti approvati in un unico file JSON significa sapere esattamente cosa può fare un agente.

Delega intelligente tra modelli

L’architettura OATs non carica tutto su un unico modello grande. Piuttosto, distribuisce il lavoro in modo intelligente:

  • Un modello più grande analizza la richiesta e decide quali tool servono
  • L’esecuzione vera e propria viene delegata a modelli più piccoli e leggeri
  • Ogni chiamata viene registrata e resa consultabile

Questa divisione non è solo una questione di efficienza. Ha anche un impatto diretto sulla sicurezza. Un modello che si occupa solo di database vede solo gli strumenti relativi a quella attività. Questo riduce drasticamente l’area di rischio.

Oltre 141.000 tool: non devi usarli tutti

Il progetto OATs mantiene un indice pubblico che supera i 141.000 strumenti. L’apparente caos si trasforma però in un vantaggio: non devi adottare l’intero index. Puoi semplicemente selezionare ciò che ti serve e salvare le tue scelte in un file locale.

Ad esempio, per aggiungere un tool che permette di leggere da Open WebUI puoi inserire qualcosa di simile:

{
  "superhappy": {
    "description": "Read from Open WebUI knowledge collection",
    "implementation": "/local/path/to/read_knowledge.py",
    "permissions": ["read_only"],
    "approved_by": "security_team"
  }
}

Il modello di sicurezza OATs: log, revisione umana e distribuzione

Observability e audit trail

Ogni tool call viene registrato in modo reale e queryable. Il sistema si lässt integrare facilmente con Mattermost, dove gli agenti pubblicano automaticamente i loro log in real-time. Se qualcosa sembra sospellegio in piena notte, puoi intervenire subito.

Revisione umana per ogni tool

L’index di 141.000 strumenti è il punto di partenza.真正 la curation avviene attraverso la mano umana. 哪个 tool è sicuro? Qualcher tool è stato provato troppo spesso? 哪个 tool è per il frontend e quale per il database? 哪

Il processo di revisione è continuo. Se un tool diventa problematico, puoi rimuovere il suo accesso senza scrivere nuovo codice o retrainare un modello.

Distribuzione controllata

OATs permette di distribuire il lavoro su diversi modelli che possono runnare su GPU consumer. 哪个 modell ist zuständig für la database e quale per les API? 哪

Questa divisione crea confini naturali: ogni micromodelo ha un dominio specifico e un accesso limitato ai tool.

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL HU FR ES DE DA ZH-HANS EN