Как встроить доверие в локальные AI-агенты: архитектура OATs для безопасной и прозрачной разработки
Как построить доверие к локальным AI-агентам: архитектура OATs для безопасной и прозрачной разработки
Мы стоим на пороге серьёзных изменений в разработке с помощью ИИ. Локальные модели вроде FunctionGemma и Qwen уже достаточно сильны, чтобы самостоятельно вызывать инструменты, запускать код и управлять реальными процессами. Но вместе с этой мощью появляется главная проблема: как дать агенту свободу действий и при этом сохранить контроль над тем, что происходит?
Проблема неограниченной автоматизации
Представьте, что вы попросили локального агента провести рефакторинг. Ушли спать, а утром обнаруживаете, что за ночь он выполнил сотни вызовов инструментов: изменил схему базы данных, перестроил API и переписал фронтенд. Проблема в том, что вы не видите причин этих изменений, не понимаете, что именно было сделано и насколько это безопасно.
Один из разработчиков столкнулся с реальной катастрофой: таблицы базы данных пропали в тестовых средах после ночной работы агента. Без объяснений. Без видимой причины. Просто исчезли.
Это обратная сторона автономных агентов — мощь без контроля превращается в риск.
OATs: протокол для стандартизации и безопасности
OATs (Open Agent Tools) решает эту проблему через единую архитектуру для работы агентов с инструментами. Вместо того чтобы каждому проекту строить свои механизмы вызова, OATs предлагает подход, который учитывает и возможности, и ответственность.
Основная идея проста: зафиксировать разрешённые инструменты в одном JSON-файле — и вы точно знаете, что агент сможет делать.
Как работает архитектура
OATs не пытается всё выполнять на больших моделях. Вместо этого используется разумное распределение задач:
- Большая модель (например, Qwen 35B) анализирует запрос и решает, какие инструменты нужны
- Реальное выполнение передаётся более компактным моделям вроде FunctionGemma, которые легко запускаются на старых GPU или даже на ноутбуках с RTX 3060
- Каждый вызов инструмента фиксируется в логах и доступен для анализа
Это не только экономит ресурсы — это ещё и способ ограничить зону риска. Каждый модель работает только с тех инструментами, что для не