AI Agent Policy 的缺失一环:.well-known/agent-policy.json 如何重塑网页自动化
没人聊的AI代理注册难题
你知道robots.txt吧?从1994年起,它就管着爬虫去哪儿、不去哪儿。还有llms.txt给AI模型指路,.well-known/security.json报漏洞用。可缺口在这儿:网站怎么告诉AI代理,“行,你能帮用户注册账号,但得按这些规矩来”?
这事儿超重要。2026年,AI代理不光看网页了。它们替真人填表、注册、试API、搞免费试用。从服务器看,这跟垃圾spam没两样。难怪网站和代理开发者都迷糊。
老标准为啥不行
说实话,现在的“政策文件”太散。
robots.txt管爬虫权限llms.txt给AI模型用指南sitemaps列网址给索引OpenAPI和MCP露接口security.txt指漏洞报告人
没一个管注册账号。这是个大漏洞。因为注册不是随便逛逛,它会:
- 改你平台的永久数据
- 可能踩雷限流或反作弊
- 搅乱你的注册数据和漏斗分析
- 绑用户进你的服务条款
- 搞出意外行为
不能简单说“是/否”。风险高,用法多。
新提案:Agent Policy Manifest
有个实验提案——/.well-known/agent-policy.json。放网站根目录的机器文件。像细粒度权限系统给AI代理。
亮点不是简单允许/拒绝。是权限层级。
它不问“代理能注册吗?”而是分层说:
- 公开浏览能干啥?(看页、跟链接、查价格)
- API访问要啥?(沙盒、测试模式、官方代理流程)
- 用户授权注册条件?(真人意图验证、身份透明、审计记录)
- 啥时候必须停?(要付费、假身份、重大条款)
权限层级咋玩
假设你有SaaS平台。你的agent-policy.json可能这样:
公开探索模式:默认开。代理能看文档、定价、功能列表。
声明自动化模式:只走官方API或沙盒。
用户授权注册模式:有条件。代理能建试用账号,前提:
- 真人意图验证过(非纯自动化)
- 代理身份明明白白(不冒充人)
- 邮箱像
user+agent-{domain}@example.org(能追) - 你留审计日志给用户看
- 遇付费或重大条款就停
关键分清:
- 常规勾选(如“我同意隐私政策”):披露下就能过
- 重大条款(法律免责、付费义务):必须真人确认,停!
提案架构
真实agent-policy.json长这样:
开头元数据(版本、域名、到期日)。然后分块。account_creation块最牛。
里面定:
- 默认模式(没文件时代理咋想)
- 可用模式和条件
- 条款接受怎么记
- 硬停触发啥
硬停值得看:
- Captcha或反机器人
- 条款禁自动化账号
- 要假身份
- 付费方式
- 手机验证
- 公开发帖或消息
- 重大责任接受
- 未知条款影响
代理遇硬停,就停手,让真人接管。
代理处理规则
提案给代理清规:
没文件? 只公开探索。看、总结,别注册。
文件明确允许? 按指定块和限走。记文件URL和真人。
常规勾选? 政策准且披露、日志,就能过。
重大条款? 立马停。别让代理替人担责、付钱或签商务条款。
开发者为啥在意
建AI代理?这标准是灯塔。不用每个平台写死代码,你能:
- 先查文件
- 统一解析层级
- 没政策用安全备选
- 建用户信得过的审计轨迹
运营平台?这给你精细控:
- 鼓励代理帮注册,不丢安全
- 不同用户不同政策
- 合规留审计
- 明示边界给代理
用户呢?透明。你看清代理能替你干啥,审计日志你管。
实验阶段:下一步
这是wkdomains.com的草稿。域名主、bot开发者、标准人、代理建手来讨论。实验中,会变、更好,或换掉。
提案2026年11月1日到期。促快迭代,别急标准。
大格局
拐点来了。AI代理变“委托用户”,不只是爬虫。网页权限没跟上。robots.txt行因动机简单:搜索引擎想爬,发布者要曝光。
代理注册?动机复杂。平台要安全,用户要透明,代理要护栏。agent-policy.json不完美,但给共同语言。
平台若准代理注册,考虑发政策。建代理的,先查。爱标准的开发者,现在发言好时机。
不这么干?继续猜。聪明代理时代,猜可不行。