一键陷阱：AI 编程助手如何瞬间被攻破

五月 08, 2026 ai security coding tools vulnerability research devsecops mcp protocol claude code supply chain security

信任陷阱：一键搞定你的AI编程助手？

咱们开发者都这样。clone个仓库，可能是同事的项目，开源库，或者教程里的代码片段。随便扫一眼，本地跑跑，就继续干活。这太正常了。可最近Adversa AI的研究项目TrustFall爆出，AI编程工具也沾上了这坏习惯，成了大漏洞。

研究发现，四大AI编程工具都有致命问题：它们会自动跑项目里的辅助程序。只需弹个“信任这个文件夹？”对话框，默认就是yes。

咋回事呢？

这些工具用Model Context Protocol (MCP)，让AI跟外部工具聊天，比如数据库连接器、linter、自定义脚本。挺实用的。但这些工具定义在项目自己的配置文件里。

你打开仓库，按回车确认信任，它不光索引代码，还直接启动那些程序。用你的全部权限跑。

一键而已。

恶意辅助程序能：

关键是，这发生在AI还没思考代码之前。开机就自动执行。

攻击超简单——就两个小JSON文件。一个伪装成无害linter，从网上下payload执行。另一个自动批准。仓库看起来空空的，检查都难发现。

用户体验直接坑安全。看看开发者真看到的：

Claude Code (v2.1+)： “快速安全检查：这是你自己的项目还是信任的？” 默认Yes。以前版本有第三选项——信任但禁用MCP，现在没了。

Gemini CLI：至少列出helper名字，让细心人检查。

Cursor CLI：MCP提得含糊。

Copilot CLI：通用信任提示，MCP提都不提。

全默认信任。

领头研究员Rony Utevsky说：问题不光是漏洞。开发者点yes时，根本不知道同意啥。

用Claude Code在CI服务器上——Anthropic官方GitHub Action——连对话框都没。headless模式直跑。

结果：

Adversa AI发了PoC，直接偷环境变量。这不是纸上谈兵，是真攻击。

企业用Claude Code？唯一招：Managed scope。

IT统一推配置，全员禁用项目级MCP自动批准。一键搞定。

问题是，大多数公司没用。设置也不直观，新手开发者更懵。

Anthropic看了TrustFall报告，说点“信任文件夹”就是同意项目一切，包括MCP。从他们威胁模型看，信任后执行是正常边界。

Adversa AI没说他们模型错。就问对话框真告知用户了吗？

（Anthropic没再回应。）

这漏洞提醒我们：AI工具牛逼，就因为钻进你开发环境的深处。 力量大，责任也大。

用Claude Code、Gemini CLI、Cursor或Copilot CLI？

TrustFall戳中痛点：开发里，方便和安全总打架。 默认yes是因为大多数项目可信。但现在谁都能clone谁的代码，这赌注下得太草率。

工具该支持MCP和helper？必须的，超有用。问题是“信任项目”和“跑任意代码”间的界面清不清楚。

现在？不清楚。开发者、团队、厂商都得动起来。

你咋管工具安全？ 遇过让你犯嘀咕的信任框吗？AI工具安全话题刚起步。来聊聊吧。

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL HU IT FR ES DE DA EN