AI 能做的，别再用 Token 喂它

五月 25, 2026 ai development token optimization deterministic workflows ai coding agents developer productivity prompt engineering llm efficiency

AI 写代码的怪现象

现在很多人用 AI 辅助开发，却发现越用越费。团队花大力气搭了一堆流程，让模型去执行本该由代码直接完成的固定操作：跑命令、查文档、做检查。结果 token 烧得飞快，输出还不稳定，开发者还得盯着，生怕 AI 漏掉哪一步。

这就像请了个高薪顾问来帮你按灯开关——能做，但值得吗？

你让 LLM「跑 SonarQube、看结果、提修复建议」，其实等于要求它同时完成这些事：

每一步都可能出错。出错就得重来，token 继续烧。你最后得到的，是一个「看起来聪明、实际靠不住」的系统。

解决办法其实很朴素：把确定性的事情，交给真正的代码去做。

与其让 AI「负责代码审查」，不如写个扩展，让它：

这样 AI 就不用再去「猜」CI/CD 跑完是什么结果，而是直接拿到准确信息，专注做它擅长的分析和判断。

最危险的做法是直接复制别人的 AI 工作流。别人的约束、栈、习惯，未必适合你。

就像管理 dotfiles 一样——可以看看别人怎么搭，但最终要自己改出适合的版本。最小工具集就够了：读、写、编辑、执行 shell。剩下的逻辑和扩展，全由自己来写。

只有自己写的代码，出问题时你才知道原因在哪。

缓存要用对地方。 每次对话都会重复发系统提示、技能和工具定义。合理利用 prompt caching，再配合专门的压缩工具（比如 caveman），能大幅减少重复开销。

命令列表要精简。 如果 AI 面前摆着一长串工具，它很容易挑错。把冗长的工具清单换成简短的命令列表，选项少了，犯错概率也低。

本地压缩，别靠模型。 用本地工具做结构化精简，比让模型「帮我写得更简短」更快、更省钱。VCC 就是这种做法，不调用额外 API，也不会丢上下文。

有开发者把原本复杂的 agent 流程，换成确定性扩展后，从公司内部的 token 消耗榜单上掉了下来——不是因为干得少，而是因为把浪费的部分砍掉了。

这才是关键：不是少用 AI，而是把 AI 用在真正需要判断的地方，而不是让它做本该写死在代码里的决定。

不管你是自己搭开发流程，还是在评估像 NameOcean Vibe Hosting 这类带 AI 的托管服务，都可以问自己：

未来的 AI 开发，不是堆更多 agent，而是让 agent 清楚自己该做什么、不该做什么。

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL HU IT FR ES DE DA EN