AI 能做的,别再用 Token 喂它

AI 能做的,别再用 Token 喂它

五月 25, 2026 ai development token optimization deterministic workflows ai coding agents developer productivity prompt engineering llm efficiency

AI 写代码的怪现象

现在很多人用 AI 辅助开发,却发现越用越费。团队花大力气搭了一堆流程,让模型去执行本该由代码直接完成的固定操作:跑命令、查文档、做检查。结果 token 烧得飞快,输出还不稳定,开发者还得盯着,生怕 AI 漏掉哪一步。

这就像请了个高薪顾问来帮你按灯开关——能做,但值得吗?

盲目交活的代价

你让 LLM「跑 SonarQube、看结果、提修复建议」,其实等于要求它同时完成这些事:

  • 记住你的技术栈和代码规范
  • 猜对该用哪条命令
  • 读懂原本不是给人看的输出
  • 判断下一步该做什么
  • 别乱编出不存在的工具

每一步都可能出错。出错就得重来,token 继续烧。你最后得到的,是一个「看起来聪明、实际靠不住」的系统。

把确定性还给代码

解决办法其实很朴素:把确定性的事情,交给真正的代码去做。

与其让 AI「负责代码审查」,不如写个扩展,让它:

  • 自动识别项目结构,不用猜
  • 每次执行结果都一致
  • 算力消耗可预估,而不是靠运气
  • 给 AI 喂入已经验证过的数据

这样 AI 就不用再去「猜」CI/CD 跑完是什么结果,而是直接拿到准确信息,专注做它擅长的分析和判断。

别抄别人的流程

最危险的做法是直接复制别人的 AI 工作流。别人的约束、栈、习惯,未必适合你。

就像管理 dotfiles 一样——可以看看别人怎么搭,但最终要自己改出适合的版本。最小工具集就够了:读、写、编辑、执行 shell。剩下的逻辑和扩展,全由自己来写。

只有自己写的代码,出问题时你才知道原因在哪。

三个省 token 的实用方法

缓存要用对地方。 每次对话都会重复发系统提示、技能和工具定义。合理利用 prompt caching,再配合专门的压缩工具(比如 caveman),能大幅减少重复开销。

命令列表要精简。 如果 AI 面前摆着一长串工具,它很容易挑错。把冗长的工具清单换成简短的命令列表,选项少了,犯错概率也低。

本地压缩,别靠模型。 用本地工具做结构化精简,比让模型「帮我写得更简短」更快、更省钱。VCC 就是这种做法,不调用额外 API,也不会丢上下文。

真正的收益

有开发者把原本复杂的 agent 流程,换成确定性扩展后,从公司内部的 token 消耗榜单上掉了下来——不是因为干得少,而是因为把浪费的部分砍掉了。

这才是关键:不是少用 AI,而是把 AI 用在真正需要判断的地方,而不是让它做本该写死在代码里的决定。

对你项目的启发

不管你是自己搭开发流程,还是在评估像 NameOcean Vibe Hosting 这类带 AI 的托管服务,都可以问自己:

  • 我现在让 AI 做的,是不是其实确定性任务?
  • 能不能换成脚本、API 或扩展?
  • 我是不是在为「验证一致性」这种事额外付费?

未来的 AI 开发,不是堆更多 agent,而是让 agent 清楚自己该做什么、不该做什么。

Read in other languages:

RU BG EL CS UZ TR SV FI RO PT PL NB NL HU IT FR ES DE DA EN