AI 能做的,别再用 Token 喂它
AI 写代码的怪现象
现在很多人用 AI 辅助开发,却发现越用越费。团队花大力气搭了一堆流程,让模型去执行本该由代码直接完成的固定操作:跑命令、查文档、做检查。结果 token 烧得飞快,输出还不稳定,开发者还得盯着,生怕 AI 漏掉哪一步。
这就像请了个高薪顾问来帮你按灯开关——能做,但值得吗?
盲目交活的代价
你让 LLM「跑 SonarQube、看结果、提修复建议」,其实等于要求它同时完成这些事:
- 记住你的技术栈和代码规范
- 猜对该用哪条命令
- 读懂原本不是给人看的输出
- 判断下一步该做什么
- 别乱编出不存在的工具
每一步都可能出错。出错就得重来,token 继续烧。你最后得到的,是一个「看起来聪明、实际靠不住」的系统。
把确定性还给代码
解决办法其实很朴素:把确定性的事情,交给真正的代码去做。
与其让 AI「负责代码审查」,不如写个扩展,让它:
- 自动识别项目结构,不用猜
- 每次执行结果都一致
- 算力消耗可预估,而不是靠运气
- 给 AI 喂入已经验证过的数据
这样 AI 就不用再去「猜」CI/CD 跑完是什么结果,而是直接拿到准确信息,专注做它擅长的分析和判断。
别抄别人的流程
最危险的做法是直接复制别人的 AI 工作流。别人的约束、栈、习惯,未必适合你。
就像管理 dotfiles 一样——可以看看别人怎么搭,但最终要自己改出适合的版本。最小工具集就够了:读、写、编辑、执行 shell。剩下的逻辑和扩展,全由自己来写。
只有自己写的代码,出问题时你才知道原因在哪。
三个省 token 的实用方法
缓存要用对地方。 每次对话都会重复发系统提示、技能和工具定义。合理利用 prompt caching,再配合专门的压缩工具(比如 caveman),能大幅减少重复开销。
命令列表要精简。 如果 AI 面前摆着一长串工具,它很容易挑错。把冗长的工具清单换成简短的命令列表,选项少了,犯错概率也低。
本地压缩,别靠模型。 用本地工具做结构化精简,比让模型「帮我写得更简短」更快、更省钱。VCC 就是这种做法,不调用额外 API,也不会丢上下文。
真正的收益
有开发者把原本复杂的 agent 流程,换成确定性扩展后,从公司内部的 token 消耗榜单上掉了下来——不是因为干得少,而是因为把浪费的部分砍掉了。
这才是关键:不是少用 AI,而是把 AI 用在真正需要判断的地方,而不是让它做本该写死在代码里的决定。
对你项目的启发
不管你是自己搭开发流程,还是在评估像 NameOcean Vibe Hosting 这类带 AI 的托管服务,都可以问自己:
- 我现在让 AI 做的,是不是其实确定性任务?
- 能不能换成脚本、API 或扩展?
- 我是不是在为「验证一致性」这种事额外付费?
未来的 AI 开发,不是堆更多 agent,而是让 agent 清楚自己该做什么、不该做什么。