认识 Swival:AI 编程助手,和你的模型和谐共处
认识 Swival:AI 编程助手,跟你的模型合作,不添乱
AI 当编程搭档,听着很爽。但现实呢?API 费用蹭蹭涨,上下文窗口小得慌,还得死绑某个平台。
Swival 完全不一样。
它不逼你换生态。直接用你的基础设施、你的模型、你的限制。本地跑小 LLM?还是 API 调企业级大模型?Swival 都行,随你玩。
为什么开发者爱它
AI 会写代码是老黄历了。关键是:在你机器上、你的限制下,能稳稳写出来。
大多数工具假设你有无限上下文和顶级 GPU。Swival 专为现实设计:上下文超紧、本地硬件一般、模型得精心调才能出好活。
举例。新手开发者 MacBook Air 16GB RAM 跑 llama.cpp。独立创业用 Open Router 避锁死。安全团队要加密所有密钥再出门。Swival 全搞定,不用改你工作流。
实用功能,一看就懂
上下文管理,聪明不臃肿
别人一股脑塞提示词,上下文瞬间爆。Swival 用渐进压缩,聊天干净利落。跨会话记状态,不用每次重复喂 10k token 历史。
模型你挑,随便换
自动发现 LM Studio 或 llama.cpp 本地模型。还无缝接:
- HuggingFace
- OpenRouter
- Google Gemini
- ChatGPT(用你现有订阅的 OAuth)
- AWS Bedrock
- 任何 OpenAI 兼容服务器(Ollama、vLLM 等)
不怕涨价或断供。换模型?改个命令行参数,秒切。
安全默认开
加 --encrypt-secrets,密钥、凭证、敏感数据出门前加密。模型只见假引用。响应回来本地解密,工具照常跑。安全团队的最爱。
真学习,不忘本
用 BM25 检索,拉旧会话相关上下文。/learn 教它,它跨聊记住。不胀当前提示。像有个助手,慢慢懂你代码库。
审查循环 + 基准测试
内置 LLM 当裁判的审查循环。JSON 报告记时长、工具用量、上下文事件。比比不同模型、设置,在真任务上测。Qwen 3 Coder 和 GLM-5 哪个快?一键跑,数据全有。
安全审计,靠谱不瞎报
/audit 扫代码库,找真 bug。聪明在:隔离代理在独立工作树复现。问题不重现,不进报告。假阳性少,附真实补丁。
几分钟上手
超简单。以 LM Studio 为例:
# 1. 装 Swival
uv tool install swival
# 2. 跑任务
swival "简化 src/api.py 的错误处理"
就这。不折腾配置,不玩环境变量(除非你想调)。
本地 llama.cpp?指过去:
swival --provider llamacpp "重构这个认证模块"
HuggingFace 模型?导 token 指定:
export HF_TOKEN=hf_...
swival --provider huggingface --model zai-org/GLM-5.1 "加错误处理"
想多轮聊?空跑 swival,互动模式,全程记对话。
不止单模型
不止 CLI。Python 里直接 embed:
import swival
answer = swival.run(
"哪些文件管认证?",
provider="openrouter",
model="z-ai/glm-5",
)
复杂多轮?Session 类控状态和迭代。
还有 A2A 服务器模式。swival --serve,变 HTTP 端点。其他代理可呼。建代理网络,编排复杂任务超方便。
超易扩展
小巧、可 hack、无框架。纯 Python,看懂改动易。加自定义技能用 SKILL.md,接 MCP 服务器,拼代理。全开源代码,随你折腾。
基准测试神器
自带 Calibra 工具。比模型、设置、技能、MCP 服务器。在真编码任务上测。找最佳性价比 combo,宝。
总结
AI 编程代理已是标配。但不用锁死、泄私、不现实硬件。Swival 证明:能做有用代理,还尊重你限制、信你判断、适配你生态。
独狼省钱?创业护数据?团队要灵活?Swival 进工具箱吧。免费开源,即插即用。试不试?不试亏大。