附录 E:模型选型指南
不同模型有不同的特长和价格。这篇指南帮你根据需求选到最合适的模型。
📅 数据更新于 2026 年 4 月,价格以 OpenRouter 公开定价为参考(每百万 token 输入价格)。
按场景选模型
日常对话与通用任务
| 模型 | 提供商 | 上下文 | 价格 | 推荐度 |
|---|---|---|---|---|
| GLM-5.1 | 智谱 | 202K | $0.95/M | ⭐⭐⭐⭐⭐ |
| GPT-5.4 Nano | OpenAI | 400K | $0.2/M | ⭐⭐⭐⭐⭐ |
| Gemini 2.5 Flash | 1M | $0.3/M | ⭐⭐⭐⭐ | |
| DeepSeek V3.2 | DeepSeek | 128K | $0.26/M | ⭐⭐⭐⭐ |
| Qwen3.5 Plus | 阿里云 | 1M | $0.26/M | ⭐⭐⭐⭐ |
| MiniMax M2.5 | MiniMax | 128K | $0.118/M | ⭐⭐⭐⭐ |
编程开发
| 模型 | 提供商 | 特长 | 推荐度 |
|---|---|---|---|
| Claude Sonnet 4.6 | Anthropic | 代码理解、重构、Review | ⭐⭐⭐⭐⭐ |
| GPT-5.4 | OpenAI | 全能,长代码生成 | ⭐⭐⭐⭐⭐ |
| Qwen3 Coder Plus | 阿里云 | 代码生成,1M 上下文 | ⭐⭐⭐⭐ |
| GLM-5.1 | 智谱 | 性价比高,中文代码 | ⭐⭐⭐⭐ |
| DeepSeek V3.2 | DeepSeek | 代码推理强,价格极低 | ⭐⭐⭐⭐ |
复杂推理
| 模型 | 提供商 | 特长 | 推荐度 |
|---|---|---|---|
| Claude Opus 4.6 | Anthropic | 最强推理,1M 上下文 | ⭐⭐⭐⭐⭐ |
| GPT-5.4 Pro | OpenAI | 综合最强,1M 上下文 | ⭐⭐⭐⭐⭐ |
| o3 | OpenAI | 数学/逻辑推理专精 | ⭐⭐⭐⭐⭐ |
| Gemini 2.5 Pro | 长文档推理,1M 上下文 | ⭐⭐⭐⭐ |
本地部署(隐私优先)
| 模型 | 参数量 | 最低配置 | 推荐度 |
|---|---|---|---|
| Qwen3-14B-Instruct | 14B | 16GB RAM | ⭐⭐⭐⭐ |
| Llama4-Scout-8B | 8B | 8GB RAM | ⭐⭐⭐⭐ |
| DeepSeek-R1-7B | 7B | 8GB RAM | ⭐⭐⭐ |
| Qwen3-72B-Instruct | 72B | 48GB VRAM | ⭐⭐⭐⭐⭐ |
按预算选模型
免费方案
| 模型 | 提供商 | 限制 |
|---|---|---|
| GLM-4-Flash | 智谱 | 免费额度充足 |
| Gemini 2.5 Flash | 免费 API | |
| HuggingFace 开源模型 | HF | $0.1/月免费额度 |
| 本地模型 | 自建 | 完全免费 |
低预算(< $10/月)
| 模型 | 提供商 | 大致月费 |
|---|---|---|
| GLM-5.1 | 智谱 | ¥50-100 |
| GPT-5.4 Nano | OpenRouter | $2-4 |
| DeepSeek V3.2 | OpenRouter | $2-4 |
| Qwen3.5 Plus | 阿里云 | $3-5 |
| MiniMax M2.5 | MiniMax | $1-3 |
中等预算($10-50/月)
| 模型 | 提供商 | 大致月费 |
|---|---|---|
| Claude Sonnet 4.6 | OpenRouter | $15-30 |
| GPT-5.4 | OpenRouter | $15-30 |
| Gemini 2.5 Pro | $10-25 | |
| GLM-5.1 | 智谱 | ¥100-300 |
高预算(不差钱)
| 模型 | 提供商 | 大致月费 |
|---|---|---|
| Claude Opus 4.6 | Anthropic | $50-100+ |
| GPT-5.4 Pro | OpenAI | $50-100+ |
模型切换建议
不同任务用不同模型,成本最优:
bash
# 日常对话 — 用便宜的
/model zai/glm-5.1
# 编程任务 — 用强的
/model anthropic/claude-sonnet-4.6
# 复杂推理 — 用最强的
/model openai/gpt-5.4-pro配合 fallback_model 自动降级:
yaml
# config.yaml
fallback_model:
provider: openrouter
model: anthropic/claude-sonnet-4.6 # 主模型限流时自动切换上下文窗口对比
| 模型 | 上下文窗口 | 约等于 |
|---|---|---|
| GPT-5.4 / GPT-5.4 Pro | 1M | ~750 页文档 |
| Claude Opus/Sonnet 4.6 | 1M | ~750 页文档 |
| Gemini 2.5 Pro/Flash | 1M | ~750 页文档 |
| Qwen3.6 Plus | 1M | ~750 页文档 |
| GLM-5.1 | 202K | ~150 页文档 |
| DeepSeek V3.2 | 128K | ~100 页文档 |
| 本地 Qwen3 (Ollama) | 4K-32K | 取决于配置 |
上下文窗口 ≠ 可用窗口
Agent 的系统提示 + 工具定义 + 技能加载会占用大量上下文。实际可用于对话的窗口通常比标称值小 20-40%。
2026 年 4 月模型价格一览
价格为每百万输入 token(input),输出价格通常是输入的 2-5 倍。具体以各平台官网为准。
国际模型
| 模型 | 提供商 | 上下文 | 输入价格 | 特点 |
|---|---|---|---|---|
| GPT-5.4 Pro | OpenAI | 1M | $30/M | 综合最强 |
| GPT-5.4 | OpenAI | 1M | $2.5/M | 全能旗舰 |
| GPT-5.4 Mini | OpenAI | 400K | $0.75/M | 性能/价格均衡 |
| GPT-5.4 Nano | OpenAI | 400K | $0.2/M | 极致便宜 |
| o3 | OpenAI | 200K | $2/M | 推理专精 |
| o4-mini | OpenAI | 200K | $1.1/M | 轻量推理 |
| Claude Opus 4.6 | Anthropic | 1M | $5/M | 最强推理 |
| Claude Opus 4.6 Fast | Anthropic | 1M | $3/M | 快速推理 |
| Claude Sonnet 4.6 | Anthropic | 1M | $3/M | 编程利器 |
| Gemini 2.5 Pro | 1M | $1.25/M | 长文本专家 | |
| Gemini 2.5 Flash | 1M | $0.3/M | 快速且便宜 |
国产模型
| 模型 | 提供商 | 上下文 | 输入价格 | 特点 |
|---|---|---|---|---|
| GLM-5.1 | 智谱 | 202K | $0.95/M | 综合实力强 |
| GLM-5 Turbo | 智谱 | 128K | $1.2/M | 快速响应 |
| DeepSeek V3.2 | DeepSeek | 128K | $0.26/M | 极致性价比 |
| DeepSeek V3.2 Speciale | DeepSeek | 128K | $0.4/M | 特殊优化版 |
| Qwen3.6 Plus | 阿里云 | 1M | $0.325/M | 1M 超长上下文 |
| Qwen3.5 Plus | 阿里云 | 1M | $0.26/M | 高性价比 |
| Qwen3 Max | 阿里云 | 32K | $0.78/M | 精细任务 |
| Qwen3 Coder Plus | 阿里云 | 1M | $0.65/M | 代码专精 |
| Kimi K2.5 | Moonshot | 262K | $0.38/M | 长文本理解 |
| Kimi K2 Thinking | Moonshot | 262K | $0.6/M | 深度思考 |
| M2.7 | MiniMax | 128K | $0.3/M | 综合能力 |
| M2.5 | MiniMax | 128K | $0.118/M | 超便宜 |
国产模型配置速查
| 模型 | 提供商 | 环境变量 | 获取 Key |
|---|---|---|---|
| GLM-5.1 | 智谱 | GLM_API_KEY | open.bigmodel.cn |
| Qwen | 阿里云 | DASHSCOPE_API_KEY | modelstudio.console.alibabacloud.com |
| DeepSeek | DeepSeek | DEEPSEEK_API_KEY | platform.deepseek.com |
| Kimi | Moonshot | KIMI_API_KEY | moonshot.ai |
| MiniMax | MiniMax | MINIMAX_API_KEY | minimax.io |
配置示例
yaml
# config.yaml — 使用智谱 GLM-5.1
provider:
name: zai
api_key: ${GLM_API_KEY}
model: glm-5.1
# 或者通过 OpenRouter 中转使用国外模型
provider:
name: openrouter
api_key: ${OPENROUTER_API_KEY}
model: anthropic/claude-sonnet-4.6国产模型优劣势对比
| 模型 | 优势 | 劣势 | 适合场景 |
|---|---|---|---|
| GLM-5.1 | 综合能力强、中文好、工具调用好 | 英文稍弱 | 日常对话、中文内容 |
| Qwen3.6 Plus | 1M 超长上下文、多语言 | API 限流较严 | 长文档、问答 |
| DeepSeek V3.2 | 代码推理强、价格极低 | 高峰期排队 | 编程辅助 |
| Kimi K2.5 | 长文本理解出色 | 偶有幻觉 | 长文档分析 |
| MiniMax M2.5 | 全场最便宜 | 综合能力稍弱 | 大量调用 |
⚠️ 国产模型通常需要中国手机号注册。如果你在海外,部分平台支持邮箱注册。