Skip to content

附录 E:模型选型指南

不同模型有不同的特长和价格。这篇指南帮你根据需求选到最合适的模型。

📅 数据更新于 2026 年 4 月,价格以 OpenRouter 公开定价为参考(每百万 token 输入价格)。

按场景选模型

日常对话与通用任务

模型提供商上下文价格推荐度
GLM-5.1智谱202K$0.95/M⭐⭐⭐⭐⭐
GPT-5.4 NanoOpenAI400K$0.2/M⭐⭐⭐⭐⭐
Gemini 2.5 FlashGoogle1M$0.3/M⭐⭐⭐⭐
DeepSeek V3.2DeepSeek128K$0.26/M⭐⭐⭐⭐
Qwen3.5 Plus阿里云1M$0.26/M⭐⭐⭐⭐
MiniMax M2.5MiniMax128K$0.118/M⭐⭐⭐⭐

编程开发

模型提供商特长推荐度
Claude Sonnet 4.6Anthropic代码理解、重构、Review⭐⭐⭐⭐⭐
GPT-5.4OpenAI全能,长代码生成⭐⭐⭐⭐⭐
Qwen3 Coder Plus阿里云代码生成,1M 上下文⭐⭐⭐⭐
GLM-5.1智谱性价比高,中文代码⭐⭐⭐⭐
DeepSeek V3.2DeepSeek代码推理强,价格极低⭐⭐⭐⭐

复杂推理

模型提供商特长推荐度
Claude Opus 4.6Anthropic最强推理,1M 上下文⭐⭐⭐⭐⭐
GPT-5.4 ProOpenAI综合最强,1M 上下文⭐⭐⭐⭐⭐
o3OpenAI数学/逻辑推理专精⭐⭐⭐⭐⭐
Gemini 2.5 ProGoogle长文档推理,1M 上下文⭐⭐⭐⭐

本地部署(隐私优先)

模型参数量最低配置推荐度
Qwen3-14B-Instruct14B16GB RAM⭐⭐⭐⭐
Llama4-Scout-8B8B8GB RAM⭐⭐⭐⭐
DeepSeek-R1-7B7B8GB RAM⭐⭐⭐
Qwen3-72B-Instruct72B48GB VRAM⭐⭐⭐⭐⭐

按预算选模型

免费方案

模型提供商限制
GLM-4-Flash智谱免费额度充足
Gemini 2.5 FlashGoogle免费 API
HuggingFace 开源模型HF$0.1/月免费额度
本地模型自建完全免费

低预算(< $10/月)

模型提供商大致月费
GLM-5.1智谱¥50-100
GPT-5.4 NanoOpenRouter$2-4
DeepSeek V3.2OpenRouter$2-4
Qwen3.5 Plus阿里云$3-5
MiniMax M2.5MiniMax$1-3

中等预算($10-50/月)

模型提供商大致月费
Claude Sonnet 4.6OpenRouter$15-30
GPT-5.4OpenRouter$15-30
Gemini 2.5 ProGoogle$10-25
GLM-5.1智谱¥100-300

高预算(不差钱)

模型提供商大致月费
Claude Opus 4.6Anthropic$50-100+
GPT-5.4 ProOpenAI$50-100+

模型切换建议

不同任务用不同模型,成本最优:

bash
# 日常对话 — 用便宜的
/model zai/glm-5.1

# 编程任务 — 用强的
/model anthropic/claude-sonnet-4.6

# 复杂推理 — 用最强的
/model openai/gpt-5.4-pro

配合 fallback_model 自动降级:

yaml
# config.yaml
fallback_model:
  provider: openrouter
  model: anthropic/claude-sonnet-4.6  # 主模型限流时自动切换

上下文窗口对比

模型上下文窗口约等于
GPT-5.4 / GPT-5.4 Pro1M~750 页文档
Claude Opus/Sonnet 4.61M~750 页文档
Gemini 2.5 Pro/Flash1M~750 页文档
Qwen3.6 Plus1M~750 页文档
GLM-5.1202K~150 页文档
DeepSeek V3.2128K~100 页文档
本地 Qwen3 (Ollama)4K-32K取决于配置

上下文窗口 ≠ 可用窗口

Agent 的系统提示 + 工具定义 + 技能加载会占用大量上下文。实际可用于对话的窗口通常比标称值小 20-40%。


2026 年 4 月模型价格一览

价格为每百万输入 token(input),输出价格通常是输入的 2-5 倍。具体以各平台官网为准。

国际模型

模型提供商上下文输入价格特点
GPT-5.4 ProOpenAI1M$30/M综合最强
GPT-5.4OpenAI1M$2.5/M全能旗舰
GPT-5.4 MiniOpenAI400K$0.75/M性能/价格均衡
GPT-5.4 NanoOpenAI400K$0.2/M极致便宜
o3OpenAI200K$2/M推理专精
o4-miniOpenAI200K$1.1/M轻量推理
Claude Opus 4.6Anthropic1M$5/M最强推理
Claude Opus 4.6 FastAnthropic1M$3/M快速推理
Claude Sonnet 4.6Anthropic1M$3/M编程利器
Gemini 2.5 ProGoogle1M$1.25/M长文本专家
Gemini 2.5 FlashGoogle1M$0.3/M快速且便宜

国产模型

模型提供商上下文输入价格特点
GLM-5.1智谱202K$0.95/M综合实力强
GLM-5 Turbo智谱128K$1.2/M快速响应
DeepSeek V3.2DeepSeek128K$0.26/M极致性价比
DeepSeek V3.2 SpecialeDeepSeek128K$0.4/M特殊优化版
Qwen3.6 Plus阿里云1M$0.325/M1M 超长上下文
Qwen3.5 Plus阿里云1M$0.26/M高性价比
Qwen3 Max阿里云32K$0.78/M精细任务
Qwen3 Coder Plus阿里云1M$0.65/M代码专精
Kimi K2.5Moonshot262K$0.38/M长文本理解
Kimi K2 ThinkingMoonshot262K$0.6/M深度思考
M2.7MiniMax128K$0.3/M综合能力
M2.5MiniMax128K$0.118/M超便宜

国产模型配置速查

模型提供商环境变量获取 Key
GLM-5.1智谱GLM_API_KEYopen.bigmodel.cn
Qwen阿里云DASHSCOPE_API_KEYmodelstudio.console.alibabacloud.com
DeepSeekDeepSeekDEEPSEEK_API_KEYplatform.deepseek.com
KimiMoonshotKIMI_API_KEYmoonshot.ai
MiniMaxMiniMaxMINIMAX_API_KEYminimax.io

配置示例

yaml
# config.yaml — 使用智谱 GLM-5.1
provider:
  name: zai
  api_key: ${GLM_API_KEY}
  model: glm-5.1

# 或者通过 OpenRouter 中转使用国外模型
provider:
  name: openrouter
  api_key: ${OPENROUTER_API_KEY}
  model: anthropic/claude-sonnet-4.6

国产模型优劣势对比

模型优势劣势适合场景
GLM-5.1综合能力强、中文好、工具调用好英文稍弱日常对话、中文内容
Qwen3.6 Plus1M 超长上下文、多语言API 限流较严长文档、问答
DeepSeek V3.2代码推理强、价格极低高峰期排队编程辅助
Kimi K2.5长文本理解出色偶有幻觉长文档分析
MiniMax M2.5全场最便宜综合能力稍弱大量调用

⚠️ 国产模型通常需要中国手机号注册。如果你在海外,部分平台支持邮箱注册。

深入阅读

基于 CC BY-NC-SA 4.0 发布 | GitHub