附录 E：模型选型指南

不同模型有不同的特长和价格。这篇指南帮你根据需求选到最合适的模型。
📅 数据更新于 2026 年 4 月，价格以 OpenRouter 公开定价为参考（每百万 token 输入价格）。

按场景选模型

日常对话与通用任务

模型	提供商	上下文	价格	推荐度
GLM-5.1	智谱	202K	$0.95/M	⭐⭐⭐⭐⭐
GPT-5.4 Nano	OpenAI	400K	$0.2/M	⭐⭐⭐⭐⭐
Gemini 2.5 Flash	Google	1M	$0.3/M	⭐⭐⭐⭐
DeepSeek V3.2	DeepSeek	128K	$0.26/M	⭐⭐⭐⭐
Qwen3.5 Plus	阿里云	1M	$0.26/M	⭐⭐⭐⭐
MiniMax M2.5	MiniMax	128K	$0.118/M	⭐⭐⭐⭐

编程开发

模型	提供商	特长	推荐度
Claude Sonnet 4.6	Anthropic	代码理解、重构、Review	⭐⭐⭐⭐⭐
GPT-5.4	OpenAI	全能，长代码生成	⭐⭐⭐⭐⭐
Qwen3 Coder Plus	阿里云	代码生成，1M 上下文	⭐⭐⭐⭐
GLM-5.1	智谱	性价比高，中文代码	⭐⭐⭐⭐
DeepSeek V3.2	DeepSeek	代码推理强，价格极低	⭐⭐⭐⭐

复杂推理

模型	提供商	特长	推荐度
Claude Opus 4.6	Anthropic	最强推理，1M 上下文	⭐⭐⭐⭐⭐
GPT-5.4 Pro	OpenAI	综合最强，1M 上下文	⭐⭐⭐⭐⭐
o3	OpenAI	数学/逻辑推理专精	⭐⭐⭐⭐⭐
Gemini 2.5 Pro	Google	长文档推理，1M 上下文	⭐⭐⭐⭐

本地部署（隐私优先）

模型	参数量	最低配置	推荐度
Qwen3-14B-Instruct	14B	16GB RAM	⭐⭐⭐⭐
Llama4-Scout-8B	8B	8GB RAM	⭐⭐⭐⭐
DeepSeek-R1-7B	7B	8GB RAM	⭐⭐⭐
Qwen3-72B-Instruct	72B	48GB VRAM	⭐⭐⭐⭐⭐

按预算选模型

免费方案

模型	提供商	限制
GLM-4-Flash	智谱	免费额度充足
Gemini 2.5 Flash	Google	免费 API
HuggingFace 开源模型	HF	$0.1/月免费额度
本地模型	自建	完全免费

低预算（< $10/月）

模型	提供商	大致月费
GLM-5.1	智谱	¥50-100
GPT-5.4 Nano	OpenRouter	$2-4
DeepSeek V3.2	OpenRouter	$2-4
Qwen3.5 Plus	阿里云	$3-5
MiniMax M2.5	MiniMax	$1-3

中等预算（$10-50/月）

模型	提供商	大致月费
Claude Sonnet 4.6	OpenRouter	$15-30
GPT-5.4	OpenRouter	$15-30
Gemini 2.5 Pro	Google	$10-25
GLM-5.1	智谱	¥100-300

高预算（不差钱）

模型	提供商	大致月费
Claude Opus 4.6	Anthropic	$50-100+
GPT-5.4 Pro	OpenAI	$50-100+

模型切换建议

不同任务用不同模型，成本最优：

bash

# 日常对话 — 用便宜的
/model zai/glm-5.1

# 编程任务 — 用强的
/model anthropic/claude-sonnet-4.6

# 复杂推理 — 用最强的
/model openai/gpt-5.4-pro

配合 fallback_model 自动降级：

yaml

# config.yaml
fallback_model:
  provider: openrouter
  model: anthropic/claude-sonnet-4.6  # 主模型限流时自动切换

上下文窗口对比

模型	上下文窗口	约等于
GPT-5.4 / GPT-5.4 Pro	1M	~750 页文档
Claude Opus/Sonnet 4.6	1M	~750 页文档
Gemini 2.5 Pro/Flash	1M	~750 页文档
Qwen3.6 Plus	1M	~750 页文档
GLM-5.1	202K	~150 页文档
DeepSeek V3.2	128K	~100 页文档
本地 Qwen3 (Ollama)	4K-32K	取决于配置

上下文窗口 ≠ 可用窗口

Agent 的系统提示 + 工具定义 + 技能加载会占用大量上下文。实际可用于对话的窗口通常比标称值小 20-40%。

2026 年 4 月模型价格一览

价格为每百万输入 token（input），输出价格通常是输入的 2-5 倍。具体以各平台官网为准。

国际模型

模型	提供商	上下文	输入价格	特点
GPT-5.4 Pro	OpenAI	1M	$30/M	综合最强
GPT-5.4	OpenAI	1M	$2.5/M	全能旗舰
GPT-5.4 Mini	OpenAI	400K	$0.75/M	性能/价格均衡
GPT-5.4 Nano	OpenAI	400K	$0.2/M	极致便宜
o3	OpenAI	200K	$2/M	推理专精
o4-mini	OpenAI	200K	$1.1/M	轻量推理
Claude Opus 4.6	Anthropic	1M	$5/M	最强推理
Claude Opus 4.6 Fast	Anthropic	1M	$3/M	快速推理
Claude Sonnet 4.6	Anthropic	1M	$3/M	编程利器
Gemini 2.5 Pro	Google	1M	$1.25/M	长文本专家
Gemini 2.5 Flash	Google	1M	$0.3/M	快速且便宜

国产模型

模型	提供商	上下文	输入价格	特点
GLM-5.1	智谱	202K	$0.95/M	综合实力强
GLM-5 Turbo	智谱	128K	$1.2/M	快速响应
DeepSeek V3.2	DeepSeek	128K	$0.26/M	极致性价比
DeepSeek V3.2 Speciale	DeepSeek	128K	$0.4/M	特殊优化版
Qwen3.6 Plus	阿里云	1M	$0.325/M	1M 超长上下文
Qwen3.5 Plus	阿里云	1M	$0.26/M	高性价比
Qwen3 Max	阿里云	32K	$0.78/M	精细任务
Qwen3 Coder Plus	阿里云	1M	$0.65/M	代码专精
Kimi K2.5	Moonshot	262K	$0.38/M	长文本理解
Kimi K2 Thinking	Moonshot	262K	$0.6/M	深度思考
M2.7	MiniMax	128K	$0.3/M	综合能力
M2.5	MiniMax	128K	$0.118/M	超便宜

国产模型配置速查

模型	提供商	环境变量	获取 Key
GLM-5.1	智谱	`GLM_API_KEY`	open.bigmodel.cn
Qwen	阿里云	`DASHSCOPE_API_KEY`	modelstudio.console.alibabacloud.com
DeepSeek	DeepSeek	`DEEPSEEK_API_KEY`	platform.deepseek.com
Kimi	Moonshot	`KIMI_API_KEY`	moonshot.ai
MiniMax	MiniMax	`MINIMAX_API_KEY`	minimax.io

配置示例

yaml

# config.yaml — 使用智谱 GLM-5.1
provider:
  name: zai
  api_key: ${GLM_API_KEY}
  model: glm-5.1

# 或者通过 OpenRouter 中转使用国外模型
provider:
  name: openrouter
  api_key: ${OPENROUTER_API_KEY}
  model: anthropic/claude-sonnet-4.6

国产模型优劣势对比

模型	优势	劣势	适合场景
GLM-5.1	综合能力强、中文好、工具调用好	英文稍弱	日常对话、中文内容
Qwen3.6 Plus	1M 超长上下文、多语言	API 限流较严	长文档、问答
DeepSeek V3.2	代码推理强、价格极低	高峰期排队	编程辅助
Kimi K2.5	长文本理解出色	偶有幻觉	长文档分析
MiniMax M2.5	全场最便宜	综合能力稍弱	大量调用

⚠️ 国产模型通常需要中国手机号注册。如果你在海外，部分平台支持邮箱注册。

附录 E：模型选型指南 ​

按场景选模型 ​

日常对话与通用任务 ​

编程开发 ​

复杂推理 ​

本地部署（隐私优先） ​

按预算选模型 ​

免费方案 ​

低预算（< $10/月） ​

中等预算（$10-50/月） ​

高预算（不差钱） ​

模型切换建议 ​

上下文窗口对比 ​

2026 年 4 月模型价格一览 ​

国际模型 ​

国产模型 ​

国产模型配置速查 ​

配置示例 ​

国产模型优劣势对比 ​

深入阅读 ​

附录 E：模型选型指南

按场景选模型

日常对话与通用任务

编程开发

复杂推理

本地部署（隐私优先）

按预算选模型

免费方案

低预算（< $10/月）

中等预算（$10-50/月）

高预算（不差钱）

模型切换建议

上下文窗口对比

2026 年 4 月模型价格一览

国际模型

国产模型

国产模型配置速查

配置示例

国产模型优劣势对比

深入阅读