算盘LLM Abacus
数据更新 · 2026-05-27

算盘 · LLM Abacus

中文优先的 AI 大模型价格对比。一张表看清 26 个主流模型,30 秒回答「跑哪个最便宜」。

26 个模型
国产 9 · 海外 17
实时筛选
完全免费

模型价格表

默认按输入价升序,便宜的在最上面

26 / 26 个模型 · 价格单位 ¥/百万 tokens · 点击表头列名可排序 · 绿色高亮 = 最便宜

模型 厂商输入价 输出价 缓存价上下文 最大输出模态标签去试用
Gemini 2.5 Flash-Lite🇺🇸Google¥0.71¥2.84¥0.181.0M64K
文本视觉
极便宜快速
使用 →
Doubao 1.5 Pro🇨🇳字节豆包¥0.80¥2.00¥0.16256K12K
文本视觉
极便宜
使用 →
GPT-5 mini🇺🇸OpenAI¥1.78¥14.2¥0.18400K128K
文本视觉
性价比
使用 →
DeepSeek V3.2🇨🇳DeepSeek¥2.00¥8.00¥0.50128K8K
文本
性价比国产之光
使用 →
Gemini 2.5 Flash🇺🇸Google¥2.13¥17.8¥0.531.0M64K
文本视觉音频
快速性价比
使用 →
DeepSeek R1🇨🇳DeepSeek¥4.00¥16.0¥1.00128K32K
文本
推理性价比
使用 →
GLM-4.5🇨🇳智谱 AI¥4.00¥16.0¥1.00128K16K
文本视觉
性价比
使用 →
Qwen3 Max🇨🇳阿里通义¥4.00¥12.0¥1.00256K32K
文本视觉
性价比
使用 →
Claude Haiku 4.5🇺🇸Anthropic¥7.10¥35.5¥0.71200K32K
文本视觉
快速
使用 →
o4-mini🇺🇸OpenAI¥7.81¥31.2¥1.95200K100K
文本视觉
推理
使用 →
o3-mini🇺🇸OpenAI¥7.81¥31.2¥3.91200K100K
文本
推理
使用 →
GPT-5🇺🇸OpenAI¥8.88¥71.0¥0.89400K128K
文本视觉
旗舰推理
使用 →
Gemini 3 Pro🇺🇸Google¥8.88¥71.0¥2.222.0M64K
文本视觉音频
旗舰长上下文多模态
使用 →
Gemini 2.5 Pro🇺🇸Google¥8.88¥71.0¥2.222.0M64K
文本视觉音频
长上下文
使用 →
Qwen2.5 Max🇨🇳阿里通义¥10.0¥30.0131K8K
文本
使用 →
Kimi K2🇨🇳Moonshot / Kimi¥12.0¥12.0200K8K
文本
长上下文
使用 →
GPT-4.1🇺🇸OpenAI¥14.2¥56.8¥3.551.0M33K
文本视觉
长上下文
使用 →
Claude Sonnet 4.6🇺🇸Anthropic¥21.3¥107¥2.131.0M64K
文本视觉
性价比长上下文
使用 →
Claude Sonnet 4.5🇺🇸Anthropic¥21.3¥107¥2.13200K64K
文本视觉
性价比
使用 →
Grok-4🇺🇸xAI¥21.3¥107¥5.33256K64K
文本视觉
推理
使用 →
Grok-3🇺🇸xAI¥21.3¥107¥5.33131K16K
文本视觉
使用 →
GLM-4-Plus🇨🇳智谱 AI¥50.0¥50.0128K8K
文本视觉
旗舰
使用 →
Moonshot v1 128k🇨🇳Moonshot / Kimi¥60.0¥60.0128K8K
文本
长上下文
使用 →
Claude Opus 4.7🇺🇸Anthropic¥107¥533¥10.71.0M64K
文本视觉
旗舰长上下文
使用 →
Claude Opus 4.6🇺🇸Anthropic¥107¥533¥10.7200K32K
文本视觉
旗舰
使用 →
Claude Opus 4.5🇺🇸Anthropic¥107¥533¥10.7200K32K
文本视觉
使用 →

价格单位:人民币 / 百万 tokens。美元厂商按 1 USD ≈ 7.1 CNY 换算。最终以各厂商官方文档为准。

广告位 · slot home-mid

怎么挑一个最划算的大模型?

第一步,分清「输入价」和「输出价」。几乎所有 LLM 厂商都按 token 计费,但输入 token(你发给模型的) 和输出 token(模型生成的)单价不一样,通常输出贵 4–10 倍。所以「短问长答」类任务(写文章、生成代码)成本主要取决于输出价, 而「长问短答」类任务(文档摘要、分类)则看输入价

第二步,看缓存价。如果你的应用有大量重复的 system prompt 或文档上下文(比如客服机器人、 RAG),缓存命中后输入价能降到 10–20%。DeepSeek、OpenAI、Anthropic、 Google 都支持上下文缓存,但价格差异巨大。

第三步,看任务复杂度。不要默认用旗舰模型。Claude Haiku、Gemini 2.5 Flash、Doubao 1.5 Pro、 DeepSeek V3.2 这些「腰部模型」性价比极高,对话、翻译、简单生成、分类 这些任务完全够用,成本只有旗舰的 5–10%。

第四步,国产 vs 海外。如果用户在中国大陆,访问 DeepSeek、Kimi、通义、豆包延迟低(~50ms vs ~500ms),且不需要科学上网。豆包甚至比 DeepSeek 还便宜,Gemini Flash-Lite 则是海外最便宜的选项。

第五步,用估算器算总账。单价只是 nominal,真实月账单取决于调用次数 × 单次 token 量。 把你典型任务的 prompt 粘到 Token 估算器,瞬间看清各家月成本差距。