模型家族 | 代表模型/方向 | 核心特点 | 适合场景 | 主要短板 |
| OpenAI GPT 系列 | GPT-5.5、GPT-5.5 Pro、GPT-5.4/5.3、Codex、Sora、GPT Image、Realtime 等 | 综合能力、工具使用、代码、数据分析、文档/表格生成、软件操作、智能体工作流非常强;产品生态最完整之一。 | 通用办公、复杂研究、代码工程、数据分析、Agent、企业自动化 | 闭源;高端模型成本和配额受限;API 与 ChatGPT 可用模型并不总是同步。 |
| Anthropic Claude | Claude Opus 4.7、Sonnet 4.6、Haiku 4.5 | 风格稳健,长文档、写作、代码、复杂指令遵循和安全对齐口碑强;Opus 偏最强能力,Sonnet 偏性价比,Haiku 偏速度。 | 企业知识工作、法律/政策/长文分析、代码助手、可靠写作 | 闭源;对某些请求安全策略较保守;多模态生成生态不如 OpenAI/Google 丰富。 |
| Google Gemini | Gemini 3 Pro、Gemini 3 Deep Think、Gemini 2.5/3 Flash 系列 | 原生多模态、长上下文、视频/图像/音频/代码理解、Google 搜索和 Workspace/Android/Cloud 生态深。 | 多模态理解、视频/图片分析、搜索增强、Google 生态办公、教育和科研辅助 | 产品入口和地区/套餐限制较多;API/应用版本可能存在能力差异。 |
| Meta Llama | Llama 4 Scout、Llama 4 Maverick、Llama 3.x | 开放权重生态最强之一,适合私有化、自部署、微调;部分版本采用 MoE 架构和原生多模态设计。 | 本地部署、企业私有化、研究、微调、长上下文实验 | 许可证并非完全等同传统开源;极长上下文在真实任务中仍需验证;顶级闭源模型在推理稳定性上常更强。 |
| Mistral AI | Mistral Large 3、Mistral Small 4、Magistral、Codestral、Devstral | 欧洲代表性模型公司,开放权重、Apache 2.0 友好,强调效率、私有部署、代码和多模态。 | 欧洲合规、企业私有化、低成本部署、代码/Agent、边缘模型 | 顶级综合能力通常略弱于 OpenAI/Claude/Gemini 最强闭源模型;中文生态相对弱。 |
| xAI Grok | Grok 4、Grok 4.1、Grok 4 Fast | 强调实时信息、X 平台集成、搜索和更个性化/直率的回答风格。 | 实时舆情、X/Twitter 生态、搜索增强问答、快速推理 | 风格不一定适合严肃企业场景;安全和一致性争议较多;企业生态仍在追赶。 |
模型家族 | 代表模型/方向 | 核心特点 | 适合场景 | 主要短板 |
| DeepSeek | DeepSeek V4-Pro / V4-Flash、V3.2、R1 | 国内最具全球影响力的开放权重路线之一,强项是推理、代码、数学、Agent、低成本 API 和长上下文。 | 代码、推理、数学、低成本批量调用、私有化/开放权重部署 | 产品生态和多模态应用层弱于 OpenAI/Google;不同平台部署质量差异大。 |
| 阿里 Qwen | Qwen3.5、Qwen3.5-397B-A17B、Qwen-Omni、Qwen-VL、Qwen-Coder | 国内开放模型生态最完整之一,覆盖大中小模型、代码、多模态、语音、图像、视频、Embedding、Reranker 等;多语言和多模态能力突出。 | 多语言、多模态、中文办公、开源微调、企业云服务、Agent | 模型线复杂,选型成本高;最强版本与开源版本、云端版本能力可能不同。 |
| Moonshot Kimi | Kimi K2.6、Kimi K2.5、Kimi K2 Thinking | 以长上下文、中文文档理解、代码和 Agent 著称;支持文本、图像、视频输入,强调长程代码、指令遵循和自主执行能力。 | 长文档阅读、中文写作、代码生成、软件工程、研究型 Agent | API 和模型版本更新快,稳定性需按场景测试;极复杂推理仍需对比闭源前沿模型。 |
| 百度 ERNIE | ERNIE 4.5、ERNIE X1、ERNIE 5.0 | 优势在中文知识、搜索、百度智能云、文档和企业应用;强调中文理解、多模态和行业落地。 | 中文搜索、企业知识库、百度云、内容生成、政企场景 | 国际开发者生态和开放社区不如 Qwen/DeepSeek;海外影响力相对有限。 |
| 智谱 GLM | GLM-4.7、GLM-4.6V、GLM-4.5/4.6 | 清华系背景,强调开放权重、中文英文双语、代码、Agent、工具调用和多模态。 | 中文/英文混合开发、函数调用、私有化、企业 Agent | 海外生态较小;不同版本能力差异明显,需要实测。 |
| 字节 Doubao | Doubao、Seed1.5、Seed 2.0、Seedream、Seedance、Seeduplex | 强在消费级应用、内容生成、语音、视频、推荐生态和低门槛产品化;语音和视频能力突出。 | C 端助手、语音交互、短视频/内容生成、抖音/火山引擎生态 | 开放性弱于 DeepSeek/Qwen/Kimi;企业私有化和研究透明度相对有限。 |
| 腾讯 Hunyuan | Hunyuan-Large、Hunyuan-TurboS、Hunyuan 3D | 依托腾讯云、微信/QQ/企业微信、游戏和 3D 生态,行业落地能力强;在 3D 内容生成和产业应用方面有特色。 | 产业应用、云服务、3D 内容、游戏、社交/办公生态 | 通用对话模型海外存在感不如 DeepSeek/Qwen;开放社区热度相对较低。 |
| MiniMax | MiniMax-Text-01、MiniMax-VL-01、MiniMax-M1、Hailuo | 长上下文、视频、语音和多模态生成有特色;部分模型强调超长上下文和开放权重推理。 | 超长文档、视频生成、语音、创意内容、开放权重推理实验 | 文本模型生态和工具链不如 Qwen/DeepSeek;部分后续模型开放性和许可证需逐个确认。 |