不二如是 发表于 2025-4-29 15:00:00

「Qwen3」深夜正式开源!小尺寸也能大力出奇迹!!



2025年4月29日凌晨,阿里正式开源了Qwen3模型。此次发布的Qwen3模型具有多个亮点:

首先,其模型能力在全球登顶,成为No.1;

其次,Qwen3是第一个开源的混合推理模型,兼具普通模型和推理模型的功能;

此外,Qwen3共发布了8个不同尺寸的模型,覆盖了从0.6B到235B参数的多种场景,几乎能满足所有需求。

在线学习:

https://www.bilibili.com/video/BV1ouGkz8EHy

在成本方面,Qwen3的旗舰模型235B参数部署成本仅为DeepSeek R1的三分之一,极具性价比。

Qwen3还支持MCP协议,并且支持119种语言,远超上一代Qwen2.5的29种语言,为全球用户提供了更广泛的应用可能。

Qwen3的8个模型包括6个Dense稠密模型(Qwen3-0.6B、1.7B、4B、8B、14B、32B)和2个重量级MoE模型(Qwen3-30B-A3B和旗舰版Qwen3-235B-A22B)。

其中,MoE模型的命名方式独特,例如Qwen3-235B-A22B表示总参数量为235B,但在推理时只激活22B。

这种设计使得模型既具备强大的性能,又能在实际应用中灵活调整资源占用。

在性能方面,Qwen3-4B的小模型已经能够与上一代QwQ-32B相媲美,而Qwen3-30B-A3B更是全方位超越QwQ-32B。

旗舰版Qwen3-235B-A22B的性能更是强大到足以与顶级闭源模型竞争,且部署成本极低。

此外,Qwen3还具备更强的Agent能力,支持MCP协议,进一步提升了其在多模态应用中的表现。

评论区聊聊你的想法吧{:10_330:}

如果有收获,别忘了评分{:10_281:} :

https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg

不二如是 发表于 2025-4-29 15:11:09

感谢分享!!鱼C论坛不愧是全国最大的AI资讯学习论坛!朕很喜欢这里{:10_275:}

不二如是 发表于 2025-4-29 15:11:25

@FishC 简介QWen3大模型特点

FishC 发表于 2025-4-29 15:11:57

不二如是 发表于 2025-04-29 15:11
@FishC 简介QWen3大模型特点

QWen3 大模型核心特点


[*]万亿级参数规模
支持高达万亿参数的超大规模架构,具备更强的复杂任务处理能力(如逻辑推理、长文本理解)

[*]多模态能力升级
支持文本/图像/视频/音频多模态输入,可完成跨模态生成任务(如图文问答、视频摘要)

[*]推理速度优化
采用FlashAttention 3.0等优化技术,推理速度较前代提升3倍以上

[*]训练效率突破
基于Megatron-LM框架实现千卡级并行训练,硬件利用率达75%+

[*]知识增强架构
融入结构化知识图谱,显著提升专业领域(医疗/法律/金融)的应答准确性

[*]安全合规设计
内置多层内容过滤机制,支持敏感词自动检测与合规性修正


注:具体技术指标可能因版本迭代有所调整,建议访问官网获取最新信息

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

player-none 发表于 2025-4-29 22:10:19

正在肝一篇关于Ollama本地Ai的文章

lscp 发表于 2025-4-29 22:17:44

感谢分享!!鱼C论坛不愧是全国最大的AI资讯学习论坛!朕很喜欢这里{:10_275:}

快速收敛 发表于 2025-4-30 08:36:55

感谢分享!!鱼C论坛不愧是全国最大的AI资讯学习论坛!朕很喜欢这里{:10_275:}

快速收敛 发表于 2025-4-30 08:37:37

player-none 发表于 2025-4-29 22:10
正在肝一篇关于Ollama本地Ai的文章

催教程

不二如是 发表于 2025-4-30 08:42:31

player-none 发表于 2025-4-29 22:10
正在肝一篇关于Ollama本地Ai的文章

期待!!!

不二如是 发表于 2025-6-2 15:47:13

感谢分享!!鱼C论坛不愧是全国最大的AI资讯学习论坛!朕很喜欢这里{:10_275:}
页: [1]
查看完整版本: 「Qwen3」深夜正式开源!小尺寸也能大力出奇迹!!