鱼C论坛

 找回密码
 立即注册
查看: 75|回复: 2

[大语言模型] AI大模型乱斗:DeepSeek vs o3-mini vs Claude3.5 vs Qwen!谁能笑到最后??

[复制链接]
发表于 3 天前 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
81cdfd6c91f5754707f6d78c7dcb830155b0c1af.jpg@308w_174h.jpeg

测试一:通过字母下落物理效果对比“o3-mini”、deepSeek、Claude3.5生成能力。

测试二:通过贪吃蛇游戏对比deepseek和Qwen。

在线学习:



o3-mini/deepseek/claude3.5生成的哪个好?

具体prompt描述,使用JavaScript创建一个具有逼真物理效果的字母下落动画,具体要求如下:
游客,如果您要查看本帖隐藏内容请回复



DeepSeek 是一家中国的人工智能公司,专注于实现通用人工智能(AGI)。

它开发了一系列大型语言模型,其中包括 DeepSeek-V3、DeepSeek-Math、DeepSeek-Coder 和 DeepSeek-R1 等。

DeepSeek-V3:发布时间:2024年12月26日。

特点:这是一个拥有671B总参数的专家混合(MoE)语言模型,每个标记激活37B参数。它在多任务学习、推理效率和模型表现上实现了显著的创新与优化。

性能:在多个基准测试中超越了其他开源模型,如 Qwen2.5-72B 和 LLaMA 3.1-405B,并能与 GPT-4o、Claude 3.5-Sonnet 等闭源模型相抗衡。

训练成本:训练耗资557.6万美元,基于2048块英伟达H800型GPU集群上运行55天完成。

DeepSeek-R1:发布时间:2025年01月20日。

特点:在数学、代码、自然语言推理等任务上,性能与OpenAI o1正式版相当。


Claude 3.5 是由 Anthropic 开发的一系列大型语言模型,包括 Claude 3.5 Sonnet 和 Claude 3.5 Haiku。

Claude 3.5 Sonnet 特点:是最智能的模型,结合顶级性能和改进的速度。

功能:文本和代码生成、视觉处理、工具使用等。

企业应用:专为企业级扩展而设计,在推理、数学、编程以及英语和非英语语言流利度方面的基准评估中表现出强大的性能。


Qwen 是由阿里巴巴集团 Qwen 团队研发的大语言模型和大型多模态模型系列。

Qwen2.5 特点:提供了多种参数规模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。

性能:在遵循指令、生成长文本(超过 8K tokens)、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面有了显著改进。

语言支持:支持超过 29 种语言。

Qwen2.5 系列模型在多个基准测试中表现出色,例如 Qwen2.5-72B 在 MMLU、HumanEval 和 MATH 等任务上取得了优异的成绩。

此外,Qwen2.5 还支持长达 128K tokens 的上下文长度,并能生成多达 8K tokens 的文本。

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 3 天前 | 显示全部楼层
这左图有点离谱啊哈哈哈哈
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 3 天前 | 显示全部楼层
小甲鱼的二师兄 发表于 2025-2-3 20:50
这左图有点离谱啊哈哈哈哈

233333用力极猛
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-2-6 02:01

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表