|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
测试一:通过字母下落物理效果对比“o3-mini”、deepSeek、Claude3.5生成能力。
测试二:通过贪吃蛇游戏对比deepseek和Qwen。
在线学习:
o3-mini/deepseek/claude3.5生成的哪个好?
具体prompt描述,使用JavaScript创建一个具有逼真物理效果的字母下落动画,具体要求如下:
DeepSeek 是一家中国的人工智能公司,专注于实现通用人工智能(AGI)。
它开发了一系列大型语言模型,其中包括 DeepSeek-V3、DeepSeek-Math、DeepSeek-Coder 和 DeepSeek-R1 等。
DeepSeek-V3:发布时间:2024年12月26日。
特点:这是一个拥有671B总参数的专家混合(MoE)语言模型,每个标记激活37B参数。它在多任务学习、推理效率和模型表现上实现了显著的创新与优化。
性能:在多个基准测试中超越了其他开源模型,如 Qwen2.5-72B 和 LLaMA 3.1-405B,并能与 GPT-4o、Claude 3.5-Sonnet 等闭源模型相抗衡。
训练成本:训练耗资557.6万美元,基于2048块英伟达H800型GPU集群上运行55天完成。
DeepSeek-R1:发布时间:2025年01月20日。
特点:在数学、代码、自然语言推理等任务上,性能与OpenAI o1正式版相当。
Claude 3.5 是由 Anthropic 开发的一系列大型语言模型,包括 Claude 3.5 Sonnet 和 Claude 3.5 Haiku。
Claude 3.5 Sonnet 特点:是最智能的模型,结合顶级性能和改进的速度。
功能:文本和代码生成、视觉处理、工具使用等。
企业应用:专为企业级扩展而设计,在推理、数学、编程以及英语和非英语语言流利度方面的基准评估中表现出强大的性能。
Qwen 是由阿里巴巴集团 Qwen 团队研发的大语言模型和大型多模态模型系列。
Qwen2.5 特点:提供了多种参数规模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。
性能:在遵循指令、生成长文本(超过 8K tokens)、理解结构化数据(例如表格)以及生成结构化输出特别是 JSON 方面有了显著改进。
语言支持:支持超过 29 种语言。
Qwen2.5 系列模型在多个基准测试中表现出色,例如 Qwen2.5-72B 在 MMLU、HumanEval 和 MATH 等任务上取得了优异的成绩。
此外,Qwen2.5 还支持长达 128K tokens 的上下文长度,并能生成多达 8K tokens 的文本。
|
|