不二如是 发表于 2025-2-6 16:00:00

「谷歌」三款AI新模型齐发!Gemini-2.0-Pro免费、跑分超o1登顶第一,适合编码、...



Gemini 2.0的故事,正在加速展开。

12月的Flash实验版,为开发者带来低延迟、高性能的工作模型。

今年初,2.0 Flash Thinking Experimental在Google AI Studio更新,通过结合Flash的速度和增强的推理能力,进一步提升性能。

上周,更新版2.0 Flash已在Gemini桌面和移动应用全面上线。

今天,三个新成员同时亮相:
**** Hidden Message *****

Gemini 2.0 Pro实验版:


[*]性能:在编码和复杂提示处理方面表现最佳,排名第一。
[*]功能:支持多模态输入,输出文本;具有强大的编码性能和处理复杂提示的能力,上下文窗口达到200k,能够调用Google搜索和代码执行工具。


快速解读版:

https://www.bilibili.com/video/BV1pvNEe8E3W

完整版:

https://www.bilibili.com/video/BV1HvNEe8ERQ


测试成绩:


[*]MATH测试:91.8%(比1.5版本提升约5个百分点)。
[*]GPQA推理能力:64.7%。
[*]SimpleQA世界知识测试:44.3%。
[*]编程能力:LiveCodeBench测试36.0%,Bird-SQL转换准确率59.3%。
[*]多语言理解:Global MMLU测试86.5%。
[*]图像理解:MMMU测试72.7%。
[*]视频分析能力:71.9%。

可在Google AI Studio中免费访问(访问链接)。

Gemini 2.0 Flash-Lite:


[*]性能:保持了1.5 Flash的速度和成本,性能有所提升。
[*]上下文窗口:100万token,能够处理更多信息。
[*]性价比:4万张照片的标题生成,成本不到1美元。

Gemini 2.0 Flash Thinking:


[*]性能:在编码、数学和难题处理方面排名前三。
[*]多模态支持:支持多模态输入和文本输出。

Gemini 2.0 Pro 在所有类别中排名第一。Gemini-2.0-Flash 在编码、数学和难题中排名前三。Flash-lite 在各个类别中排名前十。

很cool的阳 发表于 2025-2-6 17:05:03

{:5_109:}

不二如是 发表于 2025-2-6 17:07:43

感谢分享!!!学习前沿知识

不二如是 发表于 2025-2-6 17:07:52

很cool的阳 发表于 2025-2-6 17:05


{:10_275:}{:10_275:}{:10_275:}

lscp 发表于 2025-2-6 20:39:39

感谢分享!!!学习前沿知识

不二如是 发表于 2025-2-7 08:59:53

感谢分享!!!学习前沿知识

快速收敛 发表于 2025-2-8 16:42:56

感谢分享!!!学习前沿知识

不二如是 发表于 2025-3-15 21:19:45

感谢分享!!!学习前沿知识

康小泡 发表于 2025-3-17 14:50:38

感谢分享!!!学习前沿知识
页: [1]
查看完整版本: 「谷歌」三款AI新模型齐发!Gemini-2.0-Pro免费、跑分超o1登顶第一,适合编码、...