|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
Gemini 2.0的故事,正在加速展开。
12月的Flash实验版,为开发者带来低延迟、高性能的工作模型。
今年初,2.0 Flash Thinking Experimental在Google AI Studio更新,通过结合Flash的速度和增强的推理能力,进一步提升性能。
上周,更新版2.0 Flash已在Gemini桌面和移动应用全面上线。
今天,三个新成员同时亮相:
Gemini 2.0 Pro实验版:
- 性能:在编码和复杂提示处理方面表现最佳,排名第一。
- 功能:支持多模态输入,输出文本;具有强大的编码性能和处理复杂提示的能力,上下文窗口达到200k,能够调用Google搜索和代码执行工具。
快速解读版:
完整版:
测试成绩:
- MATH测试:91.8%(比1.5版本提升约5个百分点)。
- GPQA推理能力:64.7%。
- SimpleQA世界知识测试:44.3%。
- 编程能力:LiveCodeBench测试36.0%,Bird-SQL转换准确率59.3%。
- 多语言理解:Global MMLU测试86.5%。
- 图像理解:MMMU测试72.7%。
- 视频分析能力:71.9%。
可在Google AI Studio中免费访问(访问链接)。
Gemini 2.0 Flash-Lite:
- 性能:保持了1.5 Flash的速度和成本,性能有所提升。
- 上下文窗口:100万token,能够处理更多信息。
- 性价比:4万张照片的标题生成,成本不到1美元。
Gemini 2.0 Flash Thinking:
- 性能:在编码、数学和难题处理方面排名前三。
- 多模态支持:支持多模态输入和文本输出。
Gemini 2.0 Pro 在所有类别中排名第一。Gemini-2.0-Flash 在编码、数学和难题中排名前三。Flash-lite 在各个类别中排名前十。
|
|