不二如是 发表于 2023-12-7 09:54:42

#Google 发布最强#大模型 #Gemini 暴打 #GPT4

本帖最后由 不二如是 于 2023-12-7 09:54 编辑



“最大”、“最强”,主打的就是一个干爆GPT-4。

https://www.bilibili.com/video/BV1Yu4y1g7ho

具体来说,此次谷歌一共带来了Gemini的三个版本:


[*]Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务
[*]Gemini Pro:可扩展至各种任务的Gemini模型
[*]Gemini Nano:适用于端侧设备的高效Gemini版本(1.8B/3.25B)


谷歌Gemini背后技术的杀手锏,便是原生多模态(natively multimodal)。

因为以往创建多模态大模型的方法,通常是为不同的模态训练单独的组件,然后将它们拼接在一起,大致模拟其中的一些功能。

这样训练出来的模型虽然有时可以很好地执行某些任务(比如描述图像),但在面对更具概念性和复杂推理的情况下,就会出现表现不佳的结果。

而谷歌Gemini所强调的原生多模态,是指从一开始就对不同的模态进行预训练,然后用额外的多模态数据对其进行微调,以此来进一步完善大模型的有效性。

谷歌对此表示:

这样的训练方法,有助于Gemini从头开始无缝地理解和推理各种输入,远远优于现有的多模态模型;而且它的功能在几乎每个领域都是最先进的。

页: [1]
查看完整版本: #Google 发布最强#大模型 #Gemini 暴打 #GPT4