|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 不二如是 于 2023-12-7 09:54 编辑
“最大”、“最强”,主打的就是一个干爆GPT-4。
具体来说,此次谷歌一共带来了Gemini的三个版本:
- Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务
- Gemini Pro:可扩展至各种任务的Gemini模型
- Gemini Nano:适用于端侧设备的高效Gemini版本(1.8B/3.25B)
谷歌Gemini背后技术的杀手锏,便是原生多模态(natively multimodal)。
因为以往创建多模态大模型的方法,通常是为不同的模态训练单独的组件,然后将它们拼接在一起,大致模拟其中的一些功能。
这样训练出来的模型虽然有时可以很好地执行某些任务(比如描述图像),但在面对更具概念性和复杂推理的情况下,就会出现表现不佳的结果。
而谷歌Gemini所强调的原生多模态,是指从一开始就对不同的模态进行预训练,然后用额外的多模态数据对其进行微调,以此来进一步完善大模型的有效性。
谷歌对此表示:
这样的训练方法,有助于Gemini从头开始无缝地理解和推理各种输入,远远优于现有的多模态模型;而且它的功能在几乎每个领域都是最先进的。
|
|