2024-11-20 06:15来源:本站
昨晚,谷歌向世界介绍了其最新的语言模型(LLM),名为Gemini。这个新的LLM可以无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。谷歌声称Gemini是他们迄今为止最强大、最通用的人工智能模型。然而,事情远比你看到的要复杂。双子座不仅仅是一个模特;它实际上是一系列人工智能模型,有三种尺寸:Gemini Ultra、Gemini Pro和Gemini Nano。
据谷歌称,其新的旗舰人工智能模型Gemini已经推出了第一次迭代,即1.0版本,并有三种不同的尺寸,每种尺寸都是根据特定需求量身定制的。它可以灵活地运行在从数据中心到移动设备的所有设备上。“我们设计的双子座是天生的多模式,从一开始就对不同的模式进行了预先训练。然后,我们用额外的多模式数据对其进行微调,以进一步提高其有效性。”
1. Gemini Nano:谷歌的Gemini Nano是一款轻量级的人工智能模型,专门针对移动设备,特别是Pixel 8进行了优化。这种高效的模型使设备上的任务能够无缝地执行,甚至离线。无论是在聊天应用中建议相关回复,还是总结文本内容,Gemini Nano都提供了强大的人工智能功能,而无需依赖外部服务器,确保了流畅和响应迅速的用户体验。
2. Gemini Pro: Gemini Pro是Gemini AI的高级版本,有望成为众多Google AI服务背后的推动力,从今天开始为Bard提供基础支持。Gemini Pro运行在谷歌的数据中心,专门为最新版本的人工智能聊天机器人Bard提供动力。这种先进的技术提供了快速的响应时间和非凡的理解复杂查询的能力。
3. 双子座Ultra:双子座Ultra是谷歌最强大的法学硕士。据说它擅长处理高度复杂的任务,最适合数据中心和企业应用程序。虽然尚未广泛使用,但谷歌将Gemini Ultra描述为“在大型语言模型(LLM)研究和开发中广泛使用的32个学术基准中,有30个的最新成果超过了目前最先进的水平。”这意味着它在大多数标准测试中优于其他llm。Gemini Ultra专为复杂任务而设计,预计将在完成目前的测试阶段后发布。
Gemini AI从Gemini Nano开始,现在可以在Pixel 8 Pro上访问,引入了增强的功能,如Recorder应用程序中的摘要和Gboard上的智能回复,最初在WhatsApp上实现。Gemini的扩张计划包括谷歌的各种产品和服务,包括搜索、广告、Chrome和Duet AI。
与此同时,Gemini已经被整合到谷歌搜索中,以加速搜索生成体验(SGE)。结果是“在美国,英语的延迟减少了40%,同时提高了质量。”
从12月13日开始,开发者和企业用户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。Android开发者还可以通过AICore使用Gemini Nano,这是Android 14在Pixel 8 Pro设备上提供的一项新功能。在Gemini Ultra进行信任和安全评估的同时,选定的客户、开发人员、合作伙伴和安全专家将有机会进行早期测试和反馈。它将于明年初面向更广泛的开发人员和企业用户开放。
与此同时,巴德将获得一个特别改编的Gemini Pro英语版本,增强其推理、计划和理解能力。在接下来的一年里,谷歌将推出Bard Advanced,从Gemini Ultra开始,使用户可以提前使用我们最先进的模型和功能。