新闻资讯
谷歌推出Gemini Pro API访问
00 分钟
2023-12-14
2024-3-14
type
status
date
slug
summary
tags
category
icon
password
URL

谷歌正在为开发人员提供 Gemini Pro 的访问权限,这是其新的多模式人工智能,可以处理文本和图像输入。

该模型在谷歌数据中心运行,可通过 Gemini API 访问,并可与谷歌 AI SDK(Android 客户端 SDK)集成。据谷歌称,该 SDK 使开发人员无需构建自己的后端基础设施。
开发者可以通过Google AI Studio集成Gemini Pro、生成API密钥并构建AI应用程序。
谷歌表示,在 Android Studio 的最新预览版中,通过新的项目模板,开发人员可以更轻松地使用 Gemini API。
上周,谷歌已经发布了 Gemini Nano 的访问权限,这是一种通过 AICore 在特定设备上可用的设备上模型。 Nano 将在新的 Google Pixel 8 上运行。

MLLM 基准之战已经打响

Gemini Pro的性能大致相当于GPT-3.5。据谷歌称,Gemini Pro 在八项基准测试中的六项优于 OpenAI 模型。谷歌还更新了其 ChatGPT 竞争对手 Bard 的 Gemini Pro。
Google 的 GPT 4 竞争对手 Ultra 将于明年初跟进。谷歌已经证明,使用特殊的提示方法,它可以在 MMLU 等关键基准测试中击败 GPT-4。微软此后回应称,同样由特殊提示方法控制的 GPT-4 在基准测试中即使不是更好,也同样好。
微软最近还推出了 Phi-2,与 Nano 一样,这是一种针对设备性能进行优化的小型、大型语言模型。在微软提出的所有基准测试中,Phi-2 的表现都优于谷歌的 Gemini Nano。
更有趣的是模型在真实场景中的表现。性能在这里很重要,并且可能会偏离基准测试中测量的值。

总结

  • 谷歌已经向开发者开放了 Gemini Pro,这是一种多模式人工智能,可以处理文本和图像输入,并且可以通过 Android 版谷歌 AI SDK 进行集成。 Gemini Nano 也可用于移动设备。
  • Gemini Pro 的性能与 GPT-3.5 相似,谷歌声称它在八项基准测试中的六项优于 OpenAI 模型。谷歌还更新了其 ChatGPT 竞争对手 Bard 的 Gemini Pro。
  • 微软还推出了 Phi-2,这是一种针对设备性能进行优化的小型、大型语言模型,在微软提出的所有基准测试中,其性能均优于谷歌的 Gemini Nano。
 

评论
  • Twikoo