新闻资讯
更新后:OpenAI 的 GPT-4 在重要基准测试中再次领先于 Claude 3 Opus
00 分钟
2024-4-12
2024-4-12
type
status
date
slug
summary
tags
category
icon
password
URL
2024 年 4 月 12 日更新:
OpenAI 最近发布的新变体 GPT-4 在聊天机器人领域再次领先。据该基准的发布者称,GPT-4 表现出了卓越的性能,尤其是在编码和推理方面。
不过,在拥有 500 个以上代币的参赛作品方面,克劳德 3 号作品仍处于领先地位(长查询竞技场)。
图片:Lmsys.org via X
图片:Lmsys.org via X
随着 Claude 3 Opus 取代 GPT-4 登上聊天机器人排行榜的首位,OpenAI 的霸主地位正在动摇,尽管 OpenAI 仍在继续利用其模型渗透市场,尤其是面向最终用户的 ChatGPT。
不过,Anthropic 目前很可能在应用编程接口(API)的使用方面迎头赶上。OpenAI 领导层的动荡已经对 Anthropic 起到了推波助澜的作用,并向公司表明,他们不想依赖于单一的人工智能制造商。
OpenAI 可能很快就会反击:有消息称,该公司最早可能在今年夏天推出一款功能更强大的新机型,可能是 GPT-4.5 或 GPT-5。OpenAI 老板山姆-奥特曼(Sam Altman)已经证实,公司打算在今年向市场推出一款 "惊人的 "人工智能机型。
总结
  • Anthropic公司的人工智能助手克劳德3号(Claude 3 Opus)在聊天机器人竞技场排行榜上超过了OpenAI公司的GPT-4。这是 GPT-4 自一年前推出以来首次被赶下宝座。
  • Chatbot Arena 由大型模型系统组织(LMSYS)开发,是一个基准平台,用于在匿名、随机选择的对决中比较基于用户偏好的大型语言模型的性能。
  • 据传,OpenAI 将在今年夏天发布一款功能更强大的新机型,以应对这一挑战。首席执行官山姆-奥特曼(Sam Altman)已经证实,OpenAI 将在今年推出一款 "惊人的 "人工智能模型。
 

评论
  • Twikoo