新闻资讯
Maisa的“知识处理单元”旨在让每种语言模型变得更加智能
00 分钟
2024-3-17
2024-3-17
type
status
date
slug
summary
tags
category
icon
password
URL
借助“知识处理单元”(KPU),人工智能初创公司 Maisa 开发了一种新颖的软件框架,为 GPT-4 或 Claude 等语言模型配备了复杂的推理能力 - 从而在初步测试中取得了顶级成绩。
KPU 不限于特定的语言模型,而是可以与不同的语言模型模块化地工作。
Maisa 首席执行官 David Villalón 解释道:“你可以像计算机一样想象:语言模型是主处理器 (CPU),KPU 是用于知识处理的图形处理器 (GPU)。”
该架构由三个主要组件组成:“推理引擎”(规划器)思考如何逐步解决任务以及需要哪些工具。这里 Maisa 还使用了 LLMs 的功能,目前是 GPT-4。
“执行引擎”(执行者)将计划者的指令付诸行动,并告诉他一切是否顺利或者是否存在问题。
虚拟上下文窗口(中介)允许 KPU 通过智能管理数据并仅提供解决问题真正需要的信息来充分利用语言模型的功能。
这意味着计划者可以完全专注于他的任务,而不会被不重要的细节所困扰。
这种有针对性的信息交换使 KPU 能够有效地处理更长的文本和更复杂的任务,而无需诉诸“分块”(将文本划分为多个部分)或“嵌入”(将单词转换为数字)等技术。
Maisa“KPU”的结构。 |图片:梅萨
Maisa“KPU”的结构。 |图片:梅萨
Maisa 表示,这种推理和数据处理的解耦旨在克服先前语言模型的典型弱点,例如幻觉、有限的上下文窗口、过时的知识以及与外部系统的不兼容。
同时,该框架旨在比直接使用复杂的多级逻辑解决方案模型更高效、更具成本效益。
演示:KPU 读取客户发来的电子邮件,尽管订单号写得不正确,但仍找到正确的订单,并向客户回复包裹所在位置。这是通过广泛的推理过程实现的。 |视频:麦莎

Maisa KPU 改进了 GPT-4

在最初的测试中,Maisa 利用其 KPU 优化了著名的 GPT-4 语言模型。 Villalón 表示,借助 Claude 3 Opus 语言模型,KPU 可以再次“显着”改善基准测试结果。使用的语言模型越强大,KPU 的工作效果就越好。
在数学应用题的 GSM8k、数学竞赛的 MATH 数据集、阅读和理解任务 DROP 以及 Big-Bench Hard 的部分等要求较高的推理基准测试中,KPU 取得了最高值,并在零样本方法中超越了它们,即没有额外的说明或示例领先的语言模型。
结果由 Maisa 发表供审查。
借助连接的 KPU,GPT-4 Turbo 据称可以通过更简单的提示(0-shot)在逻辑测试中取得明显更好的结果。 |图片:梅萨
借助连接的 KPU,GPT-4 Turbo 据称可以通过更简单的提示(0-shot)在逻辑测试中取得明显更好的结果。 |图片:梅萨
Maisa 看到了在具有专业知识的数字助理、复杂流程的自动化、大量数据的分析或智能学习程序中的可能应用。由于其模块化结构,KPU可以灵活使用且可扩展。
该软件目前仍处于测试阶段。然而,感兴趣的各方已经可以被列入测试版的等待名单中。 Maisa 尚未给出上市准备日期。该系统通过 API 和 Web 界面提供。
如果 KPU 背后的承诺得以实现,它可以显着提高人工智能系统独立思考和解决问题的能力。 Maisa 的技术是否有独特的卖点,或者 BigAI 是否尚未为下一代模型计划类似的方法(参见 Q*、Cappy 或 Quiet Star),还有待观察。
总结
  • 人工智能初创公司 Maisa 借助“知识处理单元”(KPU)开发了一种新颖的软件框架,为 GPT-4 或 Claude 等语言模型配备了复杂的推理能力,从而在初步测试中取得了顶级成绩。
  • KPU架构由三个基本组件组成:“推理引擎”(连接的LLM)计划解决问题的步骤,“执行引擎”执行指令,“虚拟上下文窗口”管理智能数据,让LLM在做出结论时能够专注于相关内容。
  • 在要求较高的推理基准测试中,基于 GPT-4 且没有示例或添加的提示(零样本)的 KPU 优于没有 KPU 但具有思维链等复杂推理提示的领先语言模型。

评论
  • Twikoo