使用 Nvidia 的“Chat with RTX”,您可以构建本地文件聊天机器人
00 分钟
2024-1-12
2024-3-14
type
status
date
slug
summary
tags
category
icon
password
URL
Nvidia 发布了一款名为 Chat with RTX 的新演示应用程序,允许用户使用自己的内容(例如文档、笔记、视频或其他数据)对 LLM 进行个性化设置。
该应用程序利用检索增强生成 (RAG)、TensorRT LLM 和 RTX 加速,使用户能够查询自定义聊天机器人并快速安全地接收上下文答案。
该聊天机器人在 Windows RTX PC 或工作站上本地运行,因此与云版本相比提供了额外的数据保护。
Chat with RTX 支持多种文件格式,包括文本、pdf、doc/docx 和 xml。用户只需将适当的文件夹附加到应用程序,然后应用程序将文件加载到库中。
此外,用户可以指定 YouTube 播放列表的 URL,应用程序将加载播放列表中视频的文字记录并使其支持聊天。 Google Bard 提供了类似的功能,但仅限于 Google Cloud 中的 Google 帐户。 Chat with RTX 在本地处理脚本。
视频:英伟达
💡
网站连接
 
Nvidia 在此提供注册服务,以便在软件可用时收到通知。

开发者可以立即开始

开发人员可以立即开始使用,因为 Chat with RTX Tech Demo 基于 TensorRT-LLM RAG 开发人员参考项目(可在 GitHub 上获取)。据 Nvidia 称,开发人员可以使用此参考来开发和部署自己的基于 RAG 的 RTX 应用程序,该应用程序由 TensorRT-LLM 加速。
除了 Chat with RTX 之外,Nvidia 还在 CES 上推出了 RTX Remix,这是一个用于创建经典游戏 RTX 重制版的平台,将于 1 月份推出测试版。
Nvidia ACE微服务也宣布推出,为游戏提供基于生成式人工智能的智能动态数字化身。
此外,还针对 Stable Diffusion XL (SDXL) Turbo 和 Latent Consistency 模型发布了 TensorRT 加速,据称可带来高达 60% 的性能提升。
Stable Diffusion WebUI TensorRT 扩展的更新版本现已推出,改进了对 SDXL、SDXL Turbo、LCM - 低阶适应 (LoRA) 的支持。

总结

  • Nvidia 宣布推出 Chat with RTX,这是一款演示应用程序,允许用户使用自己的内容个性化 LLM 聊天机器人,并在 Windows RTX PC 或工作站上本地运行。
  • 该应用程序支持各种文件格式,并允许将 YouTube 播放列表脚本集成到聊天机器人中。
  • 开发人员可以使用 GitHub 上的 TensorRT-LLM RAG 开发人员参考项目来开发和部署自己的基于 RAG 的 RTX 应用程序。
 

评论
  • Twikoo