英伟达预告新版TensorRT

发布时间：2023-11-17 07:52:53 | 阅读量：4547 | 文章来源：电竞竞猜官网,lol正规押注平台,电竞比赛竞猜平台

IT之家 11 月 16 日消息，英伟微软 Ignite 2023 大会已于今天拉开帷幕，达预英伟达高管出席本次大会并宣布更新 TensorRT-LLM，告新添加了对 OpenAI Chat API 的英伟支持。

IT之家今年 10 月报道，达预英伟达面向数据中心和 Windows PC，告新推出 Tensor RT-LLM 开源库。英伟最大的达预特点是，如果 Windows PC 配备英伟达 GeForce RTX GPU，告新TensorRT-LLM 可以让 LLM 在 Windows PC 上的英伟运行速度提高四倍。

英伟达在今天 Ignite 2023 大会上，宣布更新 TensorRT-LLM，告新添加 OpenAI 的英伟 Chat API 支持，并增强 DirectML 功能，达预改善 Llama 2 和 Stable Diffusion 等 AI 模型的告新性能。

TensorRT-LLM 可以通过英伟达的 AI Workbench 在本地完成，开发者可以使用这个统一、易用的工具包，在 PC 或工作站上快速创建、测试和定制预训练的生成式 AI 模型和 LLM。英伟达还为此推出了抢先体验注册页面。

英伟达将于本月晚些时候发布 TensorRT-LLM 0.6.0 版本更新，推理性能提高 5 倍，并支持 Mistral 7B 和 Nemotron-3 8B 等其它主流 LLM。

用户可以在 8GB 显存以上的 GeForce RTX 30 系列和 40 系列 GPU 上运行，一些便携式 Windows 设备也能使用快速、准确的本地 LLM 功能。

上一篇：农行山东嘉祥支行：千元残币换整币客户舒心“点赞”

下一篇：宅男财经｜30亿量化跑路有什么启示？专家：应严审资质和资本金保障

新闻资讯

英伟达预告新版TensorRT