发布时间:2025-03-10 04:09:39 作者:f 点击:5 【 字体:大中小 】
感谢众多用户及合作伙伴一直以来对NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 现已在 GitHub 上公开发布!
TensorRT-LLM
持续助力用户优化推理性能
TensorRT-LLM 可在 NVIDIA GPU上加速和优化最新的大语言模型(Large Language Models)的推理性能。该开源程序库在 /NVIDIA/TensorRT-LLM GitHub 资源库中免费提供。
近期,我们收到了许多用户的积极反馈,并表示,TensorRT-LLM 不仅显著提升了性能表现,还成功地将其应用集成到各自的业务中。TensorRT-LLM 强大的性能和与时俱进的新特性,为客户带来了更多可能性。
Roadmap 现已公开发布
过往,许多用户在将 TensorRT-LLM 集成到自身软件栈的过程中,总是希望能更好地了解 TensorRT-LLM 的 Roadmap。即日起,NVIDIA 正式对外公开 TensorRT-LLM 的 Roadmap ,旨在帮助用户更好地规划产品开发方向。
我们非常高兴地能与用户分享,TensorRT-LLM 的 Roadmap 现已在 GitHub 上公开发布。您可以通过以下链接随时查阅:
https://github.com/NVIDIA/TensorRT-LLM
图 1. NVIDIA/TensorRT-LLM GitHub 网页截屏
这份 Roadmap 将为您提供关于未来支持的功能、模型等重要信息,助力您提前部署和开发。
同时,在 Roadmap 页面的底部,您可通过反馈链接提交问题。无论是问题报告还是新功能建议,我们都期待收到您的宝贵意见。
图 2.Roadmap 整体框架介绍
利用 TensorRT-LLM
优化大语言模型推理
TensorRT-LLM 是一个用于优化大语言模型(LLM)推理的库。它提供最先进的优化功能,包括自定义 Attention Kernel、Inflight Batching、Paged KV Caching、量化技术(FP8、INT4 AWQ、INT8 SmoothQuant 等)以及更多功能,以让你手中的 NVIDIA GPU 能跑出极致推理性能。
TensorRT-LLM 已适配大量的流行模型。通过类似 PyTorch 的 PythonAPI,可以轻松修改和扩展这些模型以满足自定义需求。以下是已支持的模型列表。
我们鼓励所有用户定期查阅 TensorRT-LLM Roadmap。这不仅有助于您及时了解 TensorRT-LLM 的最新动态,还能让您的产品开发与 NVIDIA 的技术创新保持同步。
卡马文加:姆巴佩西语很好已经融入更衣室赢球是每个人的目标
阿媒:伊卡尔迪和新女友厮混迟迟不归队,加拉塔萨雷威胁解约
DCS控制系统如何工作
阿媒:伊卡尔迪和新女友厮混迟迟不归队,加拉塔萨雷威胁解约
多方位调整定位 推动十大清洁剂品牌快速发展
等了一小时!马卡:安切洛蒂赛后对新闻发布会时间安排表达不满
ezvalo几光美妆灯LED化妆镜灯怎么样?
好消息!郑州金水路商都路要下穿新东三环啦
发展受限 清洁剂企业在2019年还有春天么?
佰维存储:聚焦AI终端产品与先进封装技术的未来发展
全球首家“工程医院”在河南诞生 "专治"基础工程设施
90度向家长鞠躬10秒以上 "特殊校规"被赞走心
十大清洁剂品牌如何创造和进行营销?
万家乐全屋定制“超级柜不贵”国庆促销全面启动
金秋十月发展黄金期 柏克体育为理想奋力冲刺!
好消息!郑州金水路商都路要下穿新东三环啦
做好规划 小家电企业才能将品牌塑造提升高度
汇龙涂料举办2020年营销事业部销售会议:夯实基础,逆势谋进
反败为胜!阿斯:弗里克在半场13落后时并未爆粗,而是耐心指导
艺术漆莫兰迪色系浅灰绿,淡雅不失大气活力
印尼媒:中国队2个球都是比赛前期打进印尼要警惕比赛开始和尾声
宏微科技受邀出席中国电源学会展览会
2018年高招报名信息采集 本月下旬启动
B席:巴黎更有激情和侵略性理应获胜,我们要接受现状且下场赢球