英伟达昨日发布了其 TensorRT 的 8.0 版本。TensorRT 可以看作是在英伟达各种 GPU 硬件平台下运行的一个深度学习推理框架,其核心是一个 C++ 库。开发者可以将其他框架训练好的模型转化为 TensorRT 格式,并通过 TensorRT 推理引擎提升该模型的运行速度。芯东西等媒体和英伟达 AI 软件部的产品管理总监 Kari Briski、产品营销主管 Siddharth Sharma 就 TensorRT 8 的技术细节、应用落地等进行了深入地探讨。此外,Kari Briski 和 Siddharth Sharma 也分享了英伟达团队在推荐系统竞赛中所取得的成绩。一、运行速度和精准度提升 1 倍,推理延迟仅有 1 毫秒Kari Briski 首先回顾了英伟达 TensorRT 的推出背景和成绩。她说,AI 模型正在以指数级的速度增长,很多公司不得不缩减模型大小以追求响应速度。而英伟达 2016 年推出的
英伟达 TensorRT 8 上线,BERT 推理延迟仅有 1.2 毫秒
2021-07-21 12:45:27来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 消息称英伟达将携手联发科进军掌机市场,打造基于 ARM 架构的芯片2024-05-15 20:40:58
- 消息称三星电子 8 层堆叠 HBM3E 内存尚未正式通过英伟达验证2024-05-13 18:21:47
- 消息称联发科将携手英伟达开发 ARM 架构 AI PC 处理器,有望下月公布合作细节2024-05-13 08:04:04
- 更专注AI和半导体,甚至有意PK英伟达!软银出售部分“愿景基金”资产2024-05-11 13:09:51
- 美股大型科技股盘前多数上涨,英伟达涨超1%2024-05-10 20:43:45
- TrendForce:2023 年英伟达超越高通成为全球营收最高芯片设计厂商2024-05-09 22:11:29
- 英伟达发布 552.44 驱动更新,支持《对马岛之魂:导演剪辑版》与《家园 3》2024-05-09 22:36:41
- 传软银正洽谈收购一家AI芯片初创公司 曾被冀望成为“英国英伟达”2024-05-09 17:29:15
- 郭明錤预测英伟达 2025 年第 4 季度量产新一代 R 系列 AI 芯片2024-05-08 06:41:36
- 英伟达 RTX 5080 显卡有望先于 5090 推出,RTX 50 系散热模组已开始测试2024-05-08 11:06:20