高性能深度学习支持引擎实战——TensorRT

  • 时间:
  • 浏览:1

以下内容根据演讲嘉宾视频分享以及PPT整理而成。

推广:数十款阿里云产品限时折扣中,赶紧点击这里,领劵刚开始云上实践吧!

二、TensorRT高阶介绍:对于进阶的用户,经常突然出现TensorRT不支持的网络层该怎样外理;低精度运算如fp16,亲戚亲戚朋友儿也知道英伟达最新的v100带的TensorCore支持低精度的fp运算,包括上一代的Pascal的P10

本场技术沙龙回顾链接:TensorRT加速淬硬层 学习在线部署

本次的分享主要分为两帕累托图:

一、TensorRT理论介绍:基础介绍TensorRT是这些;做了这些优化;为这些在有了框架的基础上还必须TensorRT的优化引擎。

李曦鹏,现任英伟达devTech团队高级软件工程师,毕业于中国科学院过程工程研究所,拥有近10年CUDA/HPC编程经验。主要负责淬硬层 神经网络和高性能计算的性能优化。

演讲嘉宾简介: