Skip to content

Latest commit

 

History

History
 
 

043INF_Slim

模型压缩

《模型压缩》模型压缩跟轻量化网络模型不同,压缩主要是对轻量化或者非轻量化模型执行剪枝、蒸馏、量化等压缩算法和手段,使得模型更加小、更加轻便、更加利于执行。

希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!

内容大纲

PPT字幕需要到 Github 下载,网页课程版链接会失效哦~

建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~

大纲 小节 链接
模型压缩 01 基本介绍 PPT, 视频
模型压缩 02 低比特量化原理 PPT, 视频
模型压缩 03 感知量化训练 QAT PPT, 视频
模型压缩 04 训练后量化PTQ与部署 PPT, 视频
模型压缩 05 模型剪枝 PPT, 视频
模型压缩 06(上) 知识蒸馏原理 PPT, 视频
模型压缩 06(下) 知识蒸馏算法 PPT, 视频
:maxdepth: 2

01.introduction
02.quant
03.qat
04.ptq
05.pruning
06.distillation
07.distillation