《模型压缩》模型压缩跟轻量化网络模型不同,压缩主要是对轻量化或者非轻量化模型执行剪枝、蒸馏、量化等压缩算法和手段,使得模型更加小、更加轻便、更加利于执行。
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!
内容大纲
PPT
和字幕
需要到 Github 下载,网页课程版链接会失效哦~建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~
大纲 | 小节 | 链接 |
---|---|---|
模型压缩 | 01 基本介绍 | PPT, 视频 |
模型压缩 | 02 低比特量化原理 | PPT, 视频 |
模型压缩 | 03 感知量化训练 QAT | PPT, 视频 |
模型压缩 | 04 训练后量化PTQ与部署 | PPT, 视频 |
模型压缩 | 05 模型剪枝 | PPT, 视频 |
模型压缩 | 06(上) 知识蒸馏原理 | PPT, 视频 |
模型压缩 | 06(下) 知识蒸馏算法 | PPT, 视频 |
:maxdepth: 2
01.introduction
02.quant
03.qat
04.ptq
05.pruning
06.distillation
07.distillation