深度学习模型压缩(减枝、量化、知识蒸馏)有哪些奥秘?
- 内容介绍
- 文章标签
- 相关推荐
哈哈,今天咱们来聊聊这个热门话题——深度学习模型压缩那个。你懂的,现在AI模型越做越大,动不动就几个G的参数量,放到手机上跑?那不得卡成狗!所以压缩这事儿就变得特别重要了。
一、 先说说为啥要压缩
那啥,现在深度学习模型就像个吃货,参数多的离谱。你看那个BERT啊、ViT啊,动不动就十几二十G的大小。要是把这玩意儿直接放到手机上跑,别说实时推理了估计手机都得烫死手,拜托大家...!

KTV你。 而且呢,不是只有手机端有需求。边缘设备、嵌入式系统这些地方也都需要轻量化模型。所以压缩技术就是为了让这些庞然大物变瘦子,让它们能在资源受限的环境下快速高效地运行。
二、 剪枝:给模型减肥
剪枝就像给植物修剪枝叶一样,把没用的部分去掉。在深度学习里面呢,主要分两种方式:,结果你猜怎么着?
结构化剪枝
这个简单粗暴!直接整个通道或者整个神经元砍掉!比如一个卷积层有64个输出通道,你觉得某些通道对后来啊贡献小的话,直接砍掉它!这样后面全连接层的输入维度也会相应减少,求锤得锤。。
这种方法好处是兼容性强啊!主要原因是整块去掉嘛。硬件加 到时候….. 速框架比如TensorRT之类都能很顺利地优化这种结构。
这个精细很多哦~它会针对每一个单独的权重进行打分和筛选。比如某些权重接近零的那些可以去除掉不影响精度太多,不地道。。
尊嘟假嘟? 不过哈~这个方式比较复杂啦!主要原因是需要存储稀疏矩阵什么的嘛。
哈哈,今天咱们来聊聊这个热门话题——深度学习模型压缩那个。你懂的,现在AI模型越做越大,动不动就几个G的参数量,放到手机上跑?那不得卡成狗!所以压缩这事儿就变得特别重要了。
一、 先说说为啥要压缩
那啥,现在深度学习模型就像个吃货,参数多的离谱。你看那个BERT啊、ViT啊,动不动就十几二十G的大小。要是把这玩意儿直接放到手机上跑,别说实时推理了估计手机都得烫死手,拜托大家...!

KTV你。 而且呢,不是只有手机端有需求。边缘设备、嵌入式系统这些地方也都需要轻量化模型。所以压缩技术就是为了让这些庞然大物变瘦子,让它们能在资源受限的环境下快速高效地运行。
二、 剪枝:给模型减肥
剪枝就像给植物修剪枝叶一样,把没用的部分去掉。在深度学习里面呢,主要分两种方式:,结果你猜怎么着?
结构化剪枝
这个简单粗暴!直接整个通道或者整个神经元砍掉!比如一个卷积层有64个输出通道,你觉得某些通道对后来啊贡献小的话,直接砍掉它!这样后面全连接层的输入维度也会相应减少,求锤得锤。。
这种方法好处是兼容性强啊!主要原因是整块去掉嘛。硬件加 到时候….. 速框架比如TensorRT之类都能很顺利地优化这种结构。
这个精细很多哦~它会针对每一个单独的权重进行打分和筛选。比如某些权重接近零的那些可以去除掉不影响精度太多,不地道。。
尊嘟假嘟? 不过哈~这个方式比较复杂啦!主要原因是需要存储稀疏矩阵什么的嘛。

