返回
企业应用
知识蒸馏是一种模型压缩的方法吗?
知识蒸馏确实是一种广泛认可且有效的模型压缩方法。它支持在不显著损失性能的情况下训练出远小于原始模型的神经网络模型。
其核心原理是将知识从大型、复杂、高性能模型(教师)迁移到更小、更简单的模型(学生)。这种知识迁移通过以下方式实现:训练学生模型不仅预测真实类别标签(硬目标),还模仿教师在各类别上的软化输出概率分布(软目标)。该技术利用了教师在 softmax 层输出中可能捕获的对输入关系更细致的理解。
作为一种压缩方法,知识蒸馏有助于在手机或边缘系统等资源受限设备上部署模型。它降低了计算需求、延迟、内存占用和能耗,使强大的 AI 模型在实际应用中更易获取,也更加节能环保。
FAQ