softmax 求导 / label_smoothing 求导 / 知识蒸馏求导
date
Sep 18, 2022
Last edited time
Mar 27, 2023 08:49 AM
status
Published
slug
softmax求导label_smoothing求导,知识蒸馏求导
tags
Algorithm
summary
转载
type
Post
origin
Field
Plat
softmax 求导
链式求导
分别求解
则有
label_smoothing
其中:
求导结果与上面 softmax 相同
知识蒸馏
有两个 , 分别对应教师网络和学生网络的输出
当
当
带入链式求导公式
将 带入,并通过泰勒公式
假设 logits 的均值为 ,即
所以,当导数等于 0 的时候,student 网络生成的 logit 模仿的就是 teacher 网络的 logit。