softmax 求导 / label_smoothing 求导 / 知识蒸馏求导

date
Sep 18, 2022
Last edited time
Mar 27, 2023 08:49 AM
status
Published
slug
softmax求导label_smoothing求导,知识蒸馏求导
tags
Algorithm
summary
转载
type
Post
origin
Field
Plat

softmax 求导

链式求导
分别求解
则有

label_smoothing

其中:
求导结果与上面 softmax 相同

知识蒸馏

有两个 , 分别对应教师网络和学生网络的输出
带入链式求导公式
带入,并通过泰勒公式
假设 logits 的均值为 ,即
所以,当导数等于 0 的时候,student 网络生成的 logit 模仿的就是 teacher 网络的 logit。

© Lazurite 2021 - 2024