科探空谷
  • Home
  • zhimind home
  • Categories
  • Tags
  • Archives
  • 留学
    • 学校库
    • 专业库
    • 研究方向与招生
    • 工具
    • GPA计算器
    • 脑洞背单词
    • 脱口而出

固化度,神经网络泛化能力评估新角度

概述¶

定义固化度stiffness为一个输入的梯度对另一个输入损失、梯度的影响

一种新指标, 实验及结论需要读懂

但实验和实验结论一向难细看。

数学定义¶

给定神经网络 $f$, 损失函数 $L$, 则对两个输入 $(X_1, y_1), (X_2, y_2)$可求梯度:

$$ \vec{g}{1}=\nabla\right) \} \mathcal{L}\left(f_{W}\left(X_{1}\right), y_{1
\vec{g}{2}=\nabla\right) $$} \mathcal{L}\left(f_{W}\left(X_{2}\right), y_{2

如果网络权重$W$沿$\vec{g}$方向进行变化, 我们可以得到两个输入的损失变化:

$$ \begin{aligned} \Delta \mathcal{L}{1} &=\mathcal{L}\left(f{1}}\left(X\right) \}\right), y_{1}\right)-\mathcal{L}\left(f_{W}\left(X_{1}\right), y_{1

&= \varepsilon \nabla_{\varepsilon} \mathcal{L}\left(f_{W+\varepsilon \vec{g}{1}}\left(X\right) \ &=\varepsilon \vec{g}}\right), y_{1{1} \cdot \vec{g} \ \Delta \mathcal{L}{2} &=\varepsilon \nabla} \mathcal{L}\left(f_{W+\varepsilon \vec{g{1}}\left(X\right) \ & =\varepsilon \vec{g}}\right), y_{2{1} \cdot \vec{g} \end{aligned} $$

则数学化描述固化度为: $$ S((X_{1}, y_{1}),(X_{2}, y_{2}) ; f)=\mathbb{E}[\operatorname{sign}(\overrightarrow{g_{1}} \cdot \overrightarrow{g_{2}})] $$ stiffness


Published

5月 3, 2019

Category

论文

Tags

  • 神经网络 1

Stay in Touch

  • Powered by Pelican. Theme: Elegant by Talha Mansoor