梯度下降法是一个最优化算法,通常也称为Steepest Descent(最速下降法)。是求解无约束优化问题最简单的方法之一,许多有效算法都是以它为基础进行改进和修正而得到的。基于一维变量的解释如下:

求解f(x)的最小值,则通过迭代的方法为,不同的求解的方法,可以衍生出不同的算法,梯度下降中

  • Multi-Dimention

  • Tips

    1. 要同时更新. 即计算时,使用的是未更新的
    2. 的取值太小,收敛速度比较慢。太大则会发散
    3. 定了以后,下降的步长会越来越小, 因为梯度是越来越小的
    4. Feature Normalization可以加快收敛的速度

References


参考教材,并提供了一种确定步长的方法