近端梯度下降法是众多梯度下降 (gradient descent) 方法中的一种,其英文名称为proximal gradident descent,其中,术语中的proximal一词比较耐人寻味,将proximal翻译成“近端”主要想表达"(物理上的)接近"。与经典的梯度下降法和随机梯度下降法相比,近端梯度下降法的适用范围相对狭窄
梯度下降公式详细推导 序言预备知识一般求导法则(Elementary rules of differentiation) 激活函数(Activation Function)Sigmoid Function 前向传播(Forward propagation)均方误差代价函数梯度参数更新 与门(OR Ga… vvw Stone-Weierstrass定理 本文的内容主要来自于Conway《A First Course in Functional Analysis》的Weak Topology...