求导过程,请参考:Softmax vs. Softmax-Loss: Numerical Stability Negative log-likehood 当我们使用softmax 函数作为 output function的时候,即: y=softmax(z)y=softmax(z) zz在这里只表示某些需要优化的参数。 我们需要选择 negiative log-likelihood 作为代价函数( cost function), 也被称作 Cross-Entropy cos...