这样的L∗跟原来的是完全等价的,由于σ(0)=0.5,因此它也等价于: 这时候思路就很明显了,要想“软化”这个 loss,就得“软化”θ(x),而软化它就再容易不过,它就是 sigmoid 函数。我们有: 所以很显然,我们将θ(x)替换为σ(Kx)即可: 这就是我昨晚思考得到的 loss 了,显然实现上也是很容易的。 现在跟 F...