通过超参数搜索,在biases从0到-10的一个步长为-1的交叉验证。最后得到结果是bias = -6 的情况下,表现最优,但也会得到8.7%的测试误差,这比ResNet110的基本模型表现都差很多。 Exclusive gating在bias初始化不合适的时候,甚至都不会收敛到一个好的结果。 Exclusive gating 的缺点在于two-fold, 当1-g(x)趋近...