使用这个先验,拟合参数 θMAP将比最大似然有更小的范数。实际上,这将使参数的贝叶斯 MAP 估计比 ML 的最大似然估计更少的过拟合。例如贝叶斯 Logistic 回归对于文本分类就是一个很有效的算法,即使 n>>m。 参考资料: 1、http://cs229.stanford.edu/notes/cs229-notes5.pdf...