2.每层神经元的个数 3.如何初始化Weights和biases 4.loss函数选择哪一个 5.选择何种Regularization?L1,L2 6.Regularization parameter lambda选择多大合适 7.激励函数如何选择 8.是否使用dropout 9.训练集多大比较合适 10.mini-batch选择多大 11.学习率多少合适 ...