《人工智能导论:模型与算法》习题参考答案 第一章绪论 1.B 2.D 3.B 4.D 5.C 6.B 7.略 8.略 9 . 略 10.参考答案:强化学习有环境、智能体、状态、奖励、决策等诸多要素,涉及序列决策 过程,智能体之前作出的决策会影响智能体当前的状态,从而影响“未来”的决 策过程。而监督学习中,对每一个样本输入...
略 10. 参考答案:强化学习有环境、智能体、状态、奖励、决策等诸多要素,涉及序列决策过程,智能体之前作出的决策会影响智能体当前的状态,从而影响“未来”的决策过程。而监督学习中,对每一个样本输入做出的决策不会影响到“未来”的决策。监督学习的每次决策后得到的反馈是“最终反馈”,它包含了最佳决策的信息。而...