强化学习第2版中文PDF学习分析 yundonger 编辑于 2021年07月03日 22:24 0 3
但我们知道,人的智能分层中记忆是比较低层的,相对于普通动物,人的智能优势表现在基于预见(prediction)能力的推理(reasoning)、决策(decision)层面。最高层的智能形式是信仰(个人意见,但这不属于计算机科学甚至自然科学的研究范畴)。强化学习具有与环境交互以及反馈延迟的特性,提供了更可行的构建预见模型和决策模型的学习...