最高层的智能形式是信仰(个人意见,但这不属于计算机科学甚至自然科学的研究范畴)。强化学习具有与环境交互以及反馈延迟的特性,提供了更可行的构建预见模型和决策模型的学习范式。当然,这两个特性也限制了它的广泛应用。《强化学习第2版》中文PDF,550页,文字可以复制;英文PDF,548页,文字可以复制。作者:Richard S. Sut...
最高层的智能形式是信仰(个人意见,但这不属于计算机科学甚至自然科学的研究范畴)。强化学习具有与环境交互以及反馈延迟的特性,提供了更可行的构建预见模型和决策模型的学习范式。当然,这两个特性也限制了它的广泛应用。《强化学习第2版》中文PDF,550页,文字可以复制;英文PDF,548页,文字可以复制。作者:Richard S. Sut...