①“阿尔法围棋”的技术架构就是深度学习神经网络中的CNN架构(两种落子策略——“监督学习”“强化学习”和一个局面评估策略)及蒙特卡罗搜索树。其中,三种策略的神经网络架构基本相同,环环相扣。 ②首先,“阿尔法围棋”纯粹地学习人类下棋经验,观察人类选手如何落子,不涉及对优劣的判断。这招落子策略...