增强学习策略网络和价值网络等核心模块,较为详细地分析了策略网络,价值网络引导的蒙特卡洛树搜索算法的实现;以AlphaGo的技术突破为起点,展望了人工智能在物理域,信息域,认知域和社会域上的可能应用,分析了美国国防部高级研究计划局资助的人工智能军事应用项目;以OODA循环理论为基础,研究了人工智能应用于军事领域可能会带来...
AlphaGo技术原理分析及人工智能军事应用展望 陶九阳1,2吴琳1胡晓峰1 摘要以“深蓝”的技术原理为比对,研究了AlphaGo有监督学习策略网络、快速走子模型、增强学习策略网络和价值网络等核心模块,较为详细地分析了策略网络、价值网络引导的蒙特卡洛树搜索算法的实现;以AlphaGo的技术突破为起点,展望了人工智能在物理域、信息域...