AlphaGo
首次发布 2014年,11年前
当前版本
Master
AlphaGo Zero
阿尔法围棋樊
编辑维基数据链接
网站 deepmind.com
AlphaGo(“Go”为日文“碁”字发音转写,是围棋的西方名称),直译为阿尔法围棋,在英语不流通的华语社会亦被音译为阿尔法狗、阿法狗、阿发狗等,是于2014年开始由英国伦敦Google DeepMind开发的人工智能围棋软件。2017年,关于AlphaGo的电影纪录片《AlphaGo世纪对决》正式上映。
专业术语上来说,AlphaGo的做法是使用了蒙特卡洛树搜索与两个深度神经网络相结合的方法,一个是以借助估值网络(value network)来评估大量的选点,一个是借助走棋网络(policy network)来选择落子,并使用强化学习进一步改善它。在这种设计下,电脑可以结合树状图的长远推断,又可像人类的大脑一样自发学习进行直觉训练,以提高下棋实力。
评论已关闭