人工智能的下一个称霸领域是:扑克?
短短十年间,人工智能先是战胜了国际象棋大师,如今又击败了韩国职业围棋九段,其不断提升的决策系统和学习能力令人震惊。它下一个大显神威的领域是什么呢?可能是扑克。
这两个领域的专家都没想到人工智能会在十年间达到如此之高的成就。与1997年ibm推出的深蓝(deep blue)大胜著名国际象棋大师garry kasparov相比,谷歌deepmind实验室推出的alphago以4:1赢得与韩国职业围棋手李世石的“人机大战”,这被普遍视为人工智能领域一个里程碑式的胜利。
alphago这次面临的挑战更为复杂,也意味着机器学习算法出现了巨大改进。谷歌deepmind公司ceo demis hassabis在赛前发布会上称,alphago的决策系统依赖于自身的价值网络与策略网络:前者评估棋盘位置,后者选择下棋步法。
署名为卡耐基梅隆大学机器人(行情买入)系博士、facebook人工智能组研究员的田渊栋在“知乎”上发文称,alphago的两个网络是13层的人工神经网络,其结构与谷歌图片搜索引擎识别图片的结构相似。“这些层能够做分类和逻辑推理,经过过滤,13个连接的神经网络层产生对它们看到的局面进行判断。”
这种借鉴生物神经网络的,基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法处理技术被称为机器学习中的深度学习,是最接近人类大脑的智能学习方法。
有人因此心生恐惧,猜测人工智能会不会终有一天上演科幻大片上出现的统治人类。那么,抛开过于遥远的未来,就短期来看,alphago这类人工智能的下一步是不是可以在任何博弈类游戏中打败人类呢?
dana mackenzie在全球最权威的自然科学综合类学术期刊之一science发文称,也许,人类在扑克游戏中还能和人工智能多抵抗一会儿。
一位投身于人工智能扑克软件研发的前扑克专家nikolai yakovenko说,虽然计算机在一些two-handed poker玩法中已经接近采用数学上的最优策略了,但优秀的人类扑克玩家都拥有一个额外的技能:研究并利用对手的弱点的能力。而这种人类能力是偏离数学最优策略的,计算机无法做到这一点。
不过,从原则上说,这只是深层神经网络应该能够掌握的事情。这就是说,另一个人类游戏堡垒可能也将被人工智能攻破。
国际象棋大师garry kasparov在2010年发文指出了国际象棋和扑克的区别:
国际象棋是100%的信息博弈
- 标签:
- 编辑:崔雪莉
- 相关文章