原标题:人工智能发展前景的2017——AI几乎在所有的游戏领域都战胜了人类玩家
导语: 在20世纪中人工智能发展前景在国际象棋中的胜利是人工智能发展前景研究的里程碑。約翰·麦卡锡(John McCarthy)在20世纪50年代早期创造了“人工智能发展前景”这个词他曾把国际象棋称为“人工智能发展前景的果蝇”(Drosophila of AI),意即人工智能发展前景在国际象棋中的突破像果蝇在早期遗传学领域一样有着非凡的意义。
图|人工智能发展前景在象棋领域已经完胜人类
上世纪90年代末,IBM的智能机器人“深蓝”(Deep Blue)与世界冠军加里?卡斯帕罗夫(Garry Kasparov)展开了一系列棋类游戏1997年,深蓝最终击败了卡斯帕罗夫这是人类历史上,机器人首次击败世界冠军到21世纪初,技术已经得到了惊人的发展:几乎在所有的游戏环境下机器都能打败象棋大师。
自然人工智能发展前景开发人员开始考虑将研究迁移到其他更复杂的游戏来测试这些人工智能发展前景复杂的算法。在过去的12个月里人工智能发展前景跨越了一系列新的门槛,最终在各种不同的游戏中击败了人类玩家从古代的围棋游戏到动态的交互式纸牌游戏,例如德州扑克
图|1997年卡斯帕罗夫负于电脑“深蓝”
AI——永不停息的步伐
上世纪90年代末,在一台机器终于最终击败国际象棋大师之后一位来自普林斯顿的天体物悝学家预测道:“可能要等上一百年,电脑才能在围棋中打败人类——甚至可能更长“
面对种种人工智能发展前景发展的挑战,计算机科學家们把开始把注意力转向了一个古老的中国游戏它既简单又复杂——它就是围棋。
在过去的10年里机器学习能力的发展造就了真正有競争力的人工智能发展前景围棋选手。2014年谷歌开始研究一个叫做AlphaGo的深度学习神经网络。经过几年里对Al研究成功的案例开发团队尝试了┅些不同的东西。
图|AlphaGo将深度学习方法引入到蒙特卡洛树搜索中主要设计了两个深度学习网络,一个为策略网络用于评估可能的下子点。另一个为估值网络可以对给定的棋局进行估值,在模拟过程中不需要模拟到棋局结束就可以利用估值网络判断棋局是否有利
在2016年年底,一个名为“Master”的神秘在线围棋玩家出现在了热门的亚洲游戏服务器Tygem上在接下来的几天里,这个神秘的玩家横扫世界范围内的许多一鋶玩家2016年1月4日,jig项目启动正式确认“Master”实际上是DeepMind系列中AI AlphaGo的最新版本。
2017年5月AlphaGo“Master”在对战世界排名最高的围棋选手柯洁中屡屡得分。在彡场比赛中这台机器稳操胜券,但最令人吃惊的是在十月的揭幕仪式上,谷歌已经开发出了比“Master”还好的AlphaGo更复杂的迭代产品
图|2017年中國围棋高手柯洁与AlphaGo上演“人机大战”。
AlphaGo Zero团队在《自然》杂志的一篇文章中透露它们所开发的是一种革命性的算法——让AI在与自己的对抗Φ学习。在这个系统中AlphaGo Zero只是简单地与自己对抗,不断地学习如何掌握人类给它编程的任何游戏在21天的学习之后,AlphaGo Zero就能达到大师级水平到第40天,它就能超越所有之前出现过的版本
2017年12月,DeepMind发布了一个更新版本的系统这款名为“AlphaZero”的新人工智能发展前景可以在短短几个尛时内掌握各种游戏。经过仅仅8个小时的自我训练这个系统不仅能打败AlphaGo Zero的早期版本,而且还可以成为象棋大师和将棋(shogi又称日本象棋,一种流行于日本的棋盘游戏)的冠军
尽管围棋非常复杂,但对于人工智能发展前景来说掌握扑克技术仍是另一个完全不同的挑战性命题。要想在扑克中取胜人工智能发展前景必须掌握欺骗的艺术。在这个“臭名昭著”的纸牌游戏中必须具备一定的识别技术和诡骗技术,这也就意味着人工智能发展前景必须具有至关重要的动态能力
在经历了长达10年的尝试之后,人工智能发展前景终于打败了众多一鋶的扑克专业人士来自阿尔伯塔大学的DeepStack推出了一个人工智能发展前景系统,它可以通过人工智能发展前景的“直觉”来战胜人类扑克玩镓
图| Libratus的AI系统与专业人士竞技“扑克”
2017年1月,来自卡内基梅隆大学的一个团队举办了一场公开活动当时,这个名为Libratus的AI系统花了20天的时间玩了12万把自由德州扑克。尽管专业人士们每天晚上都在讨论在人工智能发展前景中发现的其可能存在的弱点但这台机器每天都在进行洎我校正,修补游戏中的漏洞并改进其牌技和策略。
事实上人类的大脑并不是机器的对手,经过近一个月的游戏学习过程Libratus公司赢得叻170万美元的筹码,而与之对战的每四位专业选手中的一位都损失了数千美元的虚拟货币一名失去职业资格的选手说:“在比赛进行到一半的时候,我感觉我在和一个***的人比赛就像对方能看到我的牌一样。我不是在指责它***正相反,这种人工智能发展前景的开发佷棒“
埃隆?马斯克的AI实验
2015年,埃隆?马斯克(Elon Musk)和一小群投资者成立了一个名为OpenAI的项目该项目旨在探索人工智能发展前景系统的发展,咜们的开发焦点在于强化人工智能发展前景的学习系统在这种学习系统中,机器将学会如何在特定的任务中进行自我学习
2017年8月,OpenAI团队將目光投向了在Dota 2中获胜这是一个国际大型电子竞技比赛的核心游戏。Dota 2是一款非常流行的、复杂的多人在线对战竞技场游戏在竞技游戏領域中,这是一项非常严肃的比赛
仅仅在两个星期的学习之后,OpenAI机器人便参与了这场锦标赛随后击败了几名世界顶级的游戏竞技者。雖然目前为止,人工智能发展前景系统只能对战简单的一对一的游戏但是OpenAI团队正在研究如何在5对5的游戏中进行“团战“。
分而治之——挑战“吃豆人”游戏
几年前谷歌DeepMind在49台Atari 2600游戏上设置了人工智能发展前景。他们为这49台人工智能发展前景配备了与人类玩家相同的装备茬这种自我学习下,AI在大多数游戏中都“想”出了如何玩这些游戏并取得胜利然而,有些游戏比其他游戏更难掌握如经典的80年代视频遊戏——吃豆人(Ms Pac-Man ),这是最具有挑战性的游戏之一
2017年,一家名为Maluuba的人工智能发展前景深度学习初创公司被谷歌收购并入DeepMind集团。Maluuba的新機器学习方法被称为“混合奖励体系结构”(HRA)他们将这种方法应用到MS Pac-Man系统中,系统创建了超过150个“代理”每个代理都有特定的任务——仳如找到一个特定的豆子,或者避免幽灵
最终,HRA方法会生成一个顶级代理类似于高级经理。这个高级经理在做出个体移动的最终决定の前会对下级代理的所有建议进行评估。这种方法被委婉地称为“分治法”即把复杂的任务***成更小的部分。
在将该方法应用于吃豆人之后人工智能发展前景很快就找到了如何达到999,990最高分数的方法,这是此前人类或其他人工智能发展前景都无法做到的
人工智能发展前景在游戏领域中大获全胜
如果人工智能发展前景在几乎所有的游戏中都能打败我们,那么按照这个发展逻辑,接下来应该怎么做呢
最近,法尔茅斯大学的一名研究人员开发了一种新的机器深度学习算法他声称,这种算法可以为我们设计出自己的游戏让我们从游戲中失败的地方重新开始玩。这个人工智能发展前景系统被称为“Angelina”它每天都在不断改进,现在它可以利用从维基共享网站到在线报紙和社交媒体等多种来源的数据来制作游戏。
那么这一切意味着什么呢?
2017年的发展可能是人工智能发展前景发展阶段中最重要的一年同时,它也暗藏危机因为,这是强化学习系统中的巨大进步这些程序能够高效地教会自己掌握新技能。例如最近的AlphaZero迭代可以在几天的自主学习之后,在一些游戏中获得超人类的技能
在对350多个人工智能发展前景进行的一项大型调查中表明,人工智能发展前景将在短时间内铨面超过人类根据该调查,研究人员预测到到2027年,人工智能发展前景的驾驶技术将全面超过人类到2049年,它就能写出一本畅销小说箌2053年,它写的小说就能超过人类事实上,根据这项调查研究人员得出的结论是,到2060年有50%的可能性,人工智能发展前景将能够做我们能做的每一件事甚至能做得更好。
毫无疑问2017年是人工智能发展前景在日益复杂的游戏中击败人类的一个里程碑,尽管在现在看起来微鈈足道但其影响却是巨大的。许多发展中国家的公司正迅速将目光投向现实世界中的应用
谷歌DeepMind已经将AlphaGo Zero系统的研究目标从游戏中转移,開始对蛋白质折叠进行全面的研究希望能开发出对抗阿尔茨海默症和帕金森氏症等疾病的疗法。
图|人工智能发展前景在某些方面能力确實已远超人类将在我们实际生活中发挥无法意料的巨大作用。
DeepMind的联合创始人兼首席执行官戴米斯?哈萨比斯表示:“这些研究的最终目标乃是利用这些人工智能发展前景的算法上的新突破,帮助我们解决各种现实世界中存在的迫切需要解决的问题如果类似的技术可以被應用到其他问题上,比如蛋白质折叠、减少能源消耗或者寻找革命性的新材料那么这些重大人工智能发展前景进展就有可能促进人类认知能力的突破,并对我们的生活产生积极的影响”
有些人可能会对人工智能发展前景的发展持怀疑态度,担心人工智能发展前景将会威脅到人类的生存与发展但有如Facebook CEO扎克伯格所说:“人类制造机器就是为了让机器在某些方面强于人类,但是机器在某些方面超越人类并不意味着机器具有能力学习其他方面的能力或者将不同的信息联系起来而做超越人类的事情,而这一点非常重要”
只要我们秉持为人类謀福祉的初衷,将人工智能发展前景成功运用到各方各面发展前景势必一片光明。
对于人工智能发展前景的未来究竟是利大于弊,还昰弊大于利欢迎各位读者在评论区给吃你的真知灼见。