设为首页 - 加入收藏
广告 1000x90
您的当前位置:二四六天天好彩308K文字资料 > 博弈树搜索 > 正文

从“三次人机对弈”读懂人工智能的过去、现在与未来

来源:未知 编辑:admin 时间:2019-06-10

  【编者按】人工智能不仅仅是一次技术革命,它将使经济、产业、社会乃至人类生活产生深刻的变革。本文旨在通过人工智能发展史上三次著名的人机对弈为主线,梳理人工智能技术发展的脉络,分析目前人工智能技术的挑战,并对未来人工智能技术发展方向作出展望。

  人工智能缘起于1956年8月美国东北部小镇汉诺威达特茅斯学院的人工智能夏季研讨会,本次会议由东道主约翰·麦卡锡、当时在哈佛大学的马文·明斯基、IBM的纳撒尼尔·罗切斯特及信息论的创始人克劳德·香农等4人发起。会议第一次提出人工智能(Artificial Intelligence,简称AI)的概念及其需要研究的七个领域:(1) 自动计算机;(2) 编程语言;(3) 神经网络;(4) 计算规模的理论;(5) 自我学习;(6) 抽象能力;(7) 顿悟与创新。

  人工智能经历了60多年螺旋式的发展与演进,如今已成为实际应用众多、科研活跃、投资热捧的领域。人工智能研究的范围包括基于搜索的问题求解、知识的表达推理与规划、机器学习、智能应用等诸多子领域。由于人工智能研究内容的广泛性,因此对于人工智能的定义一直存在争议。目前业界比较认可的定义来自加州伯克利的斯图尔特·罗素与谷歌研发总监彼特·诺维格合著的人工智能经典著作——《人工智能:一种现代的方法》,该书将人工智能定义为:人工智能是能感知环境,并为获得最佳结果,采取理性行动的智能体。

  人工智能从发展的阶段而言,可以按照其不同层级,将人工智能分为弱人工智能(如苹果公司的Siri)、强人工智能和超级人工智能(即智能体在所有领域都比最聪明的人类还要聪明得多)。从目前而言,超级人工智能还只是存在于电影或小说中的场景而已。

  棋类游戏自古以来就是人类智慧的象征,受众面广泛,而且棋类游戏规则清晰,胜负容易评估,因此每一次人机对弈都会引起公众的极大关注,并推动人工智能技术的快速发展。

  早在1962年,当时就职于IBM的阿瑟·萨缪尔在IBM 7090晶体管计算机上(内存仅为32k)研制出了西洋跳棋(Checkers)AI程序,并击败了当时全美最强的西洋棋选手之一的罗伯特·尼雷,引起了轰动。阿瑟·萨缪尔在西洋跳棋AI程序研制过程中,第一次提出了“机器学习”的概念,即不需要显式地编程,让机器具有学习的能力。因此,阿瑟·萨缪尔被称为机器学习之父。

  西洋跳棋AI程序的核心技术是通过自我对弈来学习评价函数,大致原理是利用两个副本进行对弈,学习线性评价函数每个特征的权重,其中一个副本Beta始终使用固定的评价函数,另一个副本Alpha则通过与使用极小极大搜索(minimax search)算法作对比来学习特征的权重。事实上,AlphaGo围棋AI算法和当今深度学习领域非常火爆的生成式对抗网络(GAN)都采用了类似的思想。虽然西洋跳棋AI程序使用了相当多的领域知识,以及一些简化的假设,但不可否认的是,萨缪尔的工作是早期AI的一个里程碑,其工作中强化学习与对抗学习的思想至今仍然是AI程序的核心算法。

  时隔35年的1997年5月,IBM深蓝以 3.5:2.5战胜了人类国际象棋(Chess)世界冠军加里·卡斯帕罗夫,成为人工智能发展史上的又一个里程碑。

  深蓝是IBM一台超级计算机,在1秒钟内可算两亿步棋。然而,国际象棋按照一盘棋平均走80步计算,每步棋可能的落子位置为35个,则总状态数约为10的120次方,若仅用蛮力搜索,即使作为超级计算机的深蓝都无法在合理的时间内完成走棋任务。

  因此,深蓝在软件设计上采用了知识库结合搜索的方法。一方面,深蓝存储了100 年来几乎所有国际特级大师的开局和残局下法,利用知识库的思想帮助程序节省时间并得出合理的棋步。另一方面,深蓝采用的是α-β剪枝搜索算法,并采用规则的方法对棋局进行评价,大致思路是根据棋子的重要程度、棋子的位子、棋子之间的关系对棋局进行评价,但这些思路并没有超越萨缪尔的工作。不过,值得一提的是,深蓝在硬件上将通用处理器和象棋加速芯片相结合,提高了计算速度。深蓝国际象棋AI程序汇聚了诸多人类国际象棋大师的知识与智慧,因此可以被认为是知识工程在计算机棋类博弈的经典应用。但是,深蓝国际象棋AI的核心技术依然被认为是领域相关的,缺乏通用性。

  人工智能的第二次浪潮(1976年-2006年)代表性成果之一就是知识工程。知识工程的典型应用就是各种专家系统,比如医学专家系统、工程学专家系统等。然而,知识工程也有弊端,主要表现在知识的总结与获取很难,另外有些领域的专家不愿意分享他们的经验。因此,人工智能的第二次浪潮的另一个重要成果就是将各种机器学习算法引入人工智能,让机器从数据中自动学习,获得知识。

  这段时期,机器学习的各大学派纷纷提出了各类机器学习算法,是知识工程与各类机器学习方法群雄逐鹿的时代。

  2016年3月,谷歌旗下的DeepMind公司的AlphaGo围棋AI战胜了韩国围棋世界冠军九段棋手李世石,再一次掀起了人工智能的浪潮。

  围棋一直被认为是最复杂的棋类博弈,对AI来讲是经典博弈中最具挑战的棋类。围棋按照一盘棋平均走150步计算,每步棋可能的落子位置为250个,则总状态数约为10的150次方,据说围棋的计算复杂度已超过宇宙中原子的总数。

  AlphaGo围棋的核心技术是将深度学习、强化学习和蒙特卡洛树搜索有机整合起来,使其既具有围棋的局部战斗能力,更重要的是还具备了围棋的全局观。总体而言,AlphaGo具有两套深度神经网络:即策略网络(Policy network)与价值网络(Value network)。策略网络选择下棋步法,即给定当前的局面,预测下一步如何走棋;价值网络则评估当前局面,即给定当前局面,估计是白方胜还是黑方胜。

  AlphaGo首先从专业棋手的三千万手棋,通过监督学习的方式,训练深度卷积神经网络,学习人类围棋高手下棋的方式,这个策略网络称为“监督学习策略网络”;接着,AlphaGo让两个训练好的监督学习策略网络对弈,从而训练一个更强的策略网络,称为“强化学习策略网络”。AlphaGo再利用强化学习策略网络对弈的数据作为输入,通过深度卷积神经网络训练价值网络。在对弈过程中,AlphaGo采用蒙特卡洛模拟方法,针对当前局面,根据策略网络的建议,有限制地向前模拟展开行为树,并用估值网络对每种走法的胜率进行估计,在展开足够的搜索后选择最优的下一手棋。

  因此,AlphaGo本质上是在蒙特卡洛树搜索框架下,整合了深度学习和强化学习技术并将线下深度学习与在线高效搜索相结合,从而获取围棋问题的有效解法。虽然,AlphaGo只解决了计算机围棋的问题,但它在算法上比深蓝具有通用性,其思想可以被应用在多个领域,比如DeepMind最新的研究是让AI能和人类玩家一起玩星际争霸这类电子游戏,而这类电子游戏是属于不完全信息博弈,因此比围棋AI更具挑战。

  人工智能的第三次浪潮(2006年-现在)代表性成果就是深度学习。2006年杰夫·辛顿和他的学生在《科学》杂志上发表了一篇关于应用神经网络进行数据降维的文章,其核心是提出了深度神经网络具有优异的特征学习能力,并可采用“逐层预训练”的策略对其有效训练。2015年谷歌DeepMind公司研发了深度学习结合强化学习的“深度强化学习”技术,该技术能够学会玩Atari视频游戏,并达到了可与人类匹敌的水平。事实上,“深度强化学习”技术就是AlphaGo的核心技术。

  深度学习技术由于能够自动从数据中学习复杂的特征,因此被认为是现代人工智能最重要、应用最广泛的技术。但是,深度学习的技术进展遇到如下挑战:比如目前深度学习成果主要依赖于大规模有标签数据、深度学习几乎是个黑箱模型,可解释性不强、深度学习依然无法解决不确定的推理问题等等。因此,从人工智能技术发展的路径上,近年来无监督的深度学习、迁移学习、深度强化学习和贝叶斯深度学习等技术成为迈向强人工智能的重要途径。

  目前,深度学习在复杂特征空间上泛化能力依赖于带有标签信息的大规模数据样本,因此无监督的深度学习技术将是未来深度学习发展的重要方向。就如深度学习三巨头之一的Yann LeCun的观点:AI最大的局限是没有人类的常识,而无监督学习是突破AI局限的关键。

  所谓迁移学习,就是能让现有的模型算法稍加调整即可应用于一个新的领域或功能的机器学习技术。迁移学习的目标是用已有的知识来解决目标领域中仅有少量有标签样本数据,甚至没有数据的学习问题,让机器赋予人类举一反三的智慧。前百度首席科学家吴恩达认为,迁移学习将引领下一波人工智能技术商业化的浪潮。

  人工智能领域,感知、规划、推理、决策的能力是衡量智能的指标,深度学习使得AI的感知能力(视觉、听觉等)得到了巨大的提升,但通过与环境交互,并作出最优的决策是目前深度学习所不能解决的问题。强化学习则可不断与环境交互,以试错的学习方式获得最优决策。因此,将深度学习与强化学习有机融合的“深度强化学习”可以让智能体既具有感知能力,又具有理性行动能力。该技术是DeepMind公司近年来重点研究和应用的核心技术。

  贝叶斯学习指的是具有在小样本数据上学习与推理的能力。因此,将深度学习与贝叶斯学习结合起来的“贝叶斯深度学习”可以使智能体既具有小样本学习和推理能力,又有深度学习非常强大的拟合能力,即让智能体既有感知能力又具备推理能力。

  本文作者认为若能将深度学习、贝叶斯学习和强化学习有机融合,让AI具备感知、推理、决策和理性行动能力,将是实现强人工智能的可能途径。此外,本文作者认为人工智能的某些应用还需要解决其安全性、鲁棒性(robust)和人机交互问题,比如自动驾驶AI、自动手术AI、基于AI的对冲基金等场景。

  虽然人工智能在很多领域表现出色,甚至超过了人类的表现,人工智能已无处不在,但这并不意味着人工智能已无所不能。从技术角度来讲,目前的人工智能还属于弱人工智能范畴,AI依然没有常识、没有自我意识、没有真正的情感,不具备抽象能力。科幻片中的强人工智能离我们依然遥远,就如美国加州伯克利大学人工智能与机器学习大师迈克尔·乔丹的观点:在迈向强人工智能的路上,我们才刚刚起步。

  但是,无需质疑的是人工智能时代已经到来,人工智能技术将深刻地影响人类生活、社会经济、法律与伦理。我们准备好迎接这个人机共舞的时代了吗?

  陈敏刚,副研究员,博士毕业于上海交通大学计算机系,国家信标委大数据工作组成员,在上海科学院所属上海计算机软件技术开发中心/上海市计算机软件评测重点实验室从事新一代信息技术研究工作。

  科技,尤其是如今炙手可热的人工智能,会给生活、商业、学术等带来多大的影响?在近日由清华经管学院举办的“科技·驱动成长”论坛上,六位来自各界的大佬坐而论道,给出了他们或保守或开放的看法和解读。

  科技,尤其是如今炙手可热的人工智能,会给生活、商业、学术等带来多大的影响 在近日由清华经管学院举办的“科技·驱动成长”论坛上,六位来自各界的大佬坐而论道,给出了他们或保守或开放的看法和解读。

  从左到右依次为:清华经管学院院长钱颖一;2012年诺贝尔化学奖得主、美国国家科学院院士、斯坦福大学教授Brian K. Kobilka 教授;腾讯董事会主席兼首席执行官马化腾先生;美国国家科学院院士、中国科学院外籍院士、斯坦福大学、清华大学教授张首晟教授;北京大学校务委员会副主任、理学部主任、生命科学学院讲席教授饶毅教授;中国科学院深圳先进技术研究院副院长、香港中文大学教授、商汤科技联合创始人汤晓鸥教授

  想要在某一领域取得重大突破,是一件容易的事情吗 从几位科学家的回答来看,这并非一件易事。

  比如,Brian K. Kobilka说道,花费25亿美元、经历7-12年的时间,但最终一种新药成功上市的概率只有10%-15%。饶毅也表示,虽然人工智能推动了神经学的研究,但其实神经学没有任何概念上的突破。汤晓鸥也表示,在过去很多年里,都不好意思说自己在研究人工智能,因为什么都没有做出来。即便目前取得了一点进展,但仍然困难重重。

  具体来说,从50年代开始,就已经有人在做人工智能 ,但从50年代到2011年做的都不好。汤晓鸥认为,2011年是一个分水岭,主要有四方面的原因:

  一是实际应用的刚需。之前手提电脑非常多,虽然手提电脑能移动,但是大部分的情况下我们不会拎着电脑去吃饭,出去旅游时用电脑拍照。后来手机出来以后,手机上的摄像头变成了人的第三只眼睛,我们在微信上发的最多的就是照片或者是视频。一图胜千言,这时候产生了大量的数据,这些数据需要智能地分析,所以有了实际应用的刚需。

  二是数据的体量有了大幅的增加。原来数据是从电脑中产生的,有手提电脑的人还是很少的,因为要一万多块钱一台,但是红米手机一出来,五六百块钱一台,任何人都可以购置两台。原来不到一亿的用户,一下子变成十亿、二十亿,体量出来了,也就产生了大量的训练和应用数据。

  三是可承受的硬件训练平台。原来我们用CPU的时候,做人脸识别时会用近千个核,但还是要跑一两个月才能把一个算法跑出来,然后调一个参数,再来两个月,又花钱又花时间。但后来用GPU,十台机器、六个小时,同样的东西就跑出来了。所以,这就给大学实验室和小公司一个可承受的硬件平台和能力来做训练。

  四是算法的革命性的进步。有了前三个方面还是不够的,最后深度学习的框架允许我们做端到端的学习,有了大量的参数,以前我们是做小参数学习的。而且还要将这些小参数设计的非常复杂,因为要解决很多问题,但实际的应用很不理想。但深度学习的网络框架,允许我们用几千个、几万个、几亿个参数,用无穷大的数据直接覆盖各种场景应用。这样就可以在一些单项、个别的应用上超过人类,意味着可以替人类来做这个工作。

  对此,张首晟也认为,人工智能突飞猛进是因为计算能力的指数增长,以及大数据的产生和算法的改进。

  虽然从科学研究的角度来看,取得革命性的成果是一件困难的事情,但是按照摩尔定律的规律,经过指数级发展的人工智能,会不会像科幻小说和书籍中所说的那样,为我们创造一个无所不能的世界。进一步说,像很多人所担忧的那样,人工智能会取代人类,甚至是控制人类。对于这一令很多人不安的话题,多位科学家给出了偏保守的回答。

  饶毅认为,大部分常人可以想到的人工智能拥有记忆、思维,在我们有生之年都不可能达到科幻的程度。而且我们离那个程度还差很远,不是一点半点。但是,也许我们可以做一些自闭症方面的事情,也许脑血管方面的疾病可以治疗了,也许在睡眠方面(睡与不睡)有新的发现。他表示,在这些具体方面,是可以预期的。但是那些所有高级的,人工智能有思维、认知和情感的都是瞎说的。同样他也认为,“人工智能的进步是有限的,所有把人工智能模拟成人的那一部分,我认为百分之百的都是假的。”

  虽然汤晓鸥的人工智能实验室并评为全球前十大先锋实验室,而且他本人也是人工智能方面的专家。但是他却认为,我们听到的那些名人和网红讲的人工智能的事情,基本上是不可能实现的。他坦言,从事人工智能的那些第一线的、离炮火最近的人,其实做的很辛苦。因为过去几十年里,什么都没有做出来。他还调侃道,以前还曾以此来招生,因为啥都做不出来,所以可以保证学生一辈子都有工作。

  但他也承认,最近几年人工智能确实迎来了爆发式的增长。以前人工智能每年成长的速度是提高1%,刚开始ImageNet检测的准确率只有22%,如果要达到100%,需要大概80年。但深度学习技术出现后,我们真的是几年以内就做到了将近70%。尽管人工智能的进步比以前快多了,但他还是坚持认为:“机器的任务还是人类定义的,不可能控制人类,想多了。”他还补充道,其实离炮火越近的人,越觉得这件事情还很遥远;而离炮火越远的人,可能刚听到一点炮声就开始行动了。

  马化腾认为,人工智能演化的第一步肯定会成为人类的帮手,成为人类研究和解决下一代技术时的一个重要的助手。但AI在怎么发展都是战术性的,是一种支持和帮助。比较复杂的战略以及没有多次重复规律的领域,还是离不开人脑的判断。未来计算机和信息科学都会在生物科学以及人们生活的方方面面产生很大的作用。从腾讯方面来说,AI是发展的方向之一。他认为,在足够垂直的细分领域里还是有机会的。这些方面代替人,比人做得好是有可能的。所以公司现在在找细分领域里,一些可以应用到AI和信息技术的商业机会。各种研究再怎么天花乱坠,最终还要看是否能提高效率、改善用户体验。

  在汤晓鸥看来,目前人工智能在三个方面应用的比较多:一是语音识别。这个是相对成熟,也是第一个突破的。二是视觉,现在的主战场就是在视觉领域,而且看的能力的场景是非常多的。三是自然语言的理解,就是要像大脑一样解决问题,这件事情目前是完全没有解决的。现在这一块很热,很多国内外的公司都做对话机器人,但这其实是非常难的一件事情,因为它对各种背景知识以及条件的要求是非常多的。

  自然语音技术的应用到底有多难,为此他还举了好几个例子,比如说一句“上次我交给你的那件事,你给我办了”,语音机器人是判断不了具体什么时间以及什么事情的。这就需要很多的背景,但这都还没有解决。目前市面上的应用是比较简单的,主要是问一下餐馆、影院这些比较固定的场景。还有一个问题是,很多智能机器人完全是由人来控制的,比如他开玩笑道,有的机器人是5点要下班的,因为后台操作它的人5点就下班了。还有Siri团队会搜集一些比较难的问题,然后自己回答,当我们问到相关问题时,就会得到相同的答案。

  虽然马化腾和汤晓鸥都看好人工智能的发展,但因为两家公司发展阶段的不同,导致他们做的事情也有些不同。

  马化腾认为,人工智能与医疗和教育的结合是比较难的。腾讯投了大量与医疗和教育相关的公司,但感觉只了解到皮毛。因为这个产业链太长了,从各个角度来说只做了一小部分。虽然路还很长,但也是看到一些迹象可以与医疗和教育进行结合。比如用AI将教育的个性化系统进行提升。因为现在的教育可以利用信息技术,能针对每一个人、对不同的教育内容的反馈来决定下一步的教育的内容。利用信息技术的远程、视频宽带,以及配对和匹配这些技术手段和产品可以将学生和教师进行更好的适配,提供更加灵活的方式和更好的体验。

  而对于创业公司商汤科技来说,短期来说首先是要活下来,所以不能挑高大上的事情做。汤晓鸥说,公司第一步要做安防,因为安防到处都是,每个摄像头几百万。然后是手机,手机有视觉、图像等很多需求,目前商汤已经在和很多手机厂商合作。第三是直播,做广告植入和特效也需要很多的视觉要求,像faceu和一直播都是商汤在提供核心技术。

  从中期和长期来说的话,公司会布局金融领域,无论是开户还是内部的大数据运算、智能投顾等,都会用到人工智能。虽然这些技术普及后,可能公司再去推进业务没那么容易。但是人工智能还有很多的用处,比如做个性化的保险服务。而自动驾驶、医疗、芯片三大领域,在未来5-10年会有很大的应用。目前这三个行业的融资是最多的,但需要多做原创技术,而且还需要跟大厂商合作才能取得更大的进展。

  早在2002年的时候,汤晓鸥就曾成立了一家美图公司,做人脸识别、家庭监控摄像头、VR。但做了一年的时间,就关掉了,因为人才、技术不够,也没有办法同时兼顾科研。直到2011年、2012年时候,汤晓鸥在各方面准备成熟的情况下,与人联合成立了商汤科技。

  在很多人看来,商汤科技已经算是很成功的人工智能公司。但汤晓鸥却坦言,别人说创业是痛并快乐着,但他觉得没有快乐,只有痛。这是因为国内和国外,是完全不同的创业环境。在国外,创业成功的概率是5%,而要做强做大的话,概率会更小。然而在中国,这一概率可能要再缩小10倍。因为前面有谷歌、微软、Facebook这些大公司,后面有BAT三座大山以及无数的小公司。在中国三分天下的格局下,很难再有创业公司成长起来。无论做什么行业,大家的压力都很大,很早的时候就开始站队。在国外是不存在这样的问题,跟谷歌合作后,还是可以跟微软、IBM合作的。

  就大公司投资和收购的创业公司来说,很多可能也想做一番事业。但他调侃道,虽然说大丈夫不为五斗米折腰,但是如果你给六斗的话,有人也是会动摇的。他还补充,创业公司还是很愿意跟BAT这样的大公司合作的。而且像AI技术,它不是独立存在的,它需要很多的场景等。它是一个赋能的技术,可以帮助各个行业提高效率。像谷歌不是靠自动驾驶和下棋挣钱的,它是将深度学习算法运用到搜索,使得整体效率提升了30%,相应的带来了几亿甚至几十亿的产出。

  对于汤晓鸥的“抱怨”,马化腾回应说,其实我们也很无奈。腾讯没有开放之前,业界对我们的意见很大。但这五六年我们完全大变样,已经形成更开放的生态,包括开放平台、众创空间以及举办的一些活动都是往这个方向发展。然而竞争是免不了了,但BAT三家的发展路径使得中国在移动互联网、O2O、移动支付、共享单车、自动驾驶方面的发展是远超欧美的。但另一方面,也确实产生了一些恶性竞争,使得创业者很无奈的思考要不要站队,接受了这个投资那个就不行。

  马化腾表示,这就是竞争形成的格局。虽然在享受竞争带来的高速发展,但也会面对一些自己感觉都很厌烦的事情。其实这是一个很不健康的事情,我们也想打破。希望大家一起努力,但短时间内可能还没有那么容易实现。

  另外,因为3Q大战的前车之鉴,目前腾讯奉行“半条命战略”,把另一半命交给合作伙伴。公司内部会要求这不要做、那不要做,要做的话就出去做,然后腾讯可以投资。马化腾表示,腾讯内部很多事情是不做的,专注做那些能发挥核心优势的事情,其他全部留给生态合作伙伴。而且包括占小股就行,不用控股,这样才更有活力。

  热点专题:军民融合 民参军 工业4.0 商业航天 智库 国家重点研发计划 基金 国防采办 装备采办 博士 摩尔定律 诺贝尔奖 国家实验室 国防工业 十三五 创新教育 军工百强 试验鉴定 影响因子 双一流 净评估

  前沿科技:颠覆性技术 生物 合成生物学 仿生 脑科学 精准医学 基因 基因编辑 虚拟现实 增强现实 纳米 人工智能 机器人 3D打印 4D打印 太赫兹 云计算 物联网 互联网+ 大数据 石墨烯 能源 电池 量子 超材料 超级计算机 卫星 北斗 智能制造 不依赖GPS导航 通信 MIT技术评论 航空发动机 可穿戴 氮化镓 隐身 半导体 脑机接口

  专家专栏:黄志澄 许得君 施一公 王喜文 贺飞 李萍 刘锋 王煜全 易本胜 李德毅 游光荣 刘亚威 赵文银 廖孟豪 谭铁牛 于川信邬贺铨 姜鲁鸣返回搜狐,查看更多

本文链接:http://mzi-ads.com/boyishusousuo/577.html

相关推荐:

网友评论:

栏目分类

现金彩票 联系QQ:24498872301 邮箱:24498872301@qq.com

Copyright © 2002-2011 DEDECMS. 现金彩票 版权所有 Power by DedeCms

Top