要闻 宏观 金融 证券 产业 公益财经 地产 能源 健康 汽车 评论 人道慈善

https://uploads.chinatimes.net.cn/article/20200609151936lmxa5DtLDn.jpeg

陆奇:可信的AI

陆奇 2020-6-9 17:57:29

盖瑞·马库斯(Gary Marcus ) 欧内斯特·戴维斯(Ernest Davis)

陆奇

鉴于《如何创造可信的AI》这本书主题的重要性,我尝试从几个角度为中国读者提供背景信息与书中核心内容的概述,希望有助于读者更有效地从阅读本书中获益。

我的老朋友马库斯

我先介绍一下马库斯,我认为他特殊的学术和行业履历能帮助读者更加全面地解读书中所表达的主要观点。

马库斯在高中时代花了很多精力去开发一套计算系统,目的是把拉丁语自动翻译成现代英语。虽然这个项目没有成功,但整个过却程让马库斯学到很多,特别是让他深切感受到要让一个计算系统具备类似人类般的认知能力和语言理解能力,纯粹依赖计算能力是远远不够的。一个计算系统具备认知能力和语言理解能力的前提,是该系统必须具有一定程度的内在结构。

在麻省理工学院学习期间,他师从世界著名心理学大师和认知科学家史蒂芬·平克教授。马库斯在他的博士论文工作中做了大量研究儿童学习英语的实验,他的研究成果为现代认知科学发展做出了非常重要的贡献。博士研究生毕业后,马库斯在纽约大学担任心理学教授,推动了一系列有影响力的学术研究,跨越计算机科学、认知科学、语言学和心理学等多个领域。

与此同时,马库斯在学术研究过程中形成了越来越完整的学术理念,对认知科学和人工智能的学术研究发展方向也形成了一系列清晰的观念,这一切可以从他所撰写的一系列学术著作中体现出来。

马库斯在认知科学和人工智能等领域的国际学术界都享有特殊的一席之地,一方面源于他所做的学术研究奠定了重要基础,另一方面源于他杰出的跨学科综合科研能力。马库斯在计算机科学、认知科学、语言学、人工智能等领域都练就了相当深厚的学术功底,更重要的是,他一生追求科学,通过长期努力打造了一套自己的学术理念和体系。

在追求科学真理的道路上,马库斯还敢于挑战学术界的主流观点。当整个人工智能学术界都在过分乐观地高歌猛进时,他不断撰文和发表演讲来指出许多人工智能核心技术中存在的弊端和局限性。马库斯坚信自己的学术理念,不认同当今学术界的主流方向能把人工智能从今天带到未来。他敢于站出来泼冷水、唱反调,并敢于向人工智能学术界泰斗如杨立昆等人发起多次公开辩论。

更为重要的是,马库斯不仅是独树一帜的科学家,也是一个颇有成就的企业家和创业者,并专注于人工智能技术的开发与应用,把自己的学术理论和发展方向付诸实践。

2014年,马库斯创建了机器学习公司“几何智能”,由于在技术和应用上都做得相当不错,公司于2016年被当时如日中天的优步成功收购,马库斯也由此加入优步成为其第一任首席科学家。离开优步之后,马库斯联合著名机器人专家罗德尼·布鲁克斯等人一同创立了一家名为Robust.AI的新公司,公司专注于新一代的人工智能认知引擎研发,并以机器人为主要应用对象。我们可以看出,马库斯在本书中阐述的核心观念并不是纸上谈兵,而是在实际的创业创新过程中被不断验证和迭代的。

多年前,我在工作中认识马库斯之后,便一直保持联络,我们在人工智能的学术研究和实际应用上有着长期的交流。我也阅读了马库斯过去的著作,听了他重要的学术演讲。我之所以花时间将马库斯的背景信息介绍给读者,是因为马库斯在本书中所阐述的核心内容是承上启下的。

仅有深度学习是不够的

《如何创造可信的AI》这本书的内容既建立在过去累积的学术观念和理论之上,也是他对人工智能的现状和下一步发展方向所做的完整总结与梳理。马库斯以打造“可信的AI”为主题贯穿全书的内容。这里需要指出的是,马库斯所持有的观点在学术界和行业内是不无争议的,这样的争议在人工智能从今天走向未来的过程中,是健康的,也是必要的。

首先,马库斯非常详细和系统化地分析了今天以深度学习为基础的主流人工智能技术所面临的局限性。针对每一类被揭示出来的局限性,马库斯充分发挥了他对自然语言处理、机器人和计算机视觉等领域的科研经验和深刻理解,通过生动易懂的案例把这些技术局限性的现象和原因清晰地描述给读者。他还强调在没有充分理解人工智能技术目前局限性的情况下大量开发人工智能应用将承担相当大的风险。为了帮助读者更方便地理解和判断这些风险,马库斯把这些风险详细分成了9个类别,包括鲁棒性的缺失等。

马库斯对人工智能的核心技术——深度学习所提出的一系列质疑,他用了一系列具体案例和推理来强调我们必须在深度学习的基础之上探索新的技术突破。从深度学习核心算法的内在体系开始,贯穿多项人工智能发展的前沿应用领域,比如语言理解和机器人等,马库斯深入浅出地分享了对人工智能技术发展的核心观点:如果我们沿用目前以深度学习为主的人工智能技术,而不在其内在结构上探索新的途径,以后将很难建立起具有人类般的认知能力和真正意义上的智能系统。

马库斯是人工智能技术的坚信者

在这里尤其要提出的是,马库斯花了大量篇幅来分析今天人工智能技术被媒体所报道的能力与目前人工智能技术能够实际落地的能力之间的对比,指出这两者之间存在严重的脱节。马库斯指出了学术界所存在的浮夸现象以及有些媒体过分乐观的炒作,将这种人工智能报道与现实之间的严重脱节叫作“AI鸿沟”。

他认为如果在推进人工智能科研和应用开发的过程中不能清晰地意识到这个鸿沟的话,我们将会踩很多坑。我们都知道人工智能技术已经被广泛地应用,有一些是涉及关键使命的,比如自动驾驶系统,有一些则对社会有着深远的影响,比如信息检索和内容分发等。

特别是在应对目前全球面临的由新冠疫情带来的前所未有的挑战中,人工智能技术将起到越来越关键的作用。在这样的关键时机下,做出正确的判断并避免踩坑将是至关重要的。为此,马库斯追根溯源把“AI鸿沟”归纳为三种“大坑”:

第一是“轻信坑”,这是由于人类进化的现实过程还没有发展出清晰辨别人类与机器之间区别的能力,导致我们往往用基于人类的认知模式去看待机器的能力,从而容易轻信机器拥有人类般的智慧。

第二是“虚幻进步坑”,每当AI技术的进展攻克了一类新的问题时,我们往往错误地假设AI技术就能解决以此推及的、现实世界中的类似任务。但是AI学术上的问题往往是定义在狭义而简化的假设下,而现实世界的具体任务都有很大的复杂性和不确定性。

第三是“鲁棒坑”,受限于当前深度学习算法和训练数据,对容错性很低特别是使命关键的应用领域比如无人驾驶等,今天的AI还没能达到实际“落地”的能力。马库斯告诫我们必须关注“AI鸿沟”,因为踩坑的代价是非常高的。

在这里我必须要指出,马库斯是人工智能技术的坚信者,并在人工智能学术研究和实际应用上做了很多积极的推动工作。他也认为基于深度学习的人工智能技术在过去十多年有了长足的进步,为一系列商业化应用做出了重要贡献。

马库斯之所以质疑当前主流的人工智能技术,是希望学术界和其他相关行业能一起更有效地克服目前人工智能技术的局限性,探索新技术上的突破,从而真正实现可信的AI。

常识的重要性

接着,马库斯提出了通向未来可信AI的核心路径,这一路径的起点是在研究人类如何获得认知能力时所获得的核心启发,并以此建立下一代人工智能技术中必要的内在结构。

马库斯以认知科学、心理学、语言学和哲学为基础提取出11条关键线索,认为这将对未来人工智能技术在发展过程中达到具备人类智能的鲁棒性起到关键作用。这些线索的共同核心是——用内在更丰富的结构来表达信息、建立认知、建立起其他智能体系的核心要素,比如因果推理能力等。

马库斯还强调了常识在实现未来通用人工智能中的重要性。对于如何建立常识,书中的内容充分体现了马库斯作为一个跨学科的学者和跨行业的企业家、创业者所拥有的综合能力,既有核心的科学原则又有务实的系统操作:从表达时间、空间和因果关系开始,建立一个有足够灵活性的框架并以此来连接感知、操作、语言的能力,并能不断地从环境以及与环境交互中学习,同时将先验与学习有机地融合在一起。这将是一个非常艰巨的任务,但马库斯认为这是必需的工作,是建立真正智能体系的必经之路。

如何建立可信的AI

马库斯还讨论了几个建立可信的AI所需要的实际能力。

首先,我们要有能力来工程化地、有效可靠地开发AI系统与应用。正如计算机科学早期发展的历史一样,软件开发工具和开发流程是经过计算机软件工程这门子学科多年的努力才逐渐建立起来的,我们需要同样的努力来逐步打造工程化开发AI系统与应用的能力。

其次,确保AI系统的安全性需要全新的开发与运营能力,尤其是关键使命的AI应用。

最后,AI系统,比如机器人,需要其创造者赋予正当的道德伦理观念,类似于美国科幻作家艾萨克·阿西莫夫(Isaac Asimov)提出的机器人三定律。只有具备这些实际能力,我们才能真正创造可信的AI。

众所周知,人工智能是目前为止人类历史上创新潜能最大的技术发展浪潮。在未来的几十年里,它不但能诞生全新的大规模基础产业,也能极大程度地提升和改造所有现有行业。人工智能技术及应用所产生的商业价值和社会价值将是空前的。但要推动人工智能的健康发展,我们需要不断推进人工智能核心技术的进步,以及各种人工智能应用的开发和实践。这将是一个持久的过程,需要学术界和产业界一起合作,需要看到不同的理念、听到不同的声音、表达不同的想法,在一个健康良好的环境中不断交流、撞出火花,更好地探索科学的真理,加速人工智能的进展。

尽管不无争议,但《如何创造可信的AI》为我们提供了丰富的内容和理念。我希望,也相信中国的读者都能从阅读本书的过程中有所获益。

(作者为奇绩创坛创始人兼CEO,百度前总裁兼COO,微软前全球执行副总裁,雅虎前执行副总裁)

责任编辑:徐芸茜 主编:程凯