作为粤港澳大湾区的第一AI盛会,GAIR大会已成功举办五届,留下众多精彩、经典和令人惊叹的瞬间。GAIR 2021则延续以往豪华阵容,以1场主旨论坛、2场行业峰会、9场高峰论坛,涵盖自动驾驶、安防、集成电路、医疗、元宇宙、碳中和、隐私计算、新消费等热门领域。 滚滚长江东逝水,浪花淘尽英雄。上世纪80年代末,以符号逻辑为基础的传统人工智能遭遇理论危机,新的人工智能理论陆续被提出,人工智能研究也进入了一个“百家争鸣”的新时代,联结主义、行为主义等学说迅速兴起。近十年来,得益于硬件设备和算法技术的提升,以深度学习为代表的联结主义感知智能技术突飞猛进。然而,正如图灵奖获得者 Alan Kay 所言,尽管如今的深度学习研究空前繁荣,此类方法在数学原理上的突破仍十分有限。在感知智能技术越来越成熟的今天,我们已经可以通过深度学习技术从各种数据来源中提取有效的表征。但是,深度学习技术在决策、规划方面的能力却十分有限。为此,研究者们又将目光投向了各种学说的融合,试图为未来的人工智能研究寻找破局之法,催生了“神经-符号计算”、“双系统理论”等新型研究范式。人工智能研究社区再次面临重要的路线抉择。在近期由粤港澳大湾区人工智能与机器人联合会、雷峰网联合主办的第六届GAIR全球人工智能与机器人大会(GAIR 2021)上,有六位重磅嘉宾作为这场里程碑式变革的重要见证者出席:
上世纪 80 年代末,在 MIT 人工智能实验室求学的赵峰教授第一时间触碰到了大洋彼岸行为主义兴起的浪潮。当年,赵峰教授的研究方向是基于模型的人工智能,旨在让计算机程序能够理解、推理物理世界中的现象。在如今的波士顿动力公司创始人MIT马克雷伯特教授的实验室中,赵峰教授发现,当时的机器人研究十分困难,因为我们需要对机器的动力系统作出非常精准的规划,这大大延缓了该领域的研究进度。1989 年,赵峰教授MIT读书时的Committee 老师Rodney Brooks基于行为主义思想设计了一款六足机器人,该机器人在无需进行推理的情况下,能够轻松跨越涵盖,引起了巨大轰动,并获得了 1991 年的 IJCAI 计算机思维奖。Rodney Brooks 高喊“无需推理、无需表示”的口号,发表了著名的论文《Intelligence without representation》。与此同时,“人工智能理论基础大辩论”让学术界在研究方向上出现了重要的分歧,即拥抱数据驱动还是坚持模型驱动和推理。在赵峰教授看来,要回答这一问题,可以从“工程”和“科学”两个方面验证。从工程的角度来说,我们需要考虑某种学术思路能否解决实际问题;从科学的角度来说,我们可以观察某种学说能否经过时间的考验回答基础的智能问题。
林方真教授
当年在斯坦福大学读博士的林方真教授认为,1991年的AI大辩论并不是真正的辩论。传统AI偏向自顶向下,优先考虑人的高层推理和决策过程。Rodney Brooks则提倡自下而上,从简单本体开始学习。他的观点与前者并不矛盾,而是一种补充。这也反映了当年学术界“百家争鸣”的状况,研究者们纷纷提出自己对 AI 未来发展趋势的见解。当年Nils Nilsson也因而倡导AI研究应该考虑融合智能本体。这个观点甚至在当年最有影响的AI教课书上都有体现。
3
九九归一:学派融合,螺旋上升的
感知与认知智能
周志华教授
进入 21 世纪,我国在机器学习领域研究的进步速度与日俱增,涌现出了一大批杰出的人工智能科学家,周志华教授就是其中的代表人物之一。在周志华教授眼中,人工智能的概念和内涵一直在动态发展,今天的“AI”和90年代初的“AI”实质上并不是一回事,当年的AI主要是指“智能行为的符号化建模”这条研究路线,并且当年的神经网络是“与AI对立”的事物。1991年提出的几个问题,体现的是当时研究者们对“符号主义”的反思,以及对引入其他路线的思考。这个论辩的直接结果之一是使得大家承认了人工智能的“三大主义”(符号主义,连接主义,行为主义)。机器学习的发展已经让现在的AI超越当年的内涵,不能再简单归类为三大主义,例如规则学习和决策树大体上可以归入符号主义,神经网络可以归入连接主义,强化学习和演化学习可以归入行为主义,但统计学习、贝叶斯学习很难归入以往的三大主义。事实上AI已形成五大主义:符号主义,连接主义,行为主义,频率主义,贝叶斯主义。但回过头来看,它们任何单方面或许都不够,就像机器学习中的集成学习一样,要多方融合集成,兼收并蓄,例如知识推理与机器学习的融合。周志华教授说他个人可谓是“集成主义(ensemblism)"者,这是他自己造的一个词。1. 黑盒模型 vs 逻辑推理目前流行的深度学习模型大多具有“黑盒属性”,随着深度学习模型的瓶颈逐渐凸显出来,许多学者又将目光投向了逻辑推理。杨强教授指出,认知智能和感知智能的发展过程是一个螺旋式交替上升的过程,二者相辅相成。上世纪,我们研究人工智能问题,涉及的感知表达往往很简单,而考虑的认知过程却非常复杂。随着软硬件我们可以思考如何通过研究感知智能的方法促进对认知智能的研究,是否可以通过成功的感知系统解决认知问题。在张成奇教授看来,图灵测试似乎定义了人工智能研究“只重结果,不看过程”的论调——只要结果达到特定指标,人们就不会有太多质疑和争论。人工智能研究发展至今已经快 70 年,但一直没有跳出图灵测试的“范畴”。大多数人认为,人类独有的认知才是真正的智能,任何动物都具备的感知不属于智能。所以,早期的人工智能研究之所以聚焦于认知智能,首先是因为我们认为认知智能是高级智能;其二是因为那时很难清晰地描述和定义感知。但如今,得益于算力、算法的发展和大数据驱动,感知智能已经相对成熟,很多感知智能方法在应用中取得了不错的效果,符合图灵测试的要求。然而,感知智能对智能发展的推动作用有限,所以越多越多的人开始寄希望于认知智能,从目前的趋势来看,在深度学习时代,大数据和知识双轮驱动是认知智能取得新突破的一个颇有潜力的路径。 林方真教授认为,在深度学习流行的今天,我们仍然需要坚持对知识表示和推理技术的研究。人工智能是个渐进发展的和交叉学科,需要通过不同的方法解决不同的问题。知识表示和推理是智能的重要基石,而逻辑则是推理的数学基础。事实上,人类从古希腊时期就开始尝试使用逻辑来形式化人类的推理,这是众多哲学家和数学家上千年来的研究结晶。在林方真教授看来,用神经网络取代逻辑推理的方式并不可行,应结合各种 AI 工具,而不是用某种工具取代其它的工具。2. 感知、认知智能的融合如今,感知、认知融合技术的融合已渐渐成为了一种趋势。如何实现感知信号、认知推理、行为决策之间的递进是融合各个主义学说的关键问题。对此,周志华教授认为,作为计算机学科出发的人工智能研究者,更关心的是受智能行为的启发解决实际问题,而不必过分拘泥于“认知”“感知”等概念和说法。从技术方法论上看,传统基于逻辑的人工智能主要是基于自顶向下的“演绎”,比较容易利用领域专家知识,而目前机器学习主要是基于自底向上的“归纳”,比较容易利用数据事实,现在差不多是考虑将自顶向下的演绎和自底向上的归纳结合起来的时候了,或许可以解决当前的人工智能技术所不能解决的一些问题。赵峰教授指出,我们需要从两个方面考虑各种主义的融合:(1)人与动物的差别。从感知角度来看,有些动物在某种感知模型里,比人更加敏感。但是人能够把经验总结下来,形成体系化知识,并且在人与人之间互相传播和交流这些知识,所以从这个角度来讲,认知行为理论是值得借鉴的。(2)机器学习。目前机器学习的知识挖掘仍然局限在基础的“关联”层面,未有效地触及因果关系。如今,学术界和工业界对可解释的 AI、可信 AI 技术的需求与日俱增。相比于 30 年前,如今的算力基础和数据准备达到了前所未有的高度,如果把机器学习、结构化知识、认知行为理论有机的结合起来,或许有望突破模型推理的黑盒挑战。3. 知识从何而来?“知识”是人工智能系统发挥作用的重要基础,在周志华教授看来,我们大致可以通过以下两种方式获取知识:(1)将人类的一些常识和经验总结下来形成知识。该过程通常需要用逻辑表达的方式实现。(2)借助庞大的互联网,作为人工智能获取知识的来源。通过以上两种方式获取知识的方法各有千秋。人类基于逻辑关系的知识表达精确性高,对人工智能系统非常友好,从互联网中挖掘出的知识,不可避免地会存在大量的噪声和冲突。而互联网中蕴含的知识量往往更大,获取知识的成本较低。为了将二者结合起来,可能在某种程度上会牺牲互联网知识的灵活性,以及逻辑知识的精确性。机器学习或许可以作为结合二者的“粘合剂”。杨强教授认为,从迁移学习的角度来看,以人类为例,人类在儿时获取的知识的主要来源于父母,相当于给小孩赋予了一个预训练模型。经过教育后,人类在“调参”过程中掌握了学习的规律和方法。长大后,人类不需要接触很多案例,就可以通过迁移学习训练模型,适配新的场景,学会很多新知识。如今,“预训练+调优”的范式在人工智能领域被广泛应用,这一方向前景十分光明。张成奇教授指出,认知知识和感知知识的结合是很一个长远的研究课题。人类不需要大数据感知,基于小样本数据就可以完成学习任务,但对于人工智能系统而言,这是一项非常有挑战的事情。对于一辆自动驾驶汽车来说,为了了解道路周围的环境,它需要用到感知智能。在行驶过程中,为了避免道路拥堵,规划两个位置之间的路径,需要用到认知智能技术。在掌握了认知和感知知识后,它还需要学习驾驶技术,实现具体的动作,这本身是一件非常难的事情。从现阶段来看,我们可以尝试分开研究感知和认知知识。