作为粤港澳大湾区的第一AI盛会,GAIR大会已成功举办五届,留下众多精彩、经典和令人惊叹的瞬间。GAIR 2021则延续以往豪华阵容,以1场主旨论坛、2场行业峰会、9场高峰论坛,涵盖自动驾驶、安防、集成电路、医疗、元宇宙、碳中和、隐私计算、新消费等热门领域。
滚滚长江东逝水,浪花淘尽英雄。上世纪80年代末,以符号逻辑为基础的传统人工智能遭遇理论危机,新的人工智能理论陆续被提出,人工智能研究也进入了一个“百家争鸣”的新时代,联结主义、行为主义等学说迅速兴起。
近十年来,得益于硬件设备和算法技术的提升,以深度学习为代表的联结主义感知智能技术突飞猛进。然而,正如图灵奖获得者 Alan Kay 所言,尽管如今的深度学习研究空前繁荣,此类方法在数学原理上的突破仍十分有限。
在感知智能技术越来越成熟的今天,我们已经可以通过深度学习技术从各种数据来源中提取有效的表征。但是,深度学习技术在决策、规划方面的能力却十分有限。
为此,研究者们又将目光投向了各种学说的融合,试图为未来的人工智能研究寻找破局之法,催生了“神经-符号计算”、“双系统理论”等新型研究范式。人工智能研究社区再次面临重要的路线抉择。
在近期由粤港澳大湾区人工智能与机器人联合会、雷峰网联合主办的第六届GAIR全球人工智能与机器人大会(GAIR 2021)上,有六位重磅嘉宾作为这场里程碑式变革的重要见证者出席:
- 杨强,加拿大工程院院士、加拿大皇家科学院院士, 微众银行首席人工智能官,IEEE/AAAI Fellow;
- 张成奇,悉尼科技大学副校长,澳大利亚人工智能联合会理事长;
- 周志华,南京大学计算机系主任兼人工智能学院院长,欧洲科学院院士,ACM/AAAI/IEEE Fellow;
- 赵峰,清华智能产业研究院首席科学家、国际欧亚科学院院士、IEEE Fellow、Sloan Fellow
- 林方真,香港科技大学计算机系教授,AAAI Fellow;
- 林德康,奇点机智联合创始人。
圆桌论坛:1991人工智能大辩论三十周年纪念
六位顶级人工智能专家齐聚一堂,回顾当年人工智能大辩论的盛况及影响,以史为鉴,探寻人工智能下一个 30 年的发展道路。
1 风云变幻:1991 年人工智能大辩论
自 1956 年达特茅斯会议之后,人工智能研究者们主要形成了符号主义、联结主义、行为主义等学说。上世纪 90 年代初,符号主义流派在人工智能研究领域占据了主导地位。在物理符号系统假设和基于知识的启发式求解方法指导下,人工智能技术在专家系统、机器翻译、机器视觉、问题求解方面已经崭露头角。
然而,80 年代个人计算机的普及对专家系统的需求产生了极大的冲击。1991 年,被寄予厚望的日本“第五代计算机”(即“人工智能计算机”)研发计划的失败,以符号主义为主的传统人工智能技术(GOFAI)遭遇了学术理论和产业应用上的瓶颈,人工智能研究陷入低谷。为了打破这一局面,新的联结主义、行为主义理论和技术纷纷登场。
在联结主义方面,Yann LeCun、Sepp Hochreiter 等学者在联结主义人工智能技术方面取得了一定的进展,“黑盒”的神经网络技术可以避开知识表示带来的困难,但神经元间联结的结构和权值选取又成了难题。在行为主义方面,Rodney A. Brooks 提出研究“无需表示、无需推理”的智能,并基于行为主义技术设计出了一系列具备避让、前进、平衡等各种运动能力的机器人,技惊四座。
为了讨论人工智能研究将何去何从,国际人工智能联合会(IJCAI)在 1991 年的人工智能顶级期刊《Artificial Intelligence》的专刊上组织了一场人工智能的大辩论,就新的人工智能理论框架从五个问题、正反方面进行了讨论:
1. 知识与概念化是否是人工智能的核心?
2. 认知能力能否与感知分离开来研究?
3. 认知的轨迹是否可用类自然语言描述?
4. 认知能否从学习汇总分离进行研究?
5. 所有的认知是否有一种统一的结构?
林德康教授
林德康教授指出,1991年人工智能领域的主要争论分成两个派系——符号主义和行为主义,两派的代表人物,正是 IJCAI 1991 计算机与思想奖的两位得主——后来的康奈尔大学校长 Martha Pollack,以及麻省理工学院人工智能实验室主任 Rodney Brooks。
Rodney Brooks 表示,行为主义的方法才是正确的AI范式,根据低层次感知信号去得到高层次决策。为此,他在论文《Intelligence without representation》中提出,人们通过符号主义研究表征的道路是失败的,我们应该以渐进试错的方式逐渐实现智能,让智能体依赖于通过感知和行为与现实世界连接起来,消除对表征的依赖。
Martha Pollack 则指出AI应该通过符号逻辑表达出来的约束公式,来描述世界,再用约束满足的方法把高层次的目标细化。她在论文《The Use of Plans》中指出,智能体存在于复杂的环境中,它们需要通过规划实现对动作的操控。规划不仅被用于指导行为,还被用于控制推理和实现智能体之间的协作,使复杂、动态的多智能体环境下的智能行为成为了可能。因此,规划在人工智能学术体系中应该处于核心地位,
这次辩论的内容一经发表,就引起了人工智能研究社区的极大反响和讨论,促进了联结主义、行为主义的兴起。从此,人工智能研究进入了新的纪元,并逐渐形成了如今的人工智能学术、产业格局。
2 异军突起:华人 AI 研究迅猛发展
对于中国人工智能研究而言,1991 年也具有特殊的意义。在这一年的 IJCAI 91' 大会上,共有 6 位华人学者发表了研究成果,其中有五位学者在国外谋得教职,他们是:滑铁卢大学的杨强、西安大略大学的凌晓峰、麦考瑞大学的张康、俄亥俄州立大学的赵峰、曼尼托巴大学的林德康。在 IJCAI 91' 上,“人工智能理论基础大辩论”成为了中国参会者们热议的话题。受此影响,华人学者们于 1992 年夏天在中科院计算所智能中心召开了“1992 AI Summer School”,报告者为国内外最早在顶级会议和期刊上发表研究工作的华人学者,包括:张钹、李国杰、高文、白硕、杨强、张成奇、彭云、林德康、李明、赵峰、林方真,等。这次活动也为我国人工智能研究带来了新的“火种”,为日后中国 AI 研究的腾飞奠定了基础。
在本届 GAIR 大会上,杨强、张成奇、周志华、赵峰、林方真、林德康等顶级人工智能专家从各自的角度出发回顾了当年这次“大辩论”的深远影响。
张成奇教授
1982 年,张成奇教授正在吉林大学攻读硕士研究生,从事专家系统方面的研究。那时,吉林大学是我国最早开始研究人工智能的单位之一,并在王湘浩院士的领导下发起了全国高校人工智能研究会。
1992 年,张成奇教授基于群论解决了分布式专家系统中不同的不确定性模型互相转化的问题,这一成果发表在了人工智能顶级期刊《Artificial Intelligence》上,这是中国大陆学者首次在该期刊上发表论文。在张成奇教授看来,相较于当年,如今的感知智能、行为主义智能技术已经得到了长足的发展,分布式人工智能可以发展一条更为光明道路。同年,在张成奇教授成功于《Artificial Intelligence》上发表论文四个月之后,杨强教授的研究成果也首次发表在该期刊上。
杨强教授
彼时,如今的“迁移学习”、“联邦学习”旗手——杨强教授也醉心于符号主义人工智能研究,在规划领域颇有建树,试图从逻辑角度寻找搜索路径,探究高层次的推理技术。1989 年,杨强教授在 IJCAI 上发表了其第一篇顶会论文《Preprocessing Search Spaces for Branch and Bound Search》,在该论文中,杨强教授提出了一种名为“threaded decisions graph”的数据结构,通过事先在搜索空间中进行预处理的方式,降低了启发式搜索问题求解方法的计算开销。1990 年,杨强教授开发出的第一个开源规划软件“ABTWEAK”在工业界得到广泛应用,该成果被 AAAI 1990 收录。1991 年,杨强教授在 IJCAI 大会上发表论文《The Downward Refinement Property》,提出了一种层次化的逻辑表达关注度模型,在保证准确性的条件下大幅提高了推理速度。同年,杨强教授的论文《Characterizing Abstraction Hierarchies for Planning》也被 AAAI 大会收录。1992 年,杨强教授首次在《Artificial Intelligence》期刊上发表论文。
回顾当年的人工智能发展转折,杨强教授认为,1991 年的大辩论后,逻辑研究者们跳出了单调逻辑,转向发展复杂逻辑。同时,IWML(即如今的 ICML)出现,机器学习开始进行数学化革命。随后,随机森林、集成学习、神经网络等“黑盒”的机器学习逐渐为人所接受,可解释性逐渐淡化,形成了人工智能领域文化的转变。同时,行为主义也逐渐兴起,该流派的研究者们认为智能不仅存在于人的大脑,也存在于人体的肌肉、骨骼中。此后,扫地机器人、谷歌机器狗以及火星探索者机器人纷纷涌现出来。这些机器人在不进行逻辑推理的情况下,实现了一定的智能行为。在杨强教授看来,当年的人工智能研究从符号主义推崇的“使用一套算法解释智能现象”逐渐向“借鉴模型驱动的物理学,通过通用模型解释智能现象”过渡。
赵峰教授
上世纪 80 年代末,在 MIT 人工智能实验室求学的赵峰教授第一时间触碰到了大洋彼岸行为主义兴起的浪潮。当年,赵峰教授的研究方向是基于模型的人工智能,旨在让计算机程序能够理解、推理物理世界中的现象。
在如今的波士顿动力公司创始人MIT马克雷伯特教授的实验室中,赵峰教授发现,当时的机器人研究十分困难,因为我们需要对机器的动力系统作出非常精准的规划,这大大延缓了该领域的研究进度。1989 年,赵峰教授MIT读书时的Committee 老师Rodney Brooks基于行为主义思想设计了一款六足机器人,该机器人在无需进行推理的情况下,能够轻松跨越涵盖,引起了巨大轰动,并获得了 1991 年的 IJCAI 计算机思维奖。Rodney Brooks 高喊“无需推理、无需表示”的口号,发表了著名的论文《Intelligence without representation》。
与此同时,“人工智能理论基础大辩论”让学术界在研究方向上出现了重要的分歧,即拥抱数据驱动还是坚持模型驱动和推理。在赵峰教授看来,要回答这一问题,可以从“工程”和“科学”两个方面验证。从工程的角度来说,我们需要考虑某种学术思路能否解决实际问题;从科学的角度来说,我们可以观察某种学说能否经过时间的考验回答基础的智能问题。
林方真教授
当年在斯坦福大学读博士的林方真教授认为,1991年的AI大辩论并不是真正的辩论。传统AI偏向自顶向下,优先考虑人的高层推理和决策过程。Rodney Brooks则提倡自下而上,从简单本体开始学习。他的观点与前者并不矛盾,而是一种补充。这也反映了当年学术界“百家争鸣”的状况,研究者们纷纷提出自己对 AI 未来发展趋势的见解。当年Nils Nilsson也因而倡导AI研究应该考虑融合智能本体。这个观点甚至在当年最有影响的AI教课书上都有体现。
3 九九归一:学派融合,螺旋上升的感知与认知智能
周志华教授
进入 21 世纪,我国在机器学习领域研究的进步速度与日俱增,涌现出了一大批杰出的人工智能科学家,周志华教授就是其中的代表人物之一。
在周志华教授眼中,人工智能的概念和内涵一直在动态发展,今天的“AI”和90年代初的“AI”实质上并不是一回事,当年的AI主要是指“智能行为的符号化建模”这条研究路线,并且当年的神经网络是“与AI对立”的事物。
1991年提出的几个问题,体现的是当时研究者们对“符号主义”的反思,以及对引入其他路线的思考。这个论辩的直接结果之一是使得大家承认了人工智能的“三大主义”(符号主义,连接主义,行为主义)。
机器学习的发展已经让现在的AI超越当年的内涵,不能再简单归类为三大主义,例如规则学习和决策树大体上可以归入符号主义,神经网络可以归入连接主义,强化学习和演化学习可以归入行为主义,但统计学习、贝叶斯学习很难归入以往的三大主义。事实上AI已形成五大主义:符号主义,连接主义,行为主义,频率主义,贝叶斯主义。但回过头来看,它们任何单方面或许都不够,就像机器学习中的集成学习一样,要多方融合集成,兼收并蓄,例如知识推理与机器学习的融合。周志华教授说他个人可谓是“集成主义(ensemblism)"者,这是他自己造的一个词。
1. 黑盒模型 vs 逻辑推理
目前流行的深度学习模型大多具有“黑盒属性”,随着深度学习模型的瓶颈逐渐凸显出来,许多学者又将目光投向了逻辑推理。
杨强教授指出,认知智能和感知智能的发展过程是一个螺旋式交替上升的过程,二者相辅相成。上世纪,我们研究人工智能问题,涉及的感知表达往往很简单,而考虑的认知过程却非常复杂。随着软硬件我们可以思考如何通过研究感知智能的方法促进对认知智能的研究,是否可以通过成功的感知系统解决认知问题。
在张成奇教授看来,图灵测试似乎定义了人工智能研究“只重结果,不看过程”的论调——只要结果达到特定指标,人们就不会有太多质疑和争论。人工智能研究发展至今已经快 70 年,但一直没有跳出图灵测试的“范畴”。
大多数人认为,人类独有的认知才是真正的智能,任何动物都具备的感知不属于智能。所以,早期的人工智能研究之所以聚焦于认知智能,首先是因为我们认为认知智能是高级智能;其二是因为那时很难清晰地描述和定义感知。但如今,得益于算力、算法的发展和大数据驱动,感知智能已经相对成熟,很多感知智能方法在应用中取得了不错的效果,符合图灵测试的要求。
然而,感知智能对智能发展的推动作用有限,所以越多越多的人开始寄希望于认知智能,从目前的趋势来看,在深度学习时代,大数据和知识双轮驱动是认知智能取得新突破的一个颇有潜力的路径。
林方真教授认为,在深度学习流行的今天,我们仍然需要坚持对知识表示和推理技术的研究。人工智能是个渐进发展的和交叉学科,需要通过不同的方法解决不同的问题。知识表示和推理是智能的重要基石,而逻辑则是推理的数学基础。事实上,人类从古希腊时期就开始尝试使用逻辑来形式化人类的推理,这是众多哲学家和数学家上千年来的研究结晶。在林方真教授看来,用神经网络取代逻辑推理的方式并不可行,应结合各种 AI 工具,而不是用某种工具取代其它的工具。
2. 感知、认知智能的融合
如今,感知、认知融合技术的融合已渐渐成为了一种趋势。如何实现感知信号、认知推理、行为决策之间的递进是融合各个主义学说的关键问题。
对此,周志华教授认为,作为计算机学科出发的人工智能研究者,更关心的是受智能行为的启发解决实际问题,而不必过分拘泥于“认知”“感知”等概念和说法。从技术方法论上看,传统基于逻辑的人工智能主要是基于自顶向下的“演绎”,比较容易利用领域专家知识,而目前机器学习主要是基于自底向上的“归纳”,比较容易利用数据事实,现在差不多是考虑将自顶向下的演绎和自底向上的归纳结合起来的时候了,或许可以解决当前的人工智能技术所不能解决的一些问题。
赵峰教授指出,我们需要从两个方面考虑各种主义的融合:(1)人与动物的差别。从感知角度来看,有些动物在某种感知模型里,比人更加敏感。但是人能够把经验总结下来,形成体系化知识,并且在人与人之间互相传播和交流这些知识,所以从这个角度来讲,认知行为理论是值得借鉴的。(2)机器学习。目前机器学习的知识挖掘仍然局限在基础的“关联”层面,未有效地触及因果关系。如今,学术界和工业界对可解释的 AI、可信 AI 技术的需求与日俱增。相比于 30 年前,如今的算力基础和数据准备达到了前所未有的高度,如果把机器学习、结构化知识、认知行为理论有机的结合起来,或许有望突破模型推理的黑盒挑战。
3. 知识从何而来?
“知识”是人工智能系统发挥作用的重要基础,在周志华教授看来,我们大致可以通过以下两种方式获取知识:(1)将人类的一些常识和经验总结下来形成知识。该过程通常需要用逻辑表达的方式实现。(2)借助庞大的互联网,作为人工智能获取知识的来源。通过以上两种方式获取知识的方法各有千秋。人类基于逻辑关系的知识表达精确性高,对人工智能系统非常友好,从互联网中挖掘出的知识,不可避免地会存在大量的噪声和冲突。而互联网中蕴含的知识量往往更大,获取知识的成本较低。为了将二者结合起来,可能在某种程度上会牺牲互联网知识的灵活性,以及逻辑知识的精确性。机器学习或许可以作为结合二者的“粘合剂”。
杨强教授认为,从迁移学习的角度来看,以人类为例,人类在儿时获取的知识的主要来源于父母,相当于给小孩赋予了一个预训练模型。经过教育后,人类在“调参”过程中掌握了学习的规律和方法。长大后,人类不需要接触很多案例,就可以通过迁移学习训练模型,适配新的场景,学会很多新知识。如今,“预训练+调优”的范式在人工智能领域被广泛应用,这一方向前景十分光明。
张成奇教授指出,认知知识和感知知识的结合是很一个长远的研究课题。人类不需要大数据感知,基于小样本数据就可以完成学习任务,但对于人工智能系统而言,这是一项非常有挑战的事情。对于一辆自动驾驶汽车来说,为了了解道路周围的环境,它需要用到感知智能。在行驶过程中,为了避免道路拥堵,规划两个位置之间的路径,需要用到认知智能技术。在掌握了认知和感知知识后,它还需要学习驾驶技术,实现具体的动作,这本身是一件非常难的事情。从现阶段来看,我们可以尝试分开研究感知和认知知识。
4 结语
凡是过往,皆为序章。自 1991 年“人工智能理论基础大辩论”已过去 30 年。30 年来,世界人工智能发展格局迅速变化,中国的人工智能研究者们前赴后继,完成了对世界先进国家人工智能技术跟跑、并跑、到领跑的过程。如今,各种学说的互相交融逐渐成为了人工智能研究社区的共识。让我们一同期待人工智能研究社区迎来下一个百花齐放、万紫千红的 30 年。
来源: AI科技评论