人工智能是研究、开发用于模拟、扩展人的智能的一门新的技术科学,由人工智能理论、方法、技术及应用系统等几部分组成.它是在计算机、控制论、信息论、数学、心理学等多种学科相互融合的基础上发展起来的一门交叉学科[1].互联网的发展和计算机性能的不断提升,让人工智能在强化学习、深度学习、机器学习等方向取得了巨大进步,形成了智能机器人、语言识别、模式识别、图像识别、专家系统、自然语言处理等诸多研究方向,使人工智能呈现了多元化的发展态势.人工智能是人类社会发展到一定程度的科学技术产物,也是自动化发展的必然趋势,智能化将成为继机械化、自动化之后的又一个新技术领域.

1 人工智能发展历程

人工智能最早源于1936年,英国数学家A.M.Turing在论文《理想计算机》中提出了图灵机模型,然后1956年在《计算机能思维吗》一文中提出机器能够思维的论述(图灵实验)[2].之后计算机的发明和信息论的出现为人工智能发展奠定了良好的基础. 1956年在达特茅斯会议上,Marvin Minskey、John McCarthy等科学家围绕“机器模仿人类的学习以及其他方面变得智能”展开讨论,并明确提出了“人工智能”一词.

人工智能的发展经历了2次发展热潮.第1次是1956—1966年,代表性工作有:1956年,Newell和Simon[3]在定理证明工作中首先取得突破,开启了以计算机程序来模拟人类思维的道路;1960年,McCarthy[4]建立了人工智能程序设计语言LISP.上述成功使人工智能科学家们认为可以研究和总结人类思维的普遍规律并用计算机模拟它的实现,并乐观地预计可以创造一个万能的逻辑推理体系.第2次是20世纪70年代中期至80年代末,在1977年第五届国际人工智能联合会会议上,Feigenbaum[5]教授在特约文章《人工智能的艺术:知识工程课题及实例研究》中系统地阐述了专家系统的思想并提出“知识工程”的概念.至此,人工智能的研究又有新的转折点,即从获取智能的基于能力的策略变成了基于知识的方法研究[6].此后,人工智能的发展进入平稳发展期.

近些年,大数据时代的到来和深度学习的发展象征着人工智能的发展迎来了第3次发展热潮. 1997年,IBM的深蓝(Deep Blue)机器人在国际象棋比赛中战胜世界冠军卡斯帕罗夫,引发了人类对于人工智能的思考[7]. 2016年,英国初创公司DeepMind研发的围棋机器人AlphaGo通过无监督学习战胜了围棋世界冠军柯洁,让人类对人工智能的期待提升到了前所未有的高度,在它的带动下,人工智能迎来了最好的发展时代[8]. 2019年,上海举办了世界人工智能大会,会议集聚了全球人工智能领域最具影响力的科学家和企业家以及相关政府的领导人,围绕人工智能领域的技术前沿、产业趋势和热点问题发表演讲和进行高端对话,开启人类对于人工智能发展的新一轮探索.

2 人工智能的主要技术领域

人工智能的发展形成了庞杂的知识体系,技术发展较为成熟的主要有如下几个领域:计算机视觉、自然语言处理、机器人和机器学习[9].

2.1 计算机视觉

计算机视觉是运用计算机及相关设备对生物视觉的一种模拟,主要是对采集的图像或视频进行处理以获得图像或视频中的信息,其工作原理如图 1所示.

图 1 计算机视觉技术工作原理Fig. 1 Principles of computer vision technology

计算机视觉属于综合性十分强的一个领域,涉及计算机科学、信号处理、应用数学、统计学和神经生理学等学科.以图像识别和人脸识别为代表的感知技术已经发展成熟并走向了应用市场,对交通、医疗、金融、商业等领域产生了巨大影响[10].计算机视觉技术的主要目的是使计算机能同人类一样观察世界,理解世界,并拥有自主适应环境的能力.在实现这个目标之前,现阶段目标是建立一种能够利用视觉技术灵敏反馈的智能信息系统.

卷积神经网络等深度学习算法的兴起,让计算机视觉技术取得了瞩目的成绩.基于深度学习的卷积神经网络模型在图像分类、物体检测、姿态估计、图像分割和人脸识别等多领域表现良好[11].人脸识别是计算机视觉发展最好、应用最广的领域之一.人脸识别技术是将人脸图像或者相关视频输入系统,然后分析每张脸的大小、特征以及面部各器官的位置信息,其技术原理如图 2所示.人脸识别技术主要包括人脸检测、人脸特征提取和人脸识别3个过程[12].

图 2 人脸识别技术原理Fig. 2 Principle of face recognition technology

2.2 自然语言处理

让计算机理解人类的口语和书面语言一直是一些学科的研究目标.自然语言处理是融合计算机科学、人工智能、语言学三者的综合性技术.自然语言处理技术涉及的研究范围主要包括文本朗读、语音合成、语音识别、自动分词、词性标注、句法分析、自然语言合成、问答系统和信息抽取[13].

虽然自然语言处理近期发展较快,但要解决的难题依旧是词义的模糊性及多义性.消除词义歧义不是一件简单的事情,首先需要大量专业语言学知识作为基础,然后需要不断地推理、学习[14],最后是词义的搜索、整理.随社会发展而不断变化的语义和层出不穷的新词等导致这是一项繁重的工作任务.

语义识别是解决语句歧义的技术.语义识别通过分析语序和语法结构理解语句的真正意义[15].国内对中文语义识别问题进行了十几年的研究,随着互联网的流行、发展,语义识别再次成为研究热门,该领域的技术模式有以百度、搜狗为代表的“搜索引擎领域+语义识别技术领先企业”,以中国科学研究院、哈尔滨工业大学为代表的“互联网通用领域+科研机构”,以方正、盛大研究院为代表的“互联网通用领域+商业机构”等.

另外,语音识别技术是自然语言处理的典型技术领域,它使人机对话设想成为现实.语音识别经过十几年的发展,取得了瞩目的成绩.语音识别技术的应用不再局限于通信行业,已经普及到医疗、工业、交通等各大行业[16].同样,语言识别的发展也有很多要解决的难题,如图 3所示.

图 3 语音识别技术的难题Fig. 3 Problems in speech recognition technology

2.3 智能机器人技术

机器人技术至今已经发展到第3代.第3代机器人又称为高级智能机器人,是具有高度适应性的自治机器人.它具有多种感知功能,可进行复杂的逻辑思维、判断决策及在作业环境中独立行动.我国智能机器人的主要研究方向如图 4所示.

图 4 我国智能机器人的主要研究方向Fig. 4 Main research directions of intelligent robot in China

智能机器人系统通常由三部分组成:感知系统、控制系统与执行机构.感知系统一般为电荷耦合器件摄像机(视觉传感器)、激光测距传感器、超声波测距传感器、接触和接近传感器、红外线测距传感器和雷达定位传感器等[17].执行机构依托智能机器人的本体,决定智能机器人的运动空间,如机械手、移步机构(步行机构、轮式机构、履带式机构、爬行机构和混合机构)等.

智能机器人通过融合多种传感器得到的信息,能够有效地适应变化的环境,具有很强的自适应学习能力和自治功能[18].智能机器人涉及许多关键技术,这些技术关系到智能机器人智能性的高低.这些关键技术主要包括如下几点:1)多传感器信息耦合技术.多传感器信息融合是通过综合来自多个传感器的感知数据产生更可靠、更准确或更全面的信息,多传感器信息融合系统能够更加完善、精确地反映检测对象的特性,消除信息的不确定性,提高信息的可靠性. 2)导航和定位技术.在自主移动机器人导航中,无论是局部实时避障还是全局规划,都需要精确已知机器人或障碍物的当前状态信息,以完成导航避障及路径规划等任务. 3)路径规划技术.最优路径规划是依据某个或某些优化准则,在机器人工作空间中找到一条从起始状态到目标状态可以避开障碍物的最优路径. 4)机器人视觉技术.机器人视觉系统的工作包括成像技术,即图像的获取、处理和分析,以及可视化输出和显示,核心任务是特征提取、图像分割和图像辨识. 5)智能控制技术.智能控制方法提高了机器人的速度及精度. 6)人机接口技术.人机接口技术是研究如何使人方便、自然地与机器人交流[19].

2.4 模式识别

模式识别是人工智能的基础技术,是通过计算机用数学技术方法对物理量及其变化过程进行描述与分类的一门技术,通常用来对图像、文字、照片以及声音等信息进行识别、处理和分类[20].模式识别的基本方法分为统计模式识别和句法模式识别.统计模式识别首先是将被识别对象数字化,转换为适于计算机处理的数字信息.句法方法则用符号描述图像特征.将统计模式识别或句法模式识别与机器学习中的神经网络技术、支持向量机技术等或人工智能中的专家系统、不确定性推理方法相结合,衍生出了一系列当前应用广泛的热门技术,如声纹识别技术、指纹识别技术、数字水印技术等.

声纹识别是通过语音中蕴含的能表征和标志说话人特征,对说话人身份进行识别的一门技术[21].与语音识别提取语音中的信息不同,声纹识别是根据特征信息,对说话人的身份进行识别.声纹识别的过程首先是提取说话人的声学特征,然后根据说话人的声学特征训练对应的模型,将所有人的模型集合在一起组成系统的说话人模型库,然后当有人说话时,系统将提取的说话人特征与模型库进行对比,并根据对比结果判别说话人身份.声纹识别在金融安全、军事安全等方面应用广泛[22].

指纹识别是模式识别领域中使用最早,也是最为成熟的生物鉴定技术.指纹识别技术通过采集指纹图像(手指表面脊和谷的映像组合),并对图像进行处理以提取不同的特征来识别独一无二的指纹[23].根据提取的不同特征,可以将指纹识别方法分为图像统计法、纹理匹配法、细节特征法和汗孔特征法,其中主流方法是细节特征法.细节特征包括指纹的脊终点和分叉点信息.细节特征法匹配准确度高,匹配难度适中,在网络安全、金融机构、医疗机构应用广泛并且发展前景广阔.

数字水印技术作为一种将特殊信息嵌入媒体数据的技术,已经成为研究热点并取得了广泛应用.数字水印技术通常应用于数字图像、音频、视频以及其他媒体产品上以进行版权保护和验证多媒体数据的完整性.典型的数字水印方案一般由水印生成、水印嵌入和水印提取或检测三方面组成[24].目前,水印方案大多在嵌入和提取过程中采用了密钥,密钥已成为水印信息的重要组成部分,也是每个设计方案特色之所在.在信息预处理、信息嵌入点选择等不同环节完成密钥的嵌入,只有掌握密钥,才能获取水印.数字水印技术可以应用于数据库安全和文本文档安全,在大数据时代,数字水印在数据安全和网络安全方面起着不可或缺的作用,对保护人们的隐私信息尤为重要.

3 人工智能应用

在信息量不断增大、信息呈碎片化的当代,人工智能的应用也越来越为人类所重视.人工智能正在给各行业带来变革与重构,一方面,将人工智能技术应用到现有的产品中,可以创新产品并发展新的应用场景;另一方面,人工智能技术的发展正在颠覆传统行业,人工智能对人工的替代成为不可逆转的趋势.

对于人工智能的应用来说,技术平台、产品应用环境、市场、用户等因素都对人工智能的产业化有很大的影响.如何实现人工智能产业自身的创新并应用到集体场景中将会是各行业发展的关键点[25].人工智能技术日益成熟,商业化场景逐渐落地,工业、医疗、安防、金融等领域成为目前的主要应用场景,如图 5所示.

图 5 AI应用场景Fig. 5 AI application scenarios

3.1 工业

人工智能在工业方面的应用主要表现在工业制造、服务业和家庭生活3个方面.人工智能有望实现制造业从半自动化生产到全自动化生产的转变.工业以太网的建立、传感器的使用以及算法的革新将使工业制造过程中所有生产环节的数据打通,人与机器、机器与机器之间实现互联互通.一方面,人机交互比较便利;另一方面,机器之间将协作办公,既能够精细化操作,又能及时地预测产品需求并调整产能[26].

人工智能在服务业中的应用除了供应智能设备之外,提供现场服务也是最常见的用例之一.例如:采用人工智能识别正确的现场服务管理资源,以便在对客户和业务都有意义的时间处理特定任务.综合考虑任务特征、现场服务人员的专业能力以及许多其他变量以确定解决方案.使用人工智能估计工作人员出行时间、任务持续时间和服务交付的其他关键组件,可使组织获得更高的效率和资源利用率.通过改进首次修复率来提高效率,从而更快地响应紧急情况[27].

智能家居是人工智能应用的重要领域.智能家居的目标是推进家居生活产品的智能化,包括照明系统、音响系统、能源管理系统等,实现家居产品从感知到认知再到决策的发展,更进一步的是智能家居系统的建立.搭载人工智能的多款产品都有望成为智能家居的核心,包括机器人、智能音箱、智能电视等产品[28].人工智能应用的实现要依赖于工业设计,还有智能产品的输出,只有当人工智能技术与产品输出进行了有效结合,才能为人工智能应用场景落地奠定基础.

3.2 医疗

目前,医疗行业存在较多问题,如医疗资源不足、地区分配不均、医疗成本高、疾病变化快等.医疗服务与人们的利益息息相关,随着人口老龄化逐渐增加,慢性疾病增长,人们对医疗服务的需求也逐渐增强.待解决的医疗痛点和待满足的医疗服务需求成为人工智能技术应用于医疗场景的现实需求.近几年,人工智能在医疗领域的应用发展迅速. 《2017年中国医疗健康智能硬件发展报告》显示,经历了3年市场培育和发展,医疗健康终端产品逐渐被大众接受且开始进入高速发展阶段.从全球企业实践来看,“人工智能+医疗”具体应用场景主要有医学影像、辅助诊疗、新药研发、可穿戴设备、急救室和医院管理、营养管理、病理学、生活方式管理和监督等.

“人工智能+医学影像”被认为是最具发展前景的领域[29].医学影像临床工作具有一定的复杂性,但随着计算机技术的发展,借助人工智能技术,它已经能够进行精准的医学影像图像分析.人工智能技术在肿瘤检出、定性诊断、自动结构化报告、肿瘤提取、肿瘤放疗靶器官勾画等方面已有较多的临床研究和临床应用[30].另外,具有良好发展前景的领域还包括“人工智能+辅助诊疗”,即将人工智能技术应用于辅助诊断中,让机器学习专家的医疗知识,进一步地通过模拟医生的思维和诊断推理来解释病症原因,最后给出可靠的诊断结果和治疗方案,其主要流程如图 6所示.目前已有该技术成熟的应用案例[31].

图 6 人工智能+辅助诊疗Fig. 6 AI+auxiliary diagnosis and treatment

3.3 安防

安防是针对各种安全隐患和社会安全而言的,具有持久性的特征.它要求即时数据信息和监测,人工智能正是能满足其即时性要求的重要技术.

随着时代发展和安防领域的拓展,传统安防建设过程中频频出现如下问题,包括:安防设备和技术手段落后、安防产品和系统质量不佳、庞大系统检索困难、信息孤岛导致系统对接难度大.借助人工智能技术,积极推进安防智能化是解决上述问题的有效途径.安防行业主要与图像视频应用相关,其中最主要的研究方向有图像或视频中的对象检测和定位、基于视频的目标跟踪,以及基于图像或视频的场景分类、目标场景分析和行为识别[32].人工智能技术可以通过特征识别做到车牌识别、人脸识别等,通过行为分析技术可以做到人数管控、个体追踪、禁区管控、异常行为分析等[33].此外,实时监控系统、巡逻机器人、排爆机器人等也能应用到如运动会、国际会议等重要场合[34-36].

3.4 金融

人工智能在金融领域的应用主要集中在投资决策辅助、风控与智能支付3个方面.在投资决策辅助方面,人工智能技术将协助金融工作者从数以万计的信息中心迅速抓取有效信息,并进一步对数据进行分析,利用大数据分析技术、自然语义分析技术等自动准确地分析与预测市场的行情走向,从而实现信息的智能筛选与处理,辅助工作人员进行决策[37-38].在风控方面,人工智能也能帮助金融机构建立金融风控平台,进行风控管理,实现对投资项目的风险分析和决策、个人征信评级、信用卡管理等业务.在智能支付领域中,利用人工智能的人脸识别、声纹识别、虹膜识别等技术实现“刷脸支付”“语音支付”“虹膜支付”[39-41]等.

按照金融业务执行的前端、中端、后端模块来看,人工智能在金融领域的应用场景主要有智能客服、智能身份识别、智能营销、智能风控、智能投顾、智能量化交易等.人工智能技术可以助力金融行业形成标准化、模块化、智能化、精准化的风险控制系统,帮助金融机构、金融平台及相关监管层对存在的金融风险进行及时、有效的识别和防范.

4 总结与展望

人工智能是新一轮产业变革的核心驱动力,从世界主要大国纷纷在人工智能领域出台国家战略以抢占人工智能时代制高点的国际环境来看[42],人工智能将进一步释放历次科技革命和产业变革积蓄的巨大能量,催生出智能化的新技术、新产品、新产业、新业态、新模式.人工智能历经几十年的发展,在理论和应用方面取得很多进展.本文简要回顾了人工智能发展历程,并归纳了人工智能领域近些年来取得的重大科技进步及人工智能在各行业的相关应用.

我国自2016年起将人工智能列入国家战略地位且先后出台了多项人工智能相关政策,包括《新一代人工智能发展规划》、“中国制造2025”、《“十三五”国家科技创新规划》等,更在2017—2019年连续3年的政府工作报告中提到人工智能,可以看出我国对人工智能发展的高度重视.

在未来很长时间内,在强大的社会需求和市场因素促进下,人工智能将会进一步地朝着服务于人类的方向发展,将呈现如下发展趋势.

1) 人工智能产业升级的驱动力源于人工智能核心技术的全面突破.随着计算机计算能力的提升和算法的优化,人工智能核心技术,如计算机视觉、自然语言处理等,将向更深更广的方向发展.广义地讲,人工智能的理解能力将不断提高.

2) 随着物联网建设进程的加快,在制造、家居、金融、教育、交通、安防、医疗、物流等领域对人工智能技术和产品的需求将进一步释放,相关智能产品的种类和形态将越来越丰富并呈现出个性化发展,主要体现在如智能服装、智能家电、智能汽车等智能产品和服务.

3) 近些年各行各业都积累了大量的行业数据,都具备了与人工智能技术相结合并深入发展的基础.军事领域加入人工智能技术,对深度学习中的图像识别技术、无人机技术进行应用,可以在未来无人化现代战争中起到重要作用;利用公安系统建立的各类丰富的公共基础信息资源、人员社会行为动态信息库,人工智能技术可以代替刑侦人员进行危险的刑侦工作,通过精确定位抓捕逃犯[43];制造业人工智能的低成本投入、高精确度、容易管理等特点,能够大幅度地提高生产力,将会是很有发展潜力的行业领域等.