点击上方音频按钮,为您语音播报本文
模式识别研究如何使机器模拟人的感知功能,从环境感知数据中检测、识别和理解目标、行为、事件等模式。模式广泛存在于各种形式的信号和数据中,模式识别是人和机器感知环境、从环境获取知识的主要途径。机器学习由模式识别和计算学习理论演化而来,通过在数据上训练优化而自动建立数据分析和模式识别的模型。
20世纪50年代以来,模式识别的理论和方法得到了巨大的发展。特别是近20年来,随着大数据和高性能计算的飞速发展,以深度神经网络为代表的深度学习方法在视听觉、语言、规划、控制等方面取得了突破性进展,模式识别与机器学习普遍被认为是实现人工智能的最佳途径和最核心的技术。
进入21世纪以来,以模式识别为代表的人工智能技术业已成为最重要的科技进展之一,人工智能正在诸多方面改变着人类的工作与生活方式。在这次以人工智能为核心的科技变革中,原有的研究问题、方法以及对智能系统的需求,都将发生前所未有的变化,这给模式识别和机器学习的发展带来新的机遇与挑战。可以预见,未来模式识别技术将变得无处不在,且越发成为不可替代的核心要素。模式识别技术将和认知、决策、控制技术越来越紧密地结合在一起,促进开放复杂环境下智能技术的研究和应用。
本书在回顾模式识别与机器学习发展历程的基础上,从模式识别基础理论、计算机视觉、语音语言信息处理、模式识别应用技术四个方面出发,认真梳理未来互联互通的世界对智能科学和技术的重大需求,结合模式识别理论与技术的已有基础,归纳模式识别学科发展面临的重大挑战和机遇,厘清学科发展所涉及的关键科学和技术问题,分析界定学科发展新的生长点和新趋势,凝练未来重要研究方向,形成模式识别学科的发展战略建议。
模式识别基础理论方向主要研究模式表示、分类和理解的建模理论与方法,主要方法可分为统计模式识别、句法和结构模式识别、人工神经网络、支持向量机(support vector machine,SVM)等类型。
分类器设计是模式识别的主要研究内容,包括监督学习、无监督学习、半监督学习、迁移学习、强化学习等学习方法。在过去几十年的模式识别基础研究中,在贝叶斯决策与估计、概率密度估计、分类器设计、聚类、特征提取与学习、人工神经网络与深度学习、核方法与支持向量机、句法结构模式识别、概率图模型、集成学习、半监督学习、迁移学习、多任务学习等方面涌现出一系列具有重要影响力的工作。
目前模式识别基础理论的研究呈现出几个重要的研究趋势:开放环境感知、结构可解释性、鲁棒性与自适应性等。未来的研究重点包括模式识别的认知机理与计算模型、理想贝叶斯分类器逼近、基于不充分信息的模式识别、开放环境下的自适应学习、知识嵌入的模式识别、交互式学习的理论模型与方法、可解释性深度模型、新型计算架构下的模式识别、模式结构解释和结构模型学习、安全强化的模式识别理论与方法等。
计算机视觉研究如何基于图像让计算机感知和理解周围世界。过去几十年研究的核心大多基于马尔视觉计算理论框架,主要研究如何从二维图像复原三维几何结构。近10 年以来,以卷积神经网络(convolutional neural networks,CNN)为代表的深度学习技术,在计算机视觉领域取得了重大突破,为目标识别与检测、图像分割、图像场景理解、图像检索、视觉跟踪、行为与事件分析等研究带来了显著的进展。
当下,计算机视觉与认知神经科学、应用数学和统计学等学科不断交叉,与各种硬件深度融合,并受各种实际应用的驱动,在新型成像条件下的视觉研究、生物启发的计算机视觉研究、多传感器融合的三维视觉研究、高动态复杂场景下的视觉场景理解、小样本目标识别与理解、复杂行为语义理解等方面将受到高度重视。
语音和文字是人类语言的两个基本属性,也是模式识别研究和应用的重要领域。以语音为主要处理对象的语音识别、语音合成和说话人识别等通常被称为语音技术,以词汇、句子、篇章等文本、语言为主要处理对象的研究则通常被称为自然语言处理。
语音语言基础资源建设、汉字编码与输入输出及汉字信息处理、知识工程与知识库建设是语音语言信息处理技术能够蓬勃发展的基础和支撑条件。在关键技术和理论方法方面,语言模型、序列标注模型、句法结构理论和篇章表示理论、文本表示模型、自动问答与人机对话、机器翻译、语音增强、语音识别、语音合成等均取得了显著的进展。同时,相关产业化应用方兴未艾。未来语音语言信息处理技术除了在具体应用中不断追求极致的性能外,从科学研究角度出发探究人脑语言理解的神经基础和认知机理也十分重要。具体来讲,语义表示和语义计算模型,面向小样本和鲁棒可解释的自然语言处理,基于多模态信息的自然语言处理,交互式、自主学习的自然语言处理,类脑语言信息处理,复杂场景下的语音分离与识别,小数据个性化语音模拟等问题将成为研究热点。
模式识别技术的应用已经深入人类生产和生活的方方面面,重要性日益凸显,在诸多应用领域取得了令人瞩目的成果。面向应用的技术研究也推动了模式识别基础理论与方法的快速发展。
生物特征识别、视频监控、多媒体信息分析、文档信息处理、智能医疗等是模式识别发展较快和应用较广泛的领域。具体来说,在面部、手部和行为生物特征识别、声纹识别、图像和视频合成、遥感图像分析、医学图像分析、文字与文本识别、复杂文档版面分析、多媒体数据分析、多模态情感计算、图像取证与安全等应用方面取得了显著进展。随着模式识别技术应用不断深入,具体应用对模式识别技术不断提出新的需求,新的研究问题不断涌现,高可靠、高精度、高效率的模式识别应用技术变得越来越重要。其中,非受控环境下的可信生物特征识别、生物特征深度伪造和鉴伪、遥感图像弱小目标识别和场景理解、医学图像高精度解释、复杂文档识别与重构、异构空间网络关联事件分析与协同监控、神经活动模式分析等都是在不同应用领域亟待解决的重要问题。
近年来,模式识别与机器学习、数据挖掘、脑与认知科学等领域交叉融合,相互促进。未来会结合得更加紧密,奠定模式识别技术在不同领域和不同应用中蓬勃发展的坚实基础。
除了回顾理论和技术的发展外,本书还专门回顾了我国模式识别学科的发展历程,分析概括了包括国家现行政策以及学术团体对学科发展的推动作用,具体介绍了我国在模式识别基础理论、计算机视觉、语音语言信息处理、模式识别应用技术等各个方向取得的历史性进展。同时,分析了我国模式识别研究的优势领域和薄弱方向,并阐述了其中的主要原因。本书还指出,我国的模式识别学科发展水平距离国际领先水平还存在较大差距,总体呈现出重技术轻理论、论文多原创少、学界弱业界强等特点。
最后,结合我国研究现状、现实需求以及国际环境,本书提炼了以类脑模型、自主学习、可解释和可理解模型、自适应学习、语义理解、机器学习安全为主的重点发展方向,并且从科技人才培养、团队制度建设、科研支持政策与国际合作政策等方面出发,提出具体可操作的政策建议,以期促进我国模式识别领域的学术思想交流,推动学科发展和技术创新,推进创新人才培养模式的探索。
本文摘编自《中国学科发展战略· 模式识别》,由中国科学院共同组织编写,标题和内容有调整。语音播报为智能生成,如有疑问请以文本为准。科学人文在线,与您共同关注科技史、科技哲学、科技前沿与科学传播,关注人类社会的可持续发展,创造有价值的阅读!
今日好书推荐
内容简介
本书阐明了模式识别学科的科学意义与战略价值,总结了模式识别学科的发展历史及其研究规律,梳理了模式识别学科在基础理论、计算机视觉、语音语言信息处理、模式识别应用技术等方面的发展现状,分析了模式识别学科中尚未完全解决的关键科学问题,确定了面向学科前沿的优先发展方向和研究重点,指出了模式识别技术创新的新挑战、新使命与新机遇,提出了模式识别学科发展的保障措施与政策建议。本书旨在为模式识别学科的健康稳定发展奠定坚实的科学基础,促进模式识别在解决国计民生重大需求方面做出应有的贡献。
本书适合高等学校、科研院所从事模式识别与人工智能等相关方向的学生和科研人员阅读,同时也适合国家学科发展规划和科研项目规划等相关单位的人员阅读。
评论留言