模式识别70年，学科发展报告基础篇

会员服务 ·

模式识别70年，学科发展报告基础篇

2020 年 10 月 23 日 中国图象图形学报

模式识别学科发展报告

第一版

模式识别国家重点实验室撰写

中国科学院学部学科发展战略研究项目成果

报告提炼出

过去50项重要研究进展

未来30项重要研究问题

按照模式识别基础、计算机视觉、语音语言信息处理、模式识别应用技术四个方向分别介绍。

图图今天为大家推荐模式识别学科发展报告的第一个方向，模式识别基础的重要研究进展和未来重要研究问题。

重要研究进展(13项)

贝叶斯决策与估计 ：统计决策的基础理论。

概率密度估计 ：一类重要的无监督学习方法，统计模式识别的重要基础，模式分析的重要工具。

分类器设计 ：模式识别系统实现中最重要的任务，有多种模型设计和学习方法，这里主要介绍监督学习。

聚类：一类重要的无监督学习方法，模式分析的重要工具。

特征提取与学习 ：模式的特征表示对模式分类的性能有决定性影响，如何从数据提取特征、选择特征或学习特征表示是一个重要的研究方向。

人工神经网络与深度学习 ：人工神经网络是一类重要的模式分析和识别方法，发展到深度神经网络形成了目前最成功的深度学习系列方法和研究方向。

核方法与支持向量机 ：以支持向量机为主的核方法在20世纪90年代成为模式识别的一个主流方向，至今仍在模式识别研究和应用中发挥重要作用。

句法结构模式识别 ：基于句法或结构分析的模式识别方法一直以来是与统计模式识别并列的一个重要分支。

概率图模型：概率图模型是一类重要的模式结构分析或结构化预测方法，因为其区别于其他结构模式识别方法的独特性，对其单独介绍。

集成学习 ：集成学习通过融合多个学习器来提升性能，在20世纪80年代以来已有大量研究和应用，形成了系统的理论和系列方法。

半监督学习 ：半监督学习是20世纪90年代以来发展起来的一类可同时利用标记样本和无标记样本的分类器学习方法，至今仍有大量研究。

迁移学习 ：迁移学习利用不同领域或不同分布特性的样本数据来优化分类器模型，受到了广泛重视，发展了一系列模型和方法。

多任务学习：多任务学习利用多个分类或建模任务（包括聚类、回归、数据重构等）的相关性，同时学习多个任务，可提升每个任务的泛化性能，得到了广泛重视和应用。

扩展阅读

模式识别学科发展报告(1)

基础理论与方法研究趋势

面向开放环境感知的模式识别理论与方法。开放环境下所面临的模式情形复杂多变。从同一模式所关联的数据来看，既有海量多模态数据，也有小规模样本数据；各类模式的统计特征或结构特征动态变化，数据类型多样混杂，模式信息不充分和不确定等各种情形。目前，呈现出多源/多模态协同模式分析理论与方法、鲁棒模式识别理论与方法、连续自主学习理论与方法、开放环境感知模式识别方法等研究态势。

非结构化数据模式分析理论与方法。大多数模式数据（如视觉感知数据）均为非结构化数据。建立从非结构化数据输入到结构化输出（如类别、关系等）的模式分析系统一直是多种不同应用行业的共同需求。目前，基于特征自学习的模式分类理论与方法，以深度学习为基准的无监督特征学习理论与方法均是当前的热点研究问题。以端到端为核心思想，构建面向复杂场景的、鲁棒的、环境无约束的非结构化数据模式分析理论与方法是一个主要的发展趋势。

类人/类脑模式表示与学习理论与方法。人脑对非结构化感知数据具有超强的学习和理解能力，具有多模态信息处理、自主学习、实时更新等特点。目前，充分引入人的感知机理，以脑结构、神经形态学、类脑研究的最新成果为引导，研究高效的跨模态非结构化协同学习方法、小规模样本主动可增强自学习、自监督、自演化方法、自主特征学习方法、自动目标感知与识别方法、类脑神经网络结构学习方法，发展类脑模式识别理论与方法已成为模式识别领域的重要课题。构建“能够模拟人脑神经结构的、认知机理的和类人学习的”新型模式表示、学习与识别的理论与方法、强化学习策略等，有望进一步解决非结构化感知数据的高效处理和理解问题。

新型计算构架下的模式识别。目前并行计算、量子计算和DNA计算已经取得了突破。并行计算在模式识别算法改进中得到广泛应用。在DNA计算框架下，通过生化处理技术解决复杂模式分析与学习任务已得到开展。在新型计算框架下发展新型模式识别理论是一个新的趋势。

未来重要研究进展(10项)

面向模式识别的认知机理与计算模型 ：如何模拟人类的认知机理，并从可表示、可嵌入的角度建立计算模型，提升模式识别的性能。

理想贝叶斯分类器逼近 ：突破有限样本、模式统计、结构特性动态变化等情形下模式识别决策新理论，并面向开放环境模式识别任务构建新的技术范式。

基于不充分信息的模式识别 ：面对“标记信息不充分”、“数据关系不明”、“目标类信息不充分”等典型应用情形，如何提升模式描述与分类能力。

开放环境下的自主进化学习 ：如何解决开放环境下现有模式识别方法与系统所面临的鲁棒性低、自适应能力差、多模态数据应用不充分和模态维度不平衡等难题。

知识嵌入的模式识别 ：如何在传统模式识别方法和新的理论与方法中对知识进行表示、嵌入和应用。

交互式学习的理论模型与方法 ：如何建立“交互式学习、人机协同混合、人在回路”与模式识别理论与方法的融合范式，提升模式识别系统的泛化能力。

可解释性深度模型 ：如何从理论上解释深度模型的有用性，并为构建新型模型提供理论指导。

新型计算架构下的模式识别 ：如何突破现有冯诺依曼计算机体系结构下的模式识别算法体系，构建诸如量子计算、DNA计算等新型计算构架下的模式识别理论与方法体系。

模式结构解释和结构模型学习：如何建立高效的元学习方法和新型结构模式描述与结构学习方法，提升模型的泛化能力、环境与任务自适应能力。

安全强化的模式识别理论与方法。如何提升模式识别方法的可对抗性和可抗侵入性，提升模式识别系统的安全性能。

扩展阅读

模式识别学科发展报告(2)

模式识别70年学科背景

自20世纪50年代以来，模式识别已发展成为一个学科(Discipline)或研究领域(Field of study)。O.G. Selfridge在1957年一个会议上从计算机科学角度给出了一个定义：Pattern recognition is the extraction of the significant features from a background of irrelevant detail（模式识别是从无关细节的背景中提取有意义特征的过程）。King Sun Fu（傅京孙）在1982年出版的《Applications of Pattern Recognition》编著第一章说The problem of pattern recognition usually denotes classification and/or description of a set of processes or events. The set of processes or events to be classified could be a set of physical objects or a set of more abstract ones such mental states. The processes or events with some similar properties are grouped into a class.（模式识别问题是指对过程或事件的分类和/或描述。过程或事件可以是物理上的物体或抽象的事件如精神状态。具有相似特点的过程或事件组成类别）。这个定义对模式识别的技术（分类、描述）和模式、类别都表达的非常明确。

综合模式识别认知、功能作用和计算原理等方面的特点，我们可以给出一个更加全面的定义：模式识别学科研究如何使机器（包括计算机）模拟人的感知功能，从环境感知数据中检测、识别和理解目标、行为、事件等模式。同时定义模式为数据中具有一定特点的目标、行为或事件，具有相似特点的模式组成类别(class, category)。单个模式又称为样本(sample)或样例(instance)。

20世纪50年代是计算机模式识别正式登场的时期。1957年C.K. Chow发表的用于文字识别的统计决策方法是典型的统计模式识别方法，该文献给出了贝叶斯决策（包括最小风险决策、最大后验概率决策、带拒识的最小风险决策）的基本框架。早期的一些代表性工作或重要事件还包括：1957年Rosenblatt研制的感知机(Perceptron)；1965年N.L. Nilsson发表的关于学习机器的著作（里面主要内容是模式分类）；1966年第一个以模式识别为主题的研讨会；1968年发表的模式识别研究综述；1968年国际期刊Pattern Recognition创刊；Fukunaga和Duda & Hart分别于1972年和1973年发表的模式识别经典教材。70年代是模式识别研究快速发展的一个时期，傅京孙提出句法模式识别方法并形成了理论方法体系。

模式识别的国际组织在上世纪70年代正式成立。根据国际模式识别协会（IAPR）历史介绍，第一届国际模式识别联合大会（IJCPR，1980年以后改名为ICPR）于1973年召开，第二届在1974年召开，以后每两年举办一次。IAPR于1974年IJCPR期间开始筹建，1976年IJCPR期间召开了第一次执委会会议，1977年开始接受会员申请，在1978年IJCPR期间召开了第一次Governing Board（主席团）会议，宣告IAPR正式成立。

20世纪80年代，模式识别方法发展的最大亮点是多层神经网络的引入。1986年Rumelhart等人发表了误差反向传播(Back-propogation, BP)算法（其实Paul Werbos在其1974年的博士论文中描述了BP算法，没有引起太多注意）。BP算法使多层神经网络作为模式分类器具有自学习能力，其隐层神经元具有特征提取功能，因而迅速成为一种主流的模式识别方法。卷积神经网络首先在1990年提出。支持向量机于1995年出现，由于其克服了多层神经网络训练的局部极值问题，具有更好的泛化性能，逐渐成为新的主流方法。

90年代到21世纪初，模式识别和机器学习（模式分类器设计是一个学习问题，因此大多机器学习研究面向模式识别）领域多种新的方法兴起，典型的有多分类器系统（早期工作出现在1990年，后来发展成为集成学习方向）。在模式识别中发挥重要作用的半监督学习、多标签学习、多任务学习、迁移学习和领域自适应（与领域自适应类似的分类器自适应早在上世纪60年代就已经有尝试）、以马尔科夫随机场和条件随机场为典型代表的概率图模型等均兴起于这个时期。

2006年以后，深度学习（深度神经网络方法）逐渐成为主流，并陆续在多数模式识别应用任务中大幅超越传统模式识别方法（基于人工特征提取的分类方法）的性能。深度学习的方法最早发表在2006年，后来陆续提出了一系列改进训练收敛性和泛化性能的深度神经网络模型和训练算法，包括不同的训练方法或正则化方法、不同的卷积神经网络结构、循环神经网络、self-attention网络、图卷积网络等。2012年深度卷积神经网络在大规模图像分类竞赛Imagenet中取得巨大成功，从此推动深度学习的研究和应用进入高潮。深度学习的优越性能从视觉领域延伸到自然语言处理领域，开始在机器翻译、阅读理解、自动问答等语言理解任务中大幅超越基于统计语言模型的方法。

目前，深度学习方法仍然在模式识别和人工智能领域占据统治地位。但是随着研究的深入和应用的扩展，深度学习方法的不足也越来越凸显，如小样本泛化能力不足、可解释性不足、鲁棒性（稳定性）差、语义理解和结构理解能力弱，连续学习中遗忘严重，等等。针对这些缺陷学术界在不断探索新的模型（包括与知识规则和传统模式识别方法的结合）和学习算法等，研究和应用都还在不断向前发展。比如，面向开放环境的鲁棒模式识别、可解释性神经网络、面向小样本学习和可解释性的模块化神经网络、结合感知和符号推理的模型、自监督学习、连续学习（又称终生学习）等。

模式识别和人工智能不同分支领域（机器学习、计算机视觉、自然语言处理、数据挖掘等）高度交叉。模式识别中的分类、聚类等问题也是机器学习的主要研究内容。机器学习领域把Nilsson（1965年）和Duda & Hart（1973年）的早期著作当作是机器学习的代表作，这两本书其实主要是关于模式识别的。Bishop在他2006年出版的《Pattern Recognition and Machine Learning》一书前言中说：Pattern recognition has its origins in engineering, whereas machine learning grew out of computer science. However, these activities can be viewed as two facets of the same field.（模式识别来源于工程，机器学出生长于计算机科学。两者可以看作是同一个领域的两个面）。傅京孙在1971年出版一本编著名称也叫Pattern Recognition and Machine Learning。机器学习作为一个研究领域，出现比较晚一些。1980年代才有以Machine Learning为题的专著和大会（ICML第一届在1980年）。

计算机视觉的主要研究内容是图像、视频的分析、识别与理解，与模式识别也是高度交叉的，尤其目标和行为识别是典型的模式识别问题，因此计算机视觉中大量使用模式识别的理论和方法（如分类和学习方法）。1973年《Pattern Classification and Scene Analysis》中的Scene Analysis是典型的计算机视觉的工作。70年代以来IJCPR（1980年改名ICPR）会议中都有大量的图像处理与分析的论文。一般认为，David Marr于1982年出版的专著《Vision》标志着计算机视觉领域正式形成。计算机视觉领域的典型活动计算机视觉与模式识别大会(CVPR)开始于1983年，国际计算机视觉大会(ICCV)开始于1987年。在这些会议中，传统模式识别领域中的一般图像分析与识别（包括形状分析、目标识别、文档图像分析和文字识别）甚至一般分类器学习的工作也开始大量出现。

模式识别与机器学习、计算机视觉、语言处理、数据挖掘等领域的高度重叠和交叉说明学科领域是随着历史不断分化和融合的。目前这些相关领域互相学习借鉴、相互促进，未来会结合更加紧密。

报告内容组织

2018-2019年，模式识别国家重点实验室承担了中国科学院学部学科发展战略研究项目“模式识别发展战略研究”。鉴于过去60多年模式识别的理论方法和应用都产生了巨大进展，而在通信、传感和计算软硬件技术不断发展、应用场景渐趋复杂开放的新形势下，又面临很多新的理论和技术问题，本项目希望对模式识别领域的发展历史进行全面梳理，整理出至今在学术届或应用中产生了重大影响的主要研究进展，并且面向未来，提炼出具有重要理论价值或应用需求的值得研究的问题，供模式识别学术界参考，以期对未来基础研究和应用研究产生指导，产出具有重大理论价值或应用价值的研究成果。

实验室邀请国内本领域科研一线的研究者进行了多轮研讨交流，并经实验室内几十名研究人员撰写整理，提炼出模式识别领域过去50项重要研究进展和未来30项重要研究问题，分模式识别基础、计算机视觉、语音语言信息处理、模式识别应用技术四个方向分别介绍。模式识别基础理论和方法是研究的核心，主要研究内容包括分类决策基础理论、多种分类器设计和学习方法、特征学习、聚类分析等。计算机视觉是机器感知中最重要的部分（人和机器从环境获得信息的最大通道是视觉感知），视觉感知数据是模式识别处理的最重要的对象。主要研究内容包括图像处理与分割、图像增强与复原、三维视觉、场景分析、目标检测与识别、行为识别等。语言信息(包括语音和文本信息)是一类重要的模式信息，语言信息处理是模式识别和机器感知的一种重要形式，自然语言处理（文本理解）发展出了自己的理论方法体系，当前与听觉和视觉感知的交叉日趋紧密，且与模式识别和机器学习的方法越来越近。模式识别技术在社会生活中应用非常广泛，本报告不介绍那些单纯应用模式识别技术的场景或技术，而是选择性地介绍跟模式识别理论方法研究结合紧密（比如针对/结合应用场景研究模式识别方法和技术）的应用问题，如生物特征识别、遥感图像分析、医学图像分析、文档图像分析和文字识别、多媒体计算等。

模式识别国家重点实验室简介

模式识别国家重点实验室筹建于1984年，1987年8月正式对外开放，同年12月通过国家验收，是由国家计委投资筹建的第一批国家重点实验室之一。实验室依托于中国科学院自动化研究所，第一任主任是马颂德研究员，第二任主任是谭铁牛院士，现任主任是刘成林研究员。

实验室以模式识别基础理论、图像处理与计算机视觉以及语音语言信息处理为主要研究方向，研究人类模式识别的机理以及有效的计算方法，为开发智能系统提供关键技术，为探求人类智力的本质提供科学依据。实验室的定位和目标是“面向国际学科前沿，面向国家战略需求，面向国民经济主战场，开展模式识别领域的基础和应用基础研究，建设国际一流的科研团队，打造具有广泛影响力的模式识别领域国家公共研究平台，使其成为国内外著名的科学研究、技术创新和人才培养基地，推动和引领模式识别学科的发展，为我国信息技术等战略新兴产业发展提供知识、技术与人才储备”。

实验室首页： http://www.nlpr.ia.ac.cn/cn/

本文得到模式识别国家重点实验室（公众号: 模式识别国家重点实验室）授权发布

END

扫码加入图图社区，优享最新资讯

"图图Seminar" 学术直播

回放平台：

知网在线教学服务平台：

http://k.cnki.net/Room/Home/Index/181822

B站：

https://space.bilibili.com/27032291

往期目录：

汪荣贵——机器学习基本知识体系与入门方法

陈强——从Cell封面论文谈AI研究中的实验数据问题

石争浩——从先验到深度：低见度图像增强

行知论坛——南理工行知论坛&图图Seminar：智能画质增强专题

孙显——遥感图像智能分析：方法与应用

章国锋——视觉SLAM在AR应用上的关键性问题探讨

林宙辰——机器学习中优化算法前沿简介

白相志，冯朝路——“医学图像与人工智能”主题论坛

李雷达——以人为中心的图像感知评价：从质量到美学

汪荣贵——深度强化学习系列课程1-4讲

张明敏，郭诗辉——“人工智能与虚拟现实”主题论坛

高连如——高光谱遥感图像处理与信息提取

杨扬——“出身决定论”？看科研之路如何逆袭！

本文系《中国图象图形学报》独家稿件

内容仅供学习交流

版权属于原作者

欢迎大家关注转发！

编辑：韩小荷

指导：梧桐君

审校：夏薇薇

总编辑：肖亮

声明

欢迎转发本号原创内容，任何形式的媒体或机构未经授权，不得转载和摘编。授权请在后台留言“机构名称+文章标题+转载/转发”联系本号。转载需标注原作者和信息来源为《中国图象图形学报》。本号转载信息旨在传播交流，内容为作者观点，不代表本号立场。未经允许，请勿二次转载。如涉及文字、图片等内容、版权和其他问题，请于文章发出20日内联系本号，我们将第一时间处理。《中国图象图形学报》拥有最终解释权。

尾巴.png

我就知道你“在看”

登录查看更多

相关内容

模式识别

关注 5

模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读，把环境与客体统称为“模式”。随着计算机技术的发展，人类有可能研究复杂的信息处理过程，其过程的一个重要形式是生命体对环境及客体的识别。模式识别以图像处理与计算机视觉、语音语言信息处理、脑网络组、类脑智能等为主要研究方向，研究人类模式识别的机理以及有效的计算方法

最新《机器学习数学基础》书册，109页pdf

专知会员服务

80+阅读 · 2021年2月7日

《人工智能发展报告2020》,清华人工智能研究院等，235页pdf

专知会员服务

218+阅读 · 2021年1月21日

卷积神经网络模型发展及应用(中文版)，20页pdf

专知会员服务

89+阅读 · 2021年1月15日

机器视觉技术研究进展及展望

专知会员服务

106+阅读 · 2020年11月27日