点击上方“计算机视觉life”,选择“星标”
快速获得最新干货
本文转载自机器之心。
什么是小样本学习?它与弱监督学习等问题有何差异?其核心问题是什么?来自港科大和第四范式的这篇综述论文提供了解答。
数据是机器学习领域的重要资源,在数据缺少的情况下如何训练模型呢?小样本学习是其中一个解决方案。来自香港科技大学和第四范式的研究人员综述了该领域的研究发展,并提出了未来的研究方向。
这篇综述论文已被 ACM Computing Surveys 接收,作者还建立了 GitHub repo,用于更新该领域的发展。
机器学习在数据密集型应用中取得了很大成功,但在面临小数据集的情况下往往捉襟见肘。近期出现的小样本学习(Few-Shot Learning,FSL)方法旨在解决该问题。FSL 利用先验知识,能够快速泛化至仅包含少量具备监督信息的样本的新任务中。
这篇论文对 FSL 方法进行了综述。首先,该论文给出了 FSL 的正式定义,并厘清了它与相关机器学习问题(弱监督学习、不平衡学习、迁移学习和元学习)的关联和差异。然后指出 FSL 的核心问题,即经验风险最小化方法不可靠。
基于各个方法利用先验知识处理核心问题的方式,该研究将 FSL 方法分为三大类:
最后,这篇文章提出了 FSL 的未来研究方向:FSL 问题设置、技术、应用和理论。
我们选取介绍了该综述论文中的部分内容,详情参见原论文。
计算机程序基于与任务 T 相关的经验 E 学习,并得到性能改进(性能度量指标为 P)。
小样本学习是一类机器学习问题,其经验 E 中仅包含有限数量的监督信息。
下图对比了具备充足训练样本和少量训练样本的学习算法:
基于此,该研究将现有的 FSL 方法纳入此框架,得到如下分类体系:
此类 FSL 方法利用先验知识增强数据 D_train,从而扩充监督信息,利用充足数据来实现可靠的经验风险最小化。
如上图所示,根据增强数据的来源,这类 FSL 方法可分为以下三个类别:
基于所用先验知识的类型,这类方法可分为如下四个类别:
根据先验知识对搜索策略的影响,此类方法可分为三个类别:
文章最后从问题设置、技术、应用和理论四个层面探讨了小样本学习领域的未来发展方向。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
投稿、合作也欢迎联系:simiter@126.com
长按关注计算机视觉life
给优秀的自己点个赞