Heart rate (HR) is an important physiological signal that reflects the physical and emotional status of a person. Traditional HR measurements usually rely on contact monitors, which may cause inconvenience and discomfort. Recently, some methods have been proposed for remote HR estimation from face videos; however, most of them focus on well-controlled scenarios, their generalization ability into less-constrained scenarios (e.g., with head movement, and bad illumination) are not known. At the same time, lacking large-scale HR databases has limited the use of deep models for remote HR estimation. In this paper, we propose an end-to-end RhythmNet for remote HR estimation from the face. In RyhthmNet, we use a spatial-temporal representation encoding the HR signals from multiple ROI volumes as its input. Then the spatial-temporal representations are fed into a convolutional network for HR estimation. We also take into account the relationship of adjacent HR measurements from a video sequence via Gated Recurrent Unit (GRU) and achieves efficient HR measurement. In addition, we build a large-scale multi-modal HR database (named as VIPL-HR, available at 'http://vipl.ict.ac.cn/view_database.php?id=15'), which contains 2,378 visible light videos (VIS) and 752 near-infrared (NIR) videos of 107 subjects. Our VIPL-HR database contains various variations such as head movements, illumination variations, and acquisition device changes, replicating a less-constrained scenario for HR estimation. The proposed approach outperforms the state-of-the-art methods on both the public-domain and our VIPL-HR databases.


翻译:心率(HR)是一个重要的生理信号,反映了一个人的生理和情感状况。传统的HR测量通常依赖于接触显示器,这可能造成不便和不适。最近,有人提议了一些方法,从脸部视频中进行远程HR估算;然而,大多数方法侧重于控制良好的情景,其概括性能力不为人知,进入不太紧张的情景(如头部移动和照明不良)。与此同时,缺乏大规模HR数据库限制了对远方HR估计的深层模型的使用。在本文中,我们提议建立一个终端至终端RhythmNet,从脸部进行远程HR估算。在RyhthmNet中,我们使用空间时空代表将多个ROI数量中的HR信号编码作为其输入。随后,空间时空表达能力被反馈到一个动态网络,用于人力资源估算。我们还考虑到通过Gederate Complia Unit (GRU) 的视频序列中相邻的HR测量关系,以及实现高效的HR测量。此外,我们还在高层次的HRM-modal HR-al 版本数据库上建立一个大规模多版本版本版本版本,作为 Vireal-lievalal-lieval-lievational-lievational lievational listal listalal listal ladeal 。

0
下载
关闭预览

相关内容

抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
90+阅读 · 2019年10月16日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
计算机视觉领域顶会CVPR 2018 接受论文列表
视频超分辨 Detail-revealing Deep Video Super-resolution 论文笔记
统计学习与视觉计算组
17+阅读 · 2018年3月16日
Arxiv
20+阅读 · 2020年6月8日
Arxiv
5+阅读 · 2018年12月18日
3D-LaneNet: end-to-end 3D multiple lane detection
Arxiv
7+阅读 · 2018年11月26日
Viewpoint Estimation-Insights & Model
Arxiv
3+阅读 · 2018年7月3日
Arxiv
7+阅读 · 2017年12月26日
VIP会员
Top
微信扫码咨询专知VIP会员