Event Camera 作为区域建议网络的应用 (Event Camera as Region Proposal Network) - 专知论文

会员服务 ·

0

事件相机 · 人类视觉 · 检测器 · 事件 · 掩码 ·

2023 年 5 月 1 日

Event Camera as Region Proposal Network

翻译：Event Camera 作为区域建议网络的应用

Shrutarv Awasthi,Anas Gouda,Richard Julian Lodenkaemper,Moritz Roidl

The human eye consists of two types of photoreceptors, rods and cones. Rods are responsible for monochrome vision, and cones for color vision. The number of rods is much higher than the cones, which means that most human vision processing is done in monochrome. An event camera reports the change in pixel intensity and is analogous to rods. Event and color cameras in computer vision are like rods and cones in human vision. Humans can notice objects moving in the peripheral vision (far right and left), but we cannot classify them (think of someone passing by on your far left or far right, this can trigger your attention without knowing who they are). Thus, rods act as a region proposal network (RPN) in human vision. Therefore, an event camera can act as a region proposal network in deep learning Two-stage object detectors in deep learning, such as Mask R-CNN, consist of a backbone for feature extraction and a RPN. Currently, RPN uses the brute force method by trying out all the possible bounding boxes to detect an object. This requires much computation time to generate region proposals making two-stage detectors inconvenient for fast applications. This work replaces the RPN in Mask-RCNN of detectron2 with an event camera for generating proposals for moving objects. Thus, saving time and being computationally less expensive. The proposed approach is faster than the two-stage detectors with comparable accuracy

翻译：人眼由两种光感受器构成，杆细胞和锥细胞。杆细胞负责单色视觉，而锥细胞负责色彩视觉。杆细胞数量比锥细胞多得多，这意味着大多数人类视觉处理都是在单色视觉中完成的。事件相机报告像素强度的变化，类似于杆细胞。事件相机和彩色相机在计算机视觉中相当于人眼的杆细胞和锥细胞。人类可以注意到在周围视野（极右和极左）中移动的物体，但我们无法对其进行分类（想想在您的右侧或左侧经过的人，这可能会触发您的注意力，但不知道他们是谁）。因此，杆细胞在人类视觉中充当区域建议网络（RPN）。因此，事件相机可用作深度学习中的区域建议网络。深度学习中的两阶段物体检测器，如 Mask R-CNN，由特征提取的骨干和 RPN 组成。当前，RPN 使用 brute force 方法来尝试所有可能的边界框以检测对象。这需要大量计算时间来生成区域建议，使得两阶段检测器在快速应用中不方便。本研究将 detectron2 中 Mask-RCNN 的 RPN 替换为事件相机，以生成移动对象的建议，从而节省时间且计算成本较低。所提出的方法比具有可比较准确度的两阶段检测器更快。

0

相关内容

事件相机

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

专知会员服务

21+阅读 · 2022年3月22日

【CVPR2022】 Dropout在图像超分任务中的重煥新生

【CVPR2022】 Dropout在图像超分任务中的重煥新生

专知会员服务

19+阅读 · 2022年3月5日

【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal

【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal

专知会员服务

16+阅读 · 2022年3月3日

Into the Metaverse，93页ppt介绍元宇宙概念、应用、趋势

Into the Metaverse，93页ppt介绍元宇宙概念、应用、趋势

专知会员服务

49+阅读 · 2022年2月19日

NLP必读经典文献100篇

专知会员服务

124+阅读 · 2020年9月8日

【2020新书】自然语言处理Python与spaCy实践，216页pdf，NLP with Python

【2020新书】自然语言处理Python与spaCy实践，216页pdf，NLP with Python

专知会员服务

108+阅读 · 2020年5月1日

AAAI 2020 | 姿态辅助下的多相机协作实现主动目标追踪 Pose-Assisted Multi-Camera Collaboration for Active Object Tracking

AAAI 2020 | 姿态辅助下的多相机协作实现主动目标追踪 Pose-Assisted Multi-Camera Collaboration for Active Object Tracking

专知会员服务

34+阅读 · 2020年3月21日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

CVPR2019 | Stereo R-CNN 3D 目标检测

CVPR2019 | Stereo R-CNN 3D 目标检测

极市平台

27+阅读 · 2019年3月10日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

专知

31+阅读 · 2018年6月4日

【论文推荐】最新五篇信息抽取相关论文—端到端深度模型、调研、聊天机器人、自注意力、科学文本

【论文推荐】最新五篇信息抽取相关论文—端到端深度模型、调研、聊天机器人、自注意力、科学文本

专知

13+阅读 · 2018年4月4日

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

全球人工智能

20+阅读 · 2017年12月17日

Capsule Networks解析

Capsule Networks解析

机器学习研究会

11+阅读 · 2017年11月12日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

【推荐】图像分类必读开创性论文汇总

【推荐】图像分类必读开创性论文汇总

机器学习研究会

14+阅读 · 2017年8月15日

表面增强拉曼旋光（SEROA）光谱研究

国家自然科学基金

0+阅读 · 2014年12月31日

hTERT基因多态性影响动脉粥样硬化形成机制及民族差异性研究

国家自然科学基金

0+阅读 · 2014年12月31日

核酸适配体aptamer原位募集骨髓间充质干细胞在兔胫骨缺损修复中的研究

国家自然科学基金

0+阅读 · 2013年12月31日

有向图及网络的曲面嵌入亏格问题的研究

国家自然科学基金

0+阅读 · 2012年12月31日

社交-推荐网络中的隐式朋友挖掘

国家自然科学基金

2+阅读 · 2012年12月31日

识别核仁素的G-四链体探针的构建与识别机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

新型微结构太赫兹光纤研究

国家自然科学基金

0+阅读 · 2009年12月31日

半互穿网络聚合物纳米粒子改性聚醚砜膜的研究

国家自然科学基金

0+阅读 · 2009年12月31日

TR3相互作用新蛋白机理研究

国家自然科学基金

1+阅读 · 2008年12月31日

超细纳米晶FePt薄膜的L10有序化转变研究

国家自然科学基金

0+阅读 · 2008年12月31日

Few-shot bioacoustic event detection at the DCASE 2023 challenge

Arxiv

0+阅读 · 2023年6月15日

Exploiting Uncertainty for Querying Inconsistent Description Logics Knowledge Bases

Arxiv

0+阅读 · 2023年6月15日

Dynamics and Statistics of Weak Chaos in a 4--D Symplectic Map

Arxiv

0+阅读 · 2023年6月15日

Hyperbolic Convolution via Kernel Point Aggregation

Arxiv

0+阅读 · 2023年6月15日

Fifty Years of ISCA: A data-driven retrospective on key trends

Arxiv

0+阅读 · 2023年6月15日

DiffuDetox: A Mixed Diffusion Model for Text Detoxification

Arxiv

0+阅读 · 2023年6月14日

Deep Neural Network Based Relation Extraction: An Overview

Arxiv

14+阅读 · 2021年1月6日

Knowledge Graph Transfer Network for Few-Shot Recognition

Arxiv

15+阅读 · 2019年11月21日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

Recurrent Residual Convolutional Neural Network based on U-Net (R2U-Net) for Medical Image Segmentation

Arxiv

16+阅读 · 2018年5月10日

VIP会员

文章信息

相关主题

相关VIP内容

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

专知会员服务

21+阅读 · 2022年3月22日

【CVPR2022】 Dropout在图像超分任务中的重煥新生

【CVPR2022】 Dropout在图像超分任务中的重煥新生

专知会员服务

19+阅读 · 2022年3月5日

【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal

【CVPR 2022】基于Tracklet查询和建议的高效视频实例分割，Efficient Video Instance Segmentation via Tracklet Query and Proposal

专知会员服务

16+阅读 · 2022年3月3日

Into the Metaverse，93页ppt介绍元宇宙概念、应用、趋势

Into the Metaverse，93页ppt介绍元宇宙概念、应用、趋势

专知会员服务

49+阅读 · 2022年2月19日

NLP必读经典文献100篇

专知会员服务

124+阅读 · 2020年9月8日

【2020新书】自然语言处理Python与spaCy实践，216页pdf，NLP with Python

【2020新书】自然语言处理Python与spaCy实践，216页pdf，NLP with Python

专知会员服务

108+阅读 · 2020年5月1日

AAAI 2020 | 姿态辅助下的多相机协作实现主动目标追踪 Pose-Assisted Multi-Camera Collaboration for Active Object Tracking

AAAI 2020 | 姿态辅助下的多相机协作实现主动目标追踪 Pose-Assisted Multi-Camera Collaboration for Active Object Tracking

专知会员服务

34+阅读 · 2020年3月21日

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

【论文】深度卷积神经网络的ImageNet分类（ImageNet Classification with Deep Convolutional Neural Networks）

专知会员服务

14+阅读 · 2020年1月1日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

CVPR2019 | Stereo R-CNN 3D 目标检测

CVPR2019 | Stereo R-CNN 3D 目标检测

极市平台

27+阅读 · 2019年3月10日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

【论文推荐】最新四篇CVPR2018 视频描述生成相关论文—双向注意力、Transformer、重构网络、层次强化学习

专知

31+阅读 · 2018年6月4日

【论文推荐】最新五篇信息抽取相关论文—端到端深度模型、调研、聊天机器人、自注意力、科学文本

【论文推荐】最新五篇信息抽取相关论文—端到端深度模型、调研、聊天机器人、自注意力、科学文本

专知

13+阅读 · 2018年4月4日

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

ResNet, AlexNet, VGG, Inception：各种卷积网络架构的理解

全球人工智能

20+阅读 · 2017年12月17日

Capsule Networks解析

Capsule Networks解析

机器学习研究会

11+阅读 · 2017年11月12日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

【推荐】图像分类必读开创性论文汇总

【推荐】图像分类必读开创性论文汇总

机器学习研究会

14+阅读 · 2017年8月15日

相关论文

Few-shot bioacoustic event detection at the DCASE 2023 challenge

Arxiv

0+阅读 · 2023年6月15日

Exploiting Uncertainty for Querying Inconsistent Description Logics Knowledge Bases

Arxiv

0+阅读 · 2023年6月15日

Dynamics and Statistics of Weak Chaos in a 4--D Symplectic Map

Arxiv

0+阅读 · 2023年6月15日

Hyperbolic Convolution via Kernel Point Aggregation

Arxiv

0+阅读 · 2023年6月15日

Fifty Years of ISCA: A data-driven retrospective on key trends

Arxiv

0+阅读 · 2023年6月15日

DiffuDetox: A Mixed Diffusion Model for Text Detoxification

Arxiv

0+阅读 · 2023年6月14日

Deep Neural Network Based Relation Extraction: An Overview

Arxiv

14+阅读 · 2021年1月6日

Knowledge Graph Transfer Network for Few-Shot Recognition

Arxiv

15+阅读 · 2019年11月21日

Cross-Modal Self-Attention Network for Referring Image Segmentation

Cross-Modal Self-Attention Network for Referring Image Segmentation

Arxiv

18+阅读 · 2019年4月9日

Recurrent Residual Convolutional Neural Network based on U-Net (R2U-Net) for Medical Image Segmentation

Arxiv

16+阅读 · 2018年5月10日

相关基金

表面增强拉曼旋光（SEROA）光谱研究

国家自然科学基金

0+阅读 · 2014年12月31日

hTERT基因多态性影响动脉粥样硬化形成机制及民族差异性研究

国家自然科学基金

0+阅读 · 2014年12月31日

核酸适配体aptamer原位募集骨髓间充质干细胞在兔胫骨缺损修复中的研究

国家自然科学基金

0+阅读 · 2013年12月31日

有向图及网络的曲面嵌入亏格问题的研究

国家自然科学基金

0+阅读 · 2012年12月31日

社交-推荐网络中的隐式朋友挖掘

国家自然科学基金

2+阅读 · 2012年12月31日

识别核仁素的G-四链体探针的构建与识别机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

新型微结构太赫兹光纤研究

国家自然科学基金

0+阅读 · 2009年12月31日

半互穿网络聚合物纳米粒子改性聚醚砜膜的研究

国家自然科学基金

0+阅读 · 2009年12月31日

TR3相互作用新蛋白机理研究

国家自然科学基金

1+阅读 · 2008年12月31日

超细纳米晶FePt薄膜的L10有序化转变研究

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员