电子科大PhD:基于深度学习的中文唇语识别 | 学术青年分享会

2017 年 10 月 16 日 AI研习社 不灵叔


分享背景

唇语识别,即通过运动的嘴唇,识别其说话内容。通过LSTM模型将CNN抽取出来的图片特征进行时序建模,最后引入Seq2Seq的翻译模型将发音转换成汉子。此次分享,会先简单介绍现有的英文唇语识别的一些工作(《Lip Reading Sentences in the Wild》 和《LipNet: sentence level lipreading》),随后对中文唇语识别展开详细讨论。


《Lip Reading Sentences in the Wild》


论文地址:https://arxiv.org/abs/1611.05358


《LipNet:sentence level lipreading》


论文地址:https://arxiv.org/abs/1611.01599v1



分享主题

基于深度学习的中文唇语识别



分享人简介

戴锡笠电子科技大学计算机系二年级博士生,他的研究方向在于计算机视觉,移动计算,深度学习。曾于海康威视研究院实习,研究内容为基于序列的行人再检索。


分享时间

北京时间10月18日(周三) 20:00 



参与方式

扫描海报二维码,点击底部菜单


如果你觉得活动不错,欢迎点赞并转发本文~

                    

登录查看更多
8

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
基于深度学习的行人重识别研究进展,自动化学报
专知会员服务
38+阅读 · 2019年12月5日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
SFFAI11 报名通知 | 图像分割专题
人工智能前沿讲习班
9+阅读 · 2018年11月26日
SFFAI报名通知 | 神经机器翻译 & 关系抽取
人工智能前沿讲习班
9+阅读 · 2018年10月25日
【回顾】基于深度学习的中文唇语识别
AI研习社
6+阅读 · 2017年10月20日
Arxiv
6+阅读 · 2020年4月14日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
4+阅读 · 2015年8月25日
VIP会员
相关VIP内容
基于深度学习的行人重识别研究进展,自动化学报
专知会员服务
38+阅读 · 2019年12月5日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
Top
微信扫码咨询专知VIP会员