【直播】搜狗研究员:基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

2017 年 10 月 9 日 AI研习社 不灵叔


分享主题


Acoustic Modeling Based on LSTM-RNN in ASR


基于LSTM-RNN的语音声学建模技术



分享内容


LSTM-RNN可以对长时序列信息进行建模,广泛应用于语音识别声学模型建模中。此次主要介绍近期LSTM的一些研究进展包括LC-BLSTM,2D-LSTM等。其中LC-BLSTM采用了双向LSTM结构,并在训练和解码时加入了数帧的未来信息来控制延时,解决了普通双向LSTM无法用于实时语音识别的问题;而2D-LSTM在时间和频域两个维度上进行循环,同时保存时间轴与频域轴的序列信息,Google和微软都在大规模语音识别任务上验证了这类2D-LSTM结构的有效性。


以下相关论文可在观看分享会前先预读:


《Improving Latency-Controlled BLSTM Acoustic Models for Online Speech Recognition

论文地址:http://t.cn/R0015sz


《Modeling Time-Frequency Patterns with LSTM vs. Convolutional Architectures for LVCSR Tasks》

论文地址:http://t.cn/R0011cU


《LSTM Time and Frequency Recurrence for Automatic Speech Recognition》

论文地址:http://t.cn/R0O5cJn


《Exploring Multidimensional LSTMS for Large Vocabulary ASR》

论文地址:http://t.cn/R00BxQI


《Reducing the Computational Complexity of Two-Dimensional LSTMs》

论文地址:http://t.cn/R00d0xt



分享人简介


张弼弘,2017年4月毕业于西北工业大学并获得硕士学位。研究方向是语音识别声学建模,深度学习,机器学习。目前就职于搜狗。



分享时间


北京时间10月11日 20:00



参与方式


扫描海报二维码添加社长微信,备注「搜狗



如果你觉得活动不错,欢迎点赞并转发本文~

                    

登录查看更多
3

相关内容

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗?
专知会员服务
73+阅读 · 2020年6月25日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
34+阅读 · 2020年6月17日
【MIT深度学习课程】深度序列建模,Deep Sequence Modeling
专知会员服务
75+阅读 · 2020年2月3日
知识图谱更新技术研究及其应用,复旦大学硕士论文
专知会员服务
101+阅读 · 2019年11月4日
Interspeech 2019 | 从顶会看语音技术的发展趋势
AI科技评论
16+阅读 · 2019年9月19日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
猿桌会 | 语音识别技术分享
AI研习社
5+阅读 · 2018年11月14日
干货|从LSTM到Seq2Seq
全球人工智能
15+阅读 · 2018年1月9日
【回顾】基于深度学习的中文唇语识别
AI研习社
6+阅读 · 2017年10月20日
Hierarchy Parsing for Image Captioning
Arxiv
6+阅读 · 2019年9月10日
Arxiv
3+阅读 · 2018年6月19日
VIP会员
相关资讯
Interspeech 2019 | 从顶会看语音技术的发展趋势
AI科技评论
16+阅读 · 2019年9月19日
SFFAI 31 报名通知 | 情感语音识别与合成
人工智能前沿讲习班
17+阅读 · 2019年5月30日
猿桌会 | 语音识别技术分享
AI研习社
5+阅读 · 2018年11月14日
干货|从LSTM到Seq2Seq
全球人工智能
15+阅读 · 2018年1月9日
【回顾】基于深度学习的中文唇语识别
AI研习社
6+阅读 · 2017年10月20日
Top
微信扫码咨询专知VIP会员