直播 | 搜狗研究员:基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

2017 年 10 月 10 日 AI科技评论 不灵叔


分享主题

Acoustic Modeling Based on LSTM-RNN in ASR

基于LSTM-RNN的语音声学建模技术


分享内容


LSTM-RNN可以对长时序列信息进行建模,广泛应用于语音识别声学模型建模中。此次主要介绍近期LSTM的一些研究进展包括LC-BLSTM,2D-LSTM等。其中LC-BLSTM采用了双向LSTM结构,并在训练和解码时加入了数帧的未来信息来控制延时,解决了普通双向LSTM无法用于实时语音识别的问题;而2D-LSTM在时间和频域两个维度上进行循环,同时保存时间轴与频域轴的序列信息,Google和微软都在大规模语音识别任务上验证了这类2D-LSTM结构的有效性。


以下相关论文可在观看分享会前先预读:


《Improving Latency-Controlled BLSTM Acoustic Models for Online Speech Recognition

论文地址:http://t.cn/R0015sz


《Modeling Time-Frequency Patterns with LSTM vs. Convolutional Architectures for LVCSR Tasks》

论文地址:http://t.cn/R0011cU


《LSTM Time and Frequency Recurrence for Automatic Speech Recognition》

论文地址:http://t.cn/R0O5cJn


《Exploring Multidimensional LSTMS for Large Vocabulary ASR》

论文地址:http://t.cn/R00BxQI


《Reducing the Computational Complexity of Two-Dimensional LSTMs》

论文地址:http://t.cn/R00d0xt



分享人简介


张弼弘,2017年4月毕业于西北工业大学并获得硕士学位。研究方向是语音识别声学建模,深度学习,机器学习。目前就职于搜狗。


分享时间


北京时间10月11日 20:00



参与方式


扫描海报二维码添加社长微信,备注「搜狗


—————  AI 科技评论招人啦!  —————

我们诚招学术编辑 1 名(全职,坐标北京)

你即将从事的工作内容:

  • 报道海内外人工智能相关学术会议,形成具有影响力的报道内容;

  • 采访高校学术青年领袖,输出人工智能领域的深度观点;

  • 跟进国内外学术热点,深入剖析学术动态;

我们希望你是这样的小伙伴:

  • 英语好,有阅读英文科技网站的习惯;

  • 兴趣广,对人工智能有关注及了解;

  • 态度佳,有求知欲,善于学习;

欢迎发送简历到 guoyixin@leiphone.com

————————————————————

登录查看更多
4

相关内容

【ICML2020-华为港科大】RNN和LSTM有长期记忆吗?
专知会员服务
73+阅读 · 2020年6月25日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
34+阅读 · 2020年6月17日
【MIT深度学习课程】深度序列建模,Deep Sequence Modeling
专知会员服务
76+阅读 · 2020年2月3日
知识图谱更新技术研究及其应用,复旦大学硕士论文
专知会员服务
102+阅读 · 2019年11月4日
Interspeech 2019 | 从顶会看语音技术的发展趋势
AI科技评论
16+阅读 · 2019年9月19日
SFFAI 37 报名通知 | 机器翻译专场之同步双向与多语言机器翻译
人工智能前沿讲习班
3+阅读 · 2019年6月25日
猿桌会 | 语音识别技术分享
AI研习社
5+阅读 · 2018年11月14日
公开课 | 强化学习及其在 NLP 上的应用
AI研习社
4+阅读 · 2018年6月14日
专栏 | Bi-LSTM+CRF在文本序列标注中的应用
机器之心
14+阅读 · 2018年1月3日
【回顾】基于深度学习的中文唇语识别
AI研习社
6+阅读 · 2017年10月20日
Arxiv
3+阅读 · 2018年6月19日
Arxiv
6+阅读 · 2018年4月3日
Arxiv
4+阅读 · 2015年8月25日
VIP会员
Top
微信扫码咨询专知VIP会员