本课程以计算机科学的方式介绍自动语音识别,以及正确转录语音的问题。描述包括创建大规模语音识别系统的基本算法。所提出的算法和技术目前已在大多数研究和工业系统中得到应用。

目前在自然语言处理、计算生物学和机器学习的其他应用领域中使用的许多学习和搜索算法和技术,最初都是为解决语音识别问题而设计的。语音识别继续给计算机科学带来挑战性的问题,特别是因为它产生的学习和搜索问题的规模。

因此,本课程的目的不仅仅是让学生熟悉语音识别中使用的特定算法,而是以此为基础来探索一般的文本和语音,以及与计算机科学其他领域相关的机器学习算法。本课程将利用几个软件库,并将研究这一领域的最新研究和出版物。

目录内容:

  • Lecture 01: introduction to speech recognition, statistical formulation.
  • Lecture 02: finite automata and transducers.
  • Lecture 03: weighted transducer algorithms.
  • Lecture 04: weighted transducer software library.
  • Lecture 05: n-gram language models.
  • Lecture 06: language modeling software library.
  • Lecture 07: maximum entropy (Maxent) models.
  • Lecture 08: expectation-maximization (EM) algorithm, hidden Markov models (HMMs).
  • Lecture 09: acoustic models, Gaussian mixture models.
  • Lecture 10: pronunciation models, decision trees, context-dependent models.
  • Lecture 11: search algorithms, transducer optimizations, Viterbi decoder.
  • Lecture 12: n-best algorithms, lattice generation, rescoring.
  • Lecture 13: discriminative training (invited lecture: Murat Saraclar).
  • Lecture 14: structured prediction algorithms.
  • Lecture 15: adaptation.
  • Lecture 16: active learning.
  • Lecture 17: semi-supervised learning.

https://cs.nyu.edu/~mohri/asr12/

成为VIP会员查看完整内容
43

相关内容

语音识别是计算机科学和计算语言学的一个跨学科子领域,它发展了一些方法和技术,使计算机可以将口语识别和翻译成文本。 它也被称为自动语音识别(ASR),计算机语音识别或语音转文本(STT)。它整合了计算机科学,语言学和计算机工程领域的知识和研究。
霍普金斯《操作系统原理》2020课程,不可错过!
专知会员服务
35+阅读 · 2020年10月27日
不可错过!CMU《深度学习导论》2020课程,附课件与视频
专知会员服务
79+阅读 · 2020年10月27日
佐治亚理工2020《数据库系统实现》课程,不可错过!
专知会员服务
23+阅读 · 2020年10月14日
专知会员服务
53+阅读 · 2020年10月11日
专知会员服务
51+阅读 · 2020年9月7日
使用RNN-Transducer进行语音识别建模【附PPT与视频资料】
人工智能前沿讲习班
74+阅读 · 2019年1月29日
Python语音识别终极指北,没错,就是指北!
机器学习算法与Python学习
6+阅读 · 2018年4月19日
python语音识别终极指南
AI100
13+阅读 · 2018年4月5日
深度神经网络机器翻译
机器学习研究会
5+阅读 · 2017年10月16日
端对端的深度卷积神经网络在语音识别中的应用
深度学习每日摘要
6+阅读 · 2017年7月18日
Arxiv
0+阅读 · 2020年12月3日
Arxiv
1+阅读 · 2020年12月3日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
VIP会员
相关资讯
使用RNN-Transducer进行语音识别建模【附PPT与视频资料】
人工智能前沿讲习班
74+阅读 · 2019年1月29日
Python语音识别终极指北,没错,就是指北!
机器学习算法与Python学习
6+阅读 · 2018年4月19日
python语音识别终极指南
AI100
13+阅读 · 2018年4月5日
深度神经网络机器翻译
机器学习研究会
5+阅读 · 2017年10月16日
端对端的深度卷积神经网络在语音识别中的应用
深度学习每日摘要
6+阅读 · 2017年7月18日
微信扫码咨询专知VIP会员