【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频 - 专知VIP

会员服务 ·

15

自监督学习 · 表示学习 · 语音处理 ·

2022 年 9 月 9 日

【李宏毅老师】自监督表示学习语音处理，附89页ppt与视频

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

尽管深度学习模型彻底改变了语音和音频处理领域，但它们迫使为个别任务和应用场景构建专家模型。深度神经模型也会在标记数据有限的方言和语言中遇到瓶颈。

自监督表示学习方法有望提供一个单一的通用模型，使一系列任务和领域受益。他们最近在NLP和计算机视觉领域取得了成功，达到了新的性能水平，同时减少了许多下游场景所需的标签。语音表征学习也有类似的进展，主要有三种类型:生成式、对比式和预测式。其他方法依赖于多模态数据进行训练前的预处理，将文本或视觉数据流与语音混合。虽然自我监督语音表示仍是一个新兴的研究领域，但它与声学词嵌入和零词汇资源学习密切相关**。本教程将介绍自监督语音表征学习方法及其与相关研究领域的联系**。由于目前的许多方法只将自动语音识别作为下游任务，我们将回顾最近对已学习的表示进行基准测试的努力，以扩展这种表示在语音识别之外的应用。本教程的实践部分将提供构建和评估语音表示模型的实际指导。

成为VIP会员查看完整内容

31

相关内容

自监督学习

自监督学习

自监督学习（self-supervised learning）可以被看作是机器学习的一种“理想状态”，模型直接从无标签数据中自行学习，无需标注数据。

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知会员服务

41+阅读 · 2022年9月19日

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知会员服务

63+阅读 · 2022年9月19日

《自监督学习》最新报告，45页ppt

《自监督学习》最新报告，45页ppt

专知会员服务

75+阅读 · 2022年9月14日

Transformer如何用于视频？最新「视频Transformer」2022综述

Transformer如何用于视频？最新「视频Transformer」2022综述

专知会员服务

76+阅读 · 2022年1月20日

【邱锡鹏老师CIPSATT2020教程】自然语言处理中的预训练模型，149页ppt

专知会员服务

105+阅读 · 2020年11月10日

【INTERSPEECH2020】元学习与自然语言处理应用，台大李宏毅老师讲解。附视频与PPT

【INTERSPEECH2020】元学习与自然语言处理应用，台大李宏毅老师讲解。附视频与PPT

专知会员服务

28+阅读 · 2020年11月5日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

【Facebook AI】自监督学习在计算机视觉应用最新概述，108页ppt Self-supervised learning

【Facebook AI】自监督学习在计算机视觉应用最新概述，108页ppt Self-supervised learning

专知会员服务

164+阅读 · 2020年4月19日

【CMU课程：深度学习导论(Spring 2020)】“11-785 Introduction to Deep Learning | Carnegie Mellon University | Spring 2020” by Bhiksha Raj

【CMU课程：深度学习导论(Spring 2020)】“11-785 Introduction to Deep Learning | Carnegie Mellon University | Spring 2020” by Bhiksha Raj

专知会员服务

29+阅读 · 2020年2月3日

【GAN】生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

【GAN】生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

专知会员服务

115+阅读 · 2019年11月26日

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知

1+阅读 · 2022年9月19日

《自监督学习》最新报告，45页ppt

《自监督学习》最新报告，45页ppt

专知

1+阅读 · 2022年9月14日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

专知

1+阅读 · 2022年7月29日

【ICASSP2022教程】高维数据的低维模型:从线性到非线性，凸到非凸，浅到深，429页ppt

【ICASSP2022教程】高维数据的低维模型:从线性到非线性，凸到非凸，浅到深，429页ppt

专知

6+阅读 · 2022年6月12日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师

生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师

GAN生成式对抗网络

34+阅读 · 2019年9月23日

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

新智元

18+阅读 · 2019年9月22日

生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

专知

26+阅读 · 2019年9月21日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知理论的视频编解码技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于多任务稀疏特征学习的海量图像理解方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于稀疏编码的语音特征增强方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于无声语音及肌电信息融合的多功能假肢控制研究

国家自然科学基金

0+阅读 · 2012年12月31日

多端电路功率理论及其在混合补偿系统容量优化中的应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

文本多粒度关系抽取半监督自适应学习的研究

国家自然科学基金

4+阅读 · 2012年12月31日

20(S)-原人参二醇靶向抑制PI3K/Akt信号途径的研究

国家自然科学基金

0+阅读 · 2011年12月31日

新一代汽车中智能语音处理若干关键技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

Sound-Guided Semantic Video Generation

Arxiv

0+阅读 · 2022年10月21日

Learning and Retrieval from Prior Data for Skill-based Imitation Learning

Arxiv

0+阅读 · 2022年10月20日

Learning Relational Causal Models with Cycles through Relational Acyclification

Arxiv

0+阅读 · 2022年10月20日

Robust One-Shot Singing Voice Conversion

Arxiv

0+阅读 · 2022年10月20日

Quick Graph Conversion for Robust Recommendation

Arxiv

0+阅读 · 2022年10月19日

Recent Advances in Natural Language Processing via Large Pre-Trained Language Models: A Survey

Arxiv

31+阅读 · 2021年11月1日

SMORE: Knowledge Graph Completion and Multi-hop Reasoning in Massive Knowledge Graphs

SMORE: Knowledge Graph Completion and Multi-hop Reasoning in Massive Knowledge Graphs

Arxiv

19+阅读 · 2021年10月28日

DOC2PPT: Automatic Presentation Slides Generation from Scientific Documents

Arxiv

14+阅读 · 2021年2月14日

Low-Shot Learning from Imaginary Data

Arxiv

15+阅读 · 2018年4月3日

Zero-Shot Transfer Learning for Event Extraction

Arxiv

10+阅读 · 2017年7月4日

VIP会员

相关主题

自监督学习

相关VIP内容

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知会员服务

41+阅读 · 2022年9月19日

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知会员服务

63+阅读 · 2022年9月19日

《自监督学习》最新报告，45页ppt

《自监督学习》最新报告，45页ppt

专知会员服务

75+阅读 · 2022年9月14日

Transformer如何用于视频？最新「视频Transformer」2022综述

Transformer如何用于视频？最新「视频Transformer」2022综述

专知会员服务

76+阅读 · 2022年1月20日

【邱锡鹏老师CIPSATT2020教程】自然语言处理中的预训练模型，149页ppt

专知会员服务

105+阅读 · 2020年11月10日

【INTERSPEECH2020】元学习与自然语言处理应用，台大李宏毅老师讲解。附视频与PPT

【INTERSPEECH2020】元学习与自然语言处理应用，台大李宏毅老师讲解。附视频与PPT

专知会员服务

28+阅读 · 2020年11月5日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

【Facebook AI】自监督学习在计算机视觉应用最新概述，108页ppt Self-supervised learning

【Facebook AI】自监督学习在计算机视觉应用最新概述，108页ppt Self-supervised learning

专知会员服务

164+阅读 · 2020年4月19日

【CMU课程：深度学习导论(Spring 2020)】“11-785 Introduction to Deep Learning | Carnegie Mellon University | Spring 2020” by Bhiksha Raj

【CMU课程：深度学习导论(Spring 2020)】“11-785 Introduction to Deep Learning | Carnegie Mellon University | Spring 2020” by Bhiksha Raj

专知会员服务

29+阅读 · 2020年2月3日

【GAN】生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

【GAN】生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

专知会员服务

115+阅读 · 2019年11月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军特种作战条令》最新102页

《洛克希德SR-71“黑鸟”侦察机动力系统》21页slides

美空军作战实验室通过人工智能和指挥控制技术创新推进杀伤链

《指挥控制能力分析方法论》最新报告

相关资讯

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

语音如何自监督学习？306页ppt！李宏毅等INTERSPEECH2022《自监督表示学习语音处理》教程，附Slides与视频

专知

1+阅读 · 2022年9月19日

《自监督学习》最新报告，45页ppt

《自监督学习》最新报告，45页ppt

专知

1+阅读 · 2022年9月14日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

【IJCAI2022教程】可微分优化:将结构信息集成到训练流程中，173页ppt

专知

1+阅读 · 2022年7月29日

【ICASSP2022教程】高维数据的低维模型:从线性到非线性，凸到非凸，浅到深，429页ppt

【ICASSP2022教程】高维数据的低维模型:从线性到非线性，凸到非凸，浅到深，429页ppt

专知

6+阅读 · 2022年6月12日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师

生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师

GAN生成式对抗网络

34+阅读 · 2019年9月23日

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

新智元

18+阅读 · 2019年9月22日

生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

生成式对抗网络GAN在语音自然语言处理中的应用，台大李宏毅老师，附247页ppt下载

专知

26+阅读 · 2019年9月21日

相关基金

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知理论的视频编解码技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于多任务稀疏特征学习的海量图像理解方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于稀疏编码的语音特征增强方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于无声语音及肌电信息融合的多功能假肢控制研究

国家自然科学基金

0+阅读 · 2012年12月31日

多端电路功率理论及其在混合补偿系统容量优化中的应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

文本多粒度关系抽取半监督自适应学习的研究

国家自然科学基金

4+阅读 · 2012年12月31日

20(S)-原人参二醇靶向抑制PI3K/Akt信号途径的研究

国家自然科学基金

0+阅读 · 2011年12月31日

新一代汽车中智能语音处理若干关键技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

相关论文

Sound-Guided Semantic Video Generation

Arxiv

0+阅读 · 2022年10月21日

Learning and Retrieval from Prior Data for Skill-based Imitation Learning

Arxiv

0+阅读 · 2022年10月20日

Learning Relational Causal Models with Cycles through Relational Acyclification

Arxiv

0+阅读 · 2022年10月20日

Robust One-Shot Singing Voice Conversion

Arxiv

0+阅读 · 2022年10月20日

Quick Graph Conversion for Robust Recommendation

Arxiv

0+阅读 · 2022年10月19日

Recent Advances in Natural Language Processing via Large Pre-Trained Language Models: A Survey

Arxiv

31+阅读 · 2021年11月1日

SMORE: Knowledge Graph Completion and Multi-hop Reasoning in Massive Knowledge Graphs

SMORE: Knowledge Graph Completion and Multi-hop Reasoning in Massive Knowledge Graphs

Arxiv

19+阅读 · 2021年10月28日

DOC2PPT: Automatic Presentation Slides Generation from Scientific Documents

Arxiv

14+阅读 · 2021年2月14日

Low-Shot Learning from Imaginary Data

Arxiv

15+阅读 · 2018年4月3日

Zero-Shot Transfer Learning for Event Extraction

Arxiv

10+阅读 · 2017年7月4日

微信扫码咨询专知VIP会员