LargeSHS：一个大规模音乐改编数据集 (LargeSHS: A large-scale dataset of music adaptation) - 专知论文

会员服务 ·

0

音乐 · 数据集 · 包含 · 大规模数据 · 元数据 ·

LargeSHS: A large-scale dataset of music adaptation

翻译：LargeSHS：一个大规模音乐改编数据集

Chih-Pin Tan,Hsuan-Kai Kao,Li Su,Yi-Hsuan Yang

from arxiv, arXiv admin note: This version has been removed by arXiv administrators as the submitter did not have the right to agree to the license at the time of submission

Recent advances in AI-based music generation have focused heavily on text-conditioned models, with less attention given to reference-based generation such as song adaptation. To support this line of research, we introduce LargeSHS, a large-scale dataset derived from SecondHandSongs, containing over 1.7 million metadata entries and approximately 900k publicly accessible audio links. Unlike existing datasets, LargeSHS includes structured adaptation relationships between musical works, enabling the construction of adaptation trees and performance clusters that represent cover song families. We provide comprehensive statistics and comparisons with existing datasets, highlighting the unique scale and richness of LargeSHS. This dataset paves the way for new research in cover song generation, reference-based music generation, and adaptation-aware MIR tasks.

翻译：近期基于人工智能的音乐生成研究主要集中于文本条件模型，而对基于参考的生成（如歌曲改编）关注较少。为支持这一研究方向，我们引入了LargeSHS——一个源自SecondHandSongs的大规模数据集，包含超过170万条元数据条目及约90万个可公开访问的音频链接。与现有数据集不同，LargeSHS包含音乐作品间的结构化改编关系，能够构建代表翻唱歌曲家族的改编树和表演聚类。我们提供了全面的统计数据及与现有数据集的对比，突显了LargeSHS在规模和丰富性上的独特优势。该数据集为翻唱歌曲生成、基于参考的音乐生成及改编感知的音乐信息检索任务开辟了新的研究路径。

0

相关内容

音乐，广义而言，指精心组织声音，并将其排布在时间和空间上的艺术类型。

CMNEE：基于开源中国军事新闻的大规模文档级事件抽取数据集

CMNEE：基于开源中国军事新闻的大规模文档级事件抽取数据集

专知会员服务

46+阅读 · 2024年6月2日

RAG 与 LLMs 的结合 - 迈向检索增强的大型语言模型综述

RAG 与 LLMs 的结合 - 迈向检索增强的大型语言模型综述

专知会员服务

99+阅读 · 2024年5月13日

【NeuralPS2023】Quilt-1M:组织病理学的一百万张图像-文本对

【NeuralPS2023】Quilt-1M:组织病理学的一百万张图像-文本对

专知会员服务

19+阅读 · 2023年10月4日

【Meta AI】多模态理解研究进展，Advances in multimodal understanding research at Meta AI

【Meta AI】多模态理解研究进展，Advances in multimodal understanding research at Meta AI

专知会员服务

68+阅读 · 2022年3月20日

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

专知会员服务

28+阅读 · 2019年11月8日

ICLR'21 | GNN联邦学习的新基准

ICLR'21 | GNN联邦学习的新基准

图与推荐

12+阅读 · 2021年11月15日

深度学习图像检索(CBIR): 十年之大综述

深度学习图像检索(CBIR): 十年之大综述

专知

66+阅读 · 2020年12月5日

【NLP】万字长文概述NLP中的深度学习技术

【NLP】万字长文概述NLP中的深度学习技术

产业智能官

18+阅读 · 2019年7月7日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

29+阅读 · 2018年9月14日

Facebook开源MUSE：多语言无监督和监督词向量库

Facebook开源MUSE：多语言无监督和监督词向量库

论智

20+阅读 · 2017年12月23日

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

基于表达水平、剪切机制、序列和结构的动物非编码RNA保守性与进化的系统分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

SHVC质量可伸缩视频编码的快速算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

语义关联的地理视频数据自适应组织方法

国家自然科学基金

1+阅读 · 2014年12月31日

ModelTables: A Corpus of Tables about Models

Arxiv

0+阅读 · 12月18日

Spoken DialogSum: An Emotion-Rich Conversational Dataset for Spoken Dialogue Summarization

Arxiv

0+阅读 · 12月17日

MCPZoo: A Large-Scale Dataset of Runnable Model Context Protocol Servers for AI Agent

Arxiv

0+阅读 · 12月17日

CASTELLA: Long Audio Dataset with Captions and Temporal Boundaries

Arxiv

0+阅读 · 11月19日

CC30k: A Citation Contexts Dataset for Reproducibility-Oriented Sentiment Analysis

Arxiv

0+阅读 · 11月11日

VIP会员

文章信息

相关主题

大规模数据

相关VIP内容

CMNEE：基于开源中国军事新闻的大规模文档级事件抽取数据集

CMNEE：基于开源中国军事新闻的大规模文档级事件抽取数据集

专知会员服务

46+阅读 · 2024年6月2日

RAG 与 LLMs 的结合 - 迈向检索增强的大型语言模型综述

RAG 与 LLMs 的结合 - 迈向检索增强的大型语言模型综述

专知会员服务

99+阅读 · 2024年5月13日

【NeuralPS2023】Quilt-1M:组织病理学的一百万张图像-文本对

【NeuralPS2023】Quilt-1M:组织病理学的一百万张图像-文本对

专知会员服务

19+阅读 · 2023年10月4日

【Meta AI】多模态理解研究进展，Advances in multimodal understanding research at Meta AI

【Meta AI】多模态理解研究进展，Advances in multimodal understanding research at Meta AI

专知会员服务

68+阅读 · 2022年3月20日

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

专知会员服务

28+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

ICLR'21 | GNN联邦学习的新基准

ICLR'21 | GNN联邦学习的新基准

图与推荐

12+阅读 · 2021年11月15日

深度学习图像检索(CBIR): 十年之大综述

深度学习图像检索(CBIR): 十年之大综述

专知

66+阅读 · 2020年12月5日

【NLP】万字长文概述NLP中的深度学习技术

【NLP】万字长文概述NLP中的深度学习技术

产业智能官

18+阅读 · 2019年7月7日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

29+阅读 · 2018年9月14日

Facebook开源MUSE：多语言无监督和监督词向量库

Facebook开源MUSE：多语言无监督和监督词向量库

论智

20+阅读 · 2017年12月23日

相关论文

ModelTables: A Corpus of Tables about Models

Arxiv

0+阅读 · 12月18日

Spoken DialogSum: An Emotion-Rich Conversational Dataset for Spoken Dialogue Summarization

Arxiv

0+阅读 · 12月17日

MCPZoo: A Large-Scale Dataset of Runnable Model Context Protocol Servers for AI Agent

Arxiv

0+阅读 · 12月17日

CASTELLA: Long Audio Dataset with Captions and Temporal Boundaries

Arxiv

0+阅读 · 11月19日

CC30k: A Citation Contexts Dataset for Reproducibility-Oriented Sentiment Analysis

Arxiv

0+阅读 · 11月11日

相关基金

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

基于表达水平、剪切机制、序列和结构的动物非编码RNA保守性与进化的系统分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

SHVC质量可伸缩视频编码的快速算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

语义关联的地理视频数据自适应组织方法

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员