Recent advances in AI-based music generation have focused heavily on text-conditioned models, with less attention given to reference-based generation such as song adaptation. To support this line of research, we introduce LargeSHS, a large-scale dataset derived from SecondHandSongs, containing over 1.7 million metadata entries and approximately 900k publicly accessible audio links. Unlike existing datasets, LargeSHS includes structured adaptation relationships between musical works, enabling the construction of adaptation trees and performance clusters that represent cover song families. We provide comprehensive statistics and comparisons with existing datasets, highlighting the unique scale and richness of LargeSHS. This dataset paves the way for new research in cover song generation, reference-based music generation, and adaptation-aware MIR tasks.


翻译:近期基于人工智能的音乐生成研究主要集中于文本条件模型,而对基于参考的生成(如歌曲改编)关注较少。为支持这一研究方向,我们引入了LargeSHS——一个源自SecondHandSongs的大规模数据集,包含超过170万条元数据条目及约90万个可公开访问的音频链接。与现有数据集不同,LargeSHS包含音乐作品间的结构化改编关系,能够构建代表翻唱歌曲家族的改编树和表演聚类。我们提供了全面的统计数据及与现有数据集的对比,突显了LargeSHS在规模和丰富性上的独特优势。该数据集为翻唱歌曲生成、基于参考的音乐生成及改编感知的音乐信息检索任务开辟了新的研究路径。

0
下载
关闭预览

相关内容

音乐,广义而言,指精心组织声音,并将其排布在时间和空间上的艺术类型。
RAG 与 LLMs 的结合 - 迈向检索增强的大型语言模型综述
专知会员服务
99+阅读 · 2024年5月13日
【NeuralPS2023】Quilt-1M:组织病理学的一百万张图像-文本对
专知会员服务
19+阅读 · 2023年10月4日
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
深度学习图像检索(CBIR): 十年之大综述
专知
66+阅读 · 2020年12月5日
【NLP】万字长文概述NLP中的深度学习技术
产业智能官
18+阅读 · 2019年7月7日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关资讯
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
深度学习图像检索(CBIR): 十年之大综述
专知
66+阅读 · 2020年12月5日
【NLP】万字长文概述NLP中的深度学习技术
产业智能官
18+阅读 · 2019年7月7日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员