时间序列分析(Time Series Analysis, TSA)的基础模型近年来备受关注。然而,训练数据的稀缺性与不平衡性仍然严重制约了其发展。受复杂动态系统理论的启发,我们设计了一种序列-符号数据生成机制,能够无限制地生成高质量的时间序列数据及其对应的符号表达。 为充分利用这种具有强相关性的序列-符号数据对,我们提出了 SymTime ——一种利用符号信息增强时间序列表征的预训练基础模型。SymTime 在与下游任务进行微调后,在五个主要时间序列分析任务上均表现出有竞争力的性能,可与基于真实世界数据集预训练的基础模型相媲美。 这一方法突显了序列-符号数据生成与预训练机制在缓解数据稀缺问题、提升任务性能方面的巨大潜力。 项目代码已在 GitHub 开源:https://github.com/wwhenxuan/SymTime。