大规模时间序列分析框架的研究与实现,计算机学报

2020 年 7 月 13 日 专知

工业互联时代,每天数以亿计的传感器源源不断生成时间序列,用以记录工业设备的温度、振动、压力、曲度和张力等参数。如何从这些非结构化的时间序列中挖掘出有价值信息,并运用于状态监测、故障诊断和控制决策,引起了广泛的关注和研究。随着数据规模日益增长,能够提供较为完备数据分析算法库的主流单机环境如Matlab、R等,已无法较好地应对大规模时间序列分析场景下的数据处理需求。而现有的并行分析算法数量有限,常与平台相互绑定,更换平台需对算法进行二次开发,可扩展性较差。本文旨在设计一种通用的近似解分析框架,支持第三方算法快速实现并行化,解决因数据规模过大而导致的算法适用性问题。分析框架主要包含任务划分、治理和合并三个步骤。任务划分通过冗余保留了数据的局部相关性,生成相互独立的子任务,减少分布式节点之间的数据通信和同步开销。对于任务划分问题,本文提出了近似解代价模型,得到了最优的任务划分方案。基于Spark平台设计并实现了原型系统,实验结果表明,该系统在确保分析结果准确性的前提下,其加速能力随着并行程度保持近似线性的增长,解决了单机算法的数据规模受限问题。同时,该系统易于集成与扩展,使数据分析人员免于算法重复开发。


地址:

https://kns.cnki.net/kcms/detail/Detail.aspx?dbname=CAPJLAST&filename=JSJX20190711000&v=


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“TSAF” 可以获取《大规模时间序列分析框架的研究与实现,计算机学报》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看获取5000+AI主题知识资源
登录查看更多
2

相关内容

专知会员服务
38+阅读 · 2020年8月14日
鲁棒模式识别研究进展
专知会员服务
40+阅读 · 2020年8月9日
【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
43+阅读 · 2020年7月4日
专知会员服务
107+阅读 · 2020年6月12日
基于深度学习的多标签生成研究进展
专知会员服务
140+阅读 · 2020年4月25日
最新《动态网络嵌入》综述论文,25页pdf
专知
32+阅读 · 2020年6月17日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
Python推荐系统框架:RecQ
专知
12+阅读 · 2019年1月21日
Anomalous Instance Detection in Deep Learning: A Survey
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Deep Learning for Generic Object Detection: A Survey
Arxiv
13+阅读 · 2018年9月6日
Learning to Importance Sample in Primary Sample Space
Arxiv
7+阅读 · 2018年6月1日
Arxiv
7+阅读 · 2018年1月30日
VIP会员
相关论文
Anomalous Instance Detection in Deep Learning: A Survey
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Deep Learning for Generic Object Detection: A Survey
Arxiv
13+阅读 · 2018年9月6日
Learning to Importance Sample in Primary Sample Space
Arxiv
7+阅读 · 2018年6月1日
Arxiv
7+阅读 · 2018年1月30日
Top
微信扫码咨询专知VIP会员