机器学习能帮助数据库系统突破性能瓶颈吗?

2019 年 9 月 17 日 计算机研究与发展

机器学习化数据库系统研究综述


机器学习和数据库作为两种截然不同的技术呈现出不断结合的趋势。一方面来说,个人和企业的业务场景表现出对机器学习技术日益迫切的需求,其趋势表现在各类机器学习平台的快速发展,但机器学习的专业性很强,要充分发挥其作用,需要大量资金和训练有素的工程团队。事实上,在机器学习系统中,真正的机器学习代码只占很小一部分,大部分工作都消耗在环境配置、参数调优等工作上。机器学习系统设计是可以从传统数据库研究中获取新灵感的,如何实现机器学习算法如SQL般易用和具备可解释性是面临的新挑战。从另一方面说,最近硬件技术得以快速发展,但更多的集中计算部件,如众核处理系统、高性能的协处理器、GPU处理器和机器学习处理器等,这些新型硬件对于加速机器学习技术尤为有效,然而传统数据库技术是典型访存密集型的,如何有效地结合机器学习方法进一步优化数据管理系统提出了新的挑战。

数据库系统经过近50年的发展,虽然已经普遍商用,但随着大数据时代的到来,数据库系统在2个方面面临挑战.首先数据量持续增大期望单个查询任务具有更快的处理速度;其次查询负载的快速变化及其多样性使得基于DBA经验的数据库配置和查询优化偏好不能实时地调整为最佳运行时状态.

而数据库系统的性能优化进入瓶颈期,优化空间收窄,进一步优化只能依托新的硬件加速器来实现,传统的数据库系统不能够有效利用现代的硬件加速器;数据库系统具有成百个可调参数,面对工作负载频繁变化,大量繁琐的参数配置已经超出DBA的能力,这使得数据库系统面对快速而又多样性的变化缺乏实时响应能力.

当下机器学习技术恰好同时符合这2个条件:应用现代加速器以及从众多参数调节经验中学习.机器学习化数据库系统将机器学习技术引入到数据库系统设计中.一方面将顺序扫描转化为计算模型,从而能够利用现代硬件加速平台;另一方面将DBA的经验转化为预测模型,从而使得数据库系统更加智能地动态适应工作负载的快速多样性变化.

本文对机器学习化数据库系统当前的研究工作进行总结与归纳,主要包括存储管理、查询优化的机器学习化研究以及自动化的数据库管理系统.在对已有技术分析的基础上,指出了机器学习化数据库系统的未来研究方向及可能面临的问题与挑战.

孟小峰,马超红,杨晨. 机器学习化数据库系统研究综述[J]. 计算机研究与发展, 2019, 56(9): 1803-1820.
Meng Xiaofeng, Ma Chaohong, Yang Chen. Survey on Machine Learning for Database Systems. Journal of Computer Research and Development, 2019, 56(9): 1803-1820

联系我们

http://crad.ict.ac.cn

Email: crad@ict.ac.cn

010-62620696

010-62600350



登录查看更多
1

相关内容

FPGA加速系统开发工具设计:综述与实践
专知会员服务
63+阅读 · 2020年6月24日
专知会员服务
78+阅读 · 2020年6月20日
大数据安全技术研究进展
专知会员服务
90+阅读 · 2020年5月2日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
117+阅读 · 2019年12月26日
分布式智能计算系统前沿
中国计算机学会
18+阅读 · 2019年10月8日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
已删除
将门创投
8+阅读 · 2019年3月18日
已删除
将门创投
9+阅读 · 2018年12月19日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
深度学习人脸识别系统DFace
深度学习
17+阅读 · 2018年2月14日
Hierarchy Parsing for Image Captioning
Arxiv
6+阅读 · 2019年9月10日
Arxiv
3+阅读 · 2018年10月8日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
FPGA加速系统开发工具设计:综述与实践
专知会员服务
63+阅读 · 2020年6月24日
专知会员服务
78+阅读 · 2020年6月20日
大数据安全技术研究进展
专知会员服务
90+阅读 · 2020年5月2日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
117+阅读 · 2019年12月26日
相关资讯
分布式智能计算系统前沿
中国计算机学会
18+阅读 · 2019年10月8日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
已删除
将门创投
8+阅读 · 2019年3月18日
已删除
将门创投
9+阅读 · 2018年12月19日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
深度学习人脸识别系统DFace
深度学习
17+阅读 · 2018年2月14日
Top
微信扫码咨询专知VIP会员