数据中台与数据仓库的区别?“数据中台”是个国内的热门概念吗?

这两年“数据中台”这个概念很热。那么它和我们一直说的数据仓库相比,有什么不同?另外,"数据中台"这个词,是个只在国内的概念吗?在海外市场,是否有与之对…
关注者
59
被浏览
22,821
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

今天,很多公司尤其是企业IT服务商在提「数据中台」,「数据中台」一度成为大数据行业里最热门的流行词汇,一家企业的CIO或者IT负责人要是说自己没听过这个概念,就仿佛落伍了一般。

那么,数据中台到底是什么?

1. 关于袋鼠云和数据中台

2017年杭州云栖大会上,袋鼠云正式将「数据中台」作为自己的业务战略方向。

2018年,袋鼠云在业内率先推出《袋鼠云数据中台专栏V1.0》,阐述自己的数据中台理念和方法论。

2019年,袋鼠云基于两年来在数据中台领域的探索和实践经验,推出《袋鼠云数据中台专栏V2.0》升级版。

2. 数据中台是理念,是方法论

「数据中台」理念由阿里云和袋鼠云最先提出。

袋鼠云依托最新的数据采集、加工处理、数据挖掘、机器学习,深度学习等技术,并结合自身多年数据应用经验,打造了袋鼠云数据中台解决方案,致力于构建“全”、“统”、“通”的大数据体系,基于「互联网+」时代的数据价值思考,构建全域数据共享能力中心,助力企业数字化,提升企业竞争力!

数据中台的实质是为企业构建「全域数据的共享能力中心」,提供数据采集、数据建模、数据研发、数据萃取、数据治理、数据服务等全链路一站式服务,构建面向业务应用的数据智能平台。

很多人会认为,「数据中台」只是一个炒出来的词汇,听起来和传统的数据仓库没有什么不同啊。

针对这个问题,我们总结了「数据中台」和「数据仓库」的几个明显的优越性:

  • 分布式数据平台
    传统数仓以单机关系型数据库离线分析为主;
    数据中台以分布式引擎架构,同时支持离线计算/实时计算/即时计算/智能计算。
  • 数据源丰富性
    传统数仓以业务数据库的结构化数据为主;
    数据中台涵盖业务数据、日志数据、行为埋点数据、IoT数据、爬虫数据、外部数据等。
  • 建设模式方法论
    传统数仓往往采用自顶向下的建设模式,以明确的业务分析驱动,延续性低;
    数据中台采用自底向上的方式,结合业务需求变化不断迭代升级。
  • 数据开发一站式
    传统数仓往往将ODS、EDW和ETL开发切割到不同厂商工具实现;
    数据中台则主张一站式可视化数据开发,借助分布式技术的力量简化数据加工处理的过程。
  • 数据资产在线化
    传统数仓的数据管理和治理,往往花费大量精力,最终形成的是离线的规范和文档;
    数据中台则强调元数据管理统一入口的自动化和数据资产管理的在线化。
  • 数据应用创新
    传统数仓的数据应用以某个业务主题的BI报表和决策支持为主,相对来说目的性较为单一,而且各部门有不同的应用,建设方式呈烟囱式;
    数据中台则主张打通数据孤岛,建设全域数据,释放数据应用创新的能量。

和传统企业可能某一个IT部门去自建一个数据仓库不同,今天我们谈,企业构建数据中台架构,是需要从集团战略层面来规划和推动的。在执行落地层面,则需要专业高端的人才,靠谱的合作厂商,完善的实施方法论,成熟的,低门槛的,高性价比的产品。