数据仓库,数据中台和大数据平台有什么区别?
数据仓库实现了企业数据模型的构建;大数据平台解决了海量、实时数据的计算和存储问题;数据中台不是一个产品,而是一套体系,是一种组织架构,数据中台的开发和建设既可以建立企业数据仓库基础上,也可以建立在企业大数据平台基础上,区别就在于企业的数据应用场景是否多元化。下面分别从概念、应用和价值三个方面说明其区别。
1、概念上的区别:
数据仓库:按照传统的定义,数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。从数据角度,数据仓库更适合传统的数据库,离线采集,数据一般为结构化的;
数据中台:解决企业逻辑模型的搭建和存储、数据标准的建立、数据目录的梳理、数据安全的界定、数据资产的开放,知识图谱的构建。通过一系列工具、组织、流程、规范,实现数据前台和后台的连接,突破数据局限,为企业提供更灵活、高效、低成本的数据分析挖掘服务;
大数据平台:是指以处理海量数据存储、计算及流数据实时计算等场景为主的一套基础设施,包括了统一的数据采集中心、数据计算和存储中心、数据治理中心、运维管控中心、开放共享中心和应用中心。
2、应用上的区别:
数据仓库:支持管理决策分析,主要应用于BI商业智能;
数据中台:距离业务更近,通过将数据服务化之后提供给业务系统,为业务提供速度更快的服务,不再仅限于分析型场景,也适用于交易型场景,强调共享和复用;
大数据平台:除传统BI应用外,更多融入了人工智能算法的交互和实现。
3、价值上的区别:
数据仓库:存储的数据大多是根据需求有针对性抽取的结构化历史数据,能够生成各类报表,但这些报表都无法实时产生,因此,尽管能提供部分业务价值,但不能直接影响业务;
数据中台:建立在数据仓库和大数据平台上,是加速企业从数据到业务价值转变过程的中间层。数据中台将数据生产为一个个数据API服务,以更高效的方式为业务提供服务;
大数据平台:为解决数据仓库不能处理非结构化数据和报表开发周期长的问题而产生。大数据平台先是通过将企业所有数据(包括结构化和非结构化数据)抽取出来放到一起,成为一个大的数据集,再根据业务需求,单独提取其中的小数据集并提供给数据应用。
企业选择哪种方式加速数字化转型进程要看具体的企业情况。总的来说,大原则是以满足业务发展为第一要务,不能为了做基础设施而做基础设施,一定要以能解决业务诉求为最终目的。数通畅联专注于企业IT架构、SOA综合集成、数据治理分析领域,感谢您的阅读与关注。