1.4 系统架构中的数据集成设计

在系统架构设计中,经常会面临多个业务系统数据集成共享的问题。下面主要介绍数据集成设计的相关内容。

1.4.1 数据物理集中

数据物理集中主要就是将全部数据放在一起,由一个统一的数据库服务器管理,实现数据统一访问。其优点是访问效率高,适合大数据量查询的决策分析应用;其缺点是实时性较差、风险大、用时长。

1.4.2 数据逻辑集中

数据逻辑集中主要是指业务系统分布在多个地方,由统一的整合平台实现各物理分布数据之间的数据共享。其优点是可实时访问分布在各处的数据,实施速度快;其缺点是受网络传输影响,不适合字节较长的数据。

例如:在销售行业的客户信息集成中,如果是逻辑集中,那就是客户数据依然存在于各个地方,但是可以通过统一的数据整合平台进行访问;而如果是物理集中,则可以通过集中的数据库进行访问。

在实践应用中推荐结合逻辑集中与物理集中各自的优势,在实施初期采用逻辑集中以快速实现统一访问与数据共享,而对访问量大、实时性要求不高的数据逐步实现物理集中,从而提高访问效率。这类似于BI技术中的自顶向下与自底向上相结合的数据集成策略。

1.4.3 数据联邦模式

数据联邦(Data Federation)模式就是将分布的数据进行逻辑集中,应用端通过访问整合平台的虚拟数据库进行数据访问,数据在不同数据库实例中。此时,数据整合平台相当于数据访问通道,如图1-4所示。

图1-4 数据联邦模式

1.4.4 数据复制模式

数据复制(Data Replication)模式主要通过数据一致性服务实现多个数据源的数据一致性,各数据库均保留共享数据备份。数据复式模式示意图如图1-5所示。

图1-5 数据复制模式

1.4.5 基于接口的数据集成模式

基于接口的数据集成模式就是系统间通过接口适配器方式共享数据的模式。它比较适合实时性较高且数据量较小的应用场景,适合分区及独立模式的数据集成。基于接口的数据集成模式示意图如图1-6所示。

图1-6 基于接口的数据集成模式

在实际应用中,可以根据特点,灵活选用相应的策略。