2.1 前期调研

在建设数据仓库之前,先要对企业的业务和需求进行充分的调研,这是搭建数据仓库的基石,业务调研与需求分析是否充分直接决定了数据仓库的搭建能否成功,这对后期数据仓库总体架构的设计、数据主题的划分有重大影响。前期调研主要从以下几个方面展开。

1.业务调研

企业的实际业务涵盖很多业务领域,不同的业务领域包含很多业务线。数据仓库的搭建是涵盖企业的所有业务领域,还是单独建设每个业务领域,是开发人员需要重点考虑的问题,在业务线方面也面临同样的问题。在搭建数据仓库之前,先要对企业的业务进行深入调研,了解企业的各个业务领域包含哪些业务线、业务线之间存在哪些相同点和不同点、业务线是否可以划分为不同的业务模块等问题。在搭建数据仓库时要对以上问题进行充分考量,本项目不涉及业务领域的划分,但是具有多条业务线,如商品管理、订单管理、用户管理等,所有业务线统一建设数据仓库,为企业决策提供全方位支持。

2.需求调研

对业务系统有充分的了解并不意味着就可以实施数据仓库建设,操作者还需要充分收集数据分析人员、业务运营人员的数据诉求和报表需求。需求调研通常从两个方面展开,一方面是通过与数据分析人员、业务运营人员和产品人员进行沟通来获取需求;另一方面是对现有报表和数据进行分析来获取需求。

例如,业务运营人员想了解最近7日内所有品牌的销售额,针对该需求,我们来分析需要用到哪些维度数据和度量数据,以及明细宽表应该如何设计。

3.数据调研

数据调研是指在搭建数据仓库之前的数据探查工作,开发人员需要充分了解数据库类型、数据来源、每日的数据产生体量、数据库全量数据大小、数据库中表的详细分类,以及所有数据类型的数据格式。通过了解数据格式,可以确定数据是否需要清洗、是否需要做字段一致性规划以及如何从原始数据中提炼出有效信息等。

例如,本项目中的数据类型主要是用户行为数据和业务数据,所以需要对用户行为数据的数据格式进行充分了解,对业务数据的表类型进行细致划分。