第三节 可视化技术基础

随着信息技术的不断发展,企业财务管理工作将面临更大的压力和挑战,大量的财务数据和数据类型的复杂多样增加了财务人员的工作负担。因此,对企业来说,重点是加强对财务数据的深度挖掘、快速整合、处理与分析,而数据可视化就是能够直接将数据背后蕴含的信息挖掘整理出来,从而方便财务人员高效整合大量碎片化数据,将信息通过更为清晰明了的可视化方式展示出来,帮助管理者更高效地多维度掌握企业经营管理的整体情况。

一、数据可视化的发展与演进

数据可视化是指通过图像设计,实现复杂事物的直观展示。随着理论与实践的不断发展,数据可视化所承载的数据量愈加巨大,应用领域也愈加广泛。纵观数据可视化发展历程,可以将其分为五个阶段,具体如图1-1所示。

图1-1 数据可视化发展历程

(一)地理测量阶段

15世纪至17世纪的大航海时代,欧洲的船队出现在世界各地的海洋上,寻找贸易路线。在这一时期,船队对实际存在的测量数据以地理图或天文图的形式呈现出来,具有直观性,促进了地理学或天文学的发展,同时也为数据可视化发展奠定了基础。

(二)抽象图表萌芽阶段

到18世纪,欧洲政府开始重视人口、疾病、犯罪等公共领域的数据,与此同时,概率学和人口统计学等也迅速发展,基于理论与实践的双重需求,复杂的数据开始通过饼图、柱状图、直方图等基本图形展示。例如,1786年,威廉·普莱费尔(William Playfair)绘制了英格兰从1700年到1780年的进出口数据的线图,被认为是历史上最早的线图。

(三)简单抽象图表成熟阶段

随着信息数据的价值被欧洲社会普遍认同,欧洲国家统计学会制定了各种图形图表的分类和使用标准,统计图表在这一时期被广泛认知并使用,折线图、条形图、饼图、散点图等数据图形开始出现在正式文档中。例如,1854年,伦敦苏荷区爆发霍乱,英国麻醉学家、流行病学家约翰·斯诺(John Snow)在地图上用散点来表示霍乱案例与周围水泵的关联,并且用统计数据来说明水源水质与霍乱的相关性,最终锁定了一个公共水井。

(四)复杂抽象图表产生阶段

在20世纪60年代末,随着计算机的推广应用,人们处理数据的能力和水平得到极大提高,慢慢开始利用计算机绘制可视化图表。计算机的数据处理精度和速度远远优于人工,缩略图、聚类图、树形图等复杂且精度高的数据可视化图表开始不断涌现。

(五)大数据可视化分析阶段

随着数字经济时代的到来,数据可视化逐渐与数据挖掘、统计分析、图形学、美学、认知科学等领域结合起来,综合数据处理、算法设计、软件开发、人机交互等多种相关知识和技能,帮助目标受众从大量、复杂、不完整的数据中快速找到有用的信息。

二、数据可视化的概念

数据可视化主要是指以图形、图像、表格的形式表现海量数据,利用数据分析技术、数据可视化工具发现隐藏在数据中的属性、维度、数据类型和数据来源等信息。数据可视化的本质是将海量数据中的特殊数据进行可视化处理,从而把数据转换成方便人们理解的更加直观易懂的信息,更好地掌握企业经营状况,进而做出管理决策。

高效地展示数据需要审美形式与视觉功能相结合,通过直观地传递数据的特性,对海量数据进行深入挖掘。数据可视化与信息图像、信息可视化、统计图形之间存在密切联系。数据可视化的本质是将每一个数据对象以单个图像元素进行表示的图元集合,通过不同的视角对数据进行更深入的观察与分析,从而清晰、准确、高效地将信息进行展示与传达。上述数据对象代表着生成数据可视化图表的数据集合,每一个数据对象都代表了一个实体。属性是数据对象反映自身特征的定性或定量值。倘若一个数据对象拥有多个属性,则该集合就是属性向量。属性的种类包括:标称属性、二元属性、序数属性、数值属性。实现数据可视化的前提是了解数据对象的属性,正确反映数据特征。

三、数据可视化的基本步骤

数据可视化不是由某一个算法实现的,而是通过一系列步骤组成的流程来实现的。数据的采集、预处理等前端步骤都会影响最终呈现的可视化结果。数据可视化具有多维度、易理解、多领域、准确度高、可扩展性和一体化等特点。数据可视化的基本步骤如图1-2所示。

微课堂

可视化数据基础

图1-2 数据可视化的基本步骤

(一)数据采集

数据采集是指把不同数据源的数据按照格式、维度、尺寸、分辨率等分类标准进行采集汇总的过程。数据采集的主要方法包括网络爬虫技术、软件采集以及开放数据库采集等。倘若采集到的数据质量较高,没有异常值、缺失值,数据的维度统一、分辨率较高,后续实现的可视化结果质量也就会较高。

(二)数据预处理

数据预处理是指在主要处理以前对数据进行的一些处理。数据预处理是大数据分析过程中的关键步骤,会直接影响后面所有步骤的结果质量,数据预处理技术可以使原本混乱无章的数据按照预想的结果进行改变。数据预处理可以降低数据分析的难度,提高数据分析效率,降低数据分析的成本。数据预处理的方法有很多,常见的数据预处理方法包括数据清洗、数据集成、数据变换与离散、数据规约等。

(三)选择可视化工具

选择可视化工具时既要考虑目标受众,也要深入了解工具的特点。目标受众包括高管、信息技术部门、管理部门、普通员工等,目标受众不同,其目的不同。例如,高层领导需要可视化分析工具反馈的是图形,可以清晰地看到自己想要的结果。结合产品路线图可充分了解使用目标可视化工具是否可以提高效率、是否符合工作的战略愿景、是否涵盖了其他必备的功能等。

(四)设计可视化模型

设计可视化模型是指利用围绕现实想法组织模型的一种思考问题的方法。模型通过过滤非本质的细节信息,找到问题的本质,把问题简单化,使问题更容易理解。抽象是一种允许我们处理复杂问题的基本能力。模型对理解问题、沟通、准备文档设计程序和数据库都是有用的。设计可视化模型需要符号、过程和工具等要素。符号在任何模型中都扮演着重要的角色,被认为是把过程黏合在一起的“黏合剂”。

(五)实现可视化

在上述步骤的基础上,为了使可视化图像更加直观、清晰、明了,可以根据需求设置颜色、线型、标记、标题、刻度等参数,对建立的可视化模型设置参数后,即可一键生成可视化场景,实现可视化。

(六)分析可视化

实现可视化之后,通过描述性可视化分析,可以快速了解数据信息,清楚地传达数据的含义,帮助解释趋势和统计数据,从全局或局部视角了解情况,从过去的行为中总结经验,并以此预测未来的发展趋势。同时,也需要注意识别异常值,深入调查各个异常数据,探查这些数据无法被看到的原因。

(七)优化和改进

为了确保数据能够正确有效地展示给目标受众,可视化模型需要遵循最优的数据可视化原则,在上述可视化结果的基础上,不断优化和改进可视化模型,满足不同目标受众的需求,提升可视化效果。

四、数据可视化“三要素”

数据可视化是将数据通过视觉呈现,从而直观地传递出数据所蕴含的深层次信息。数据可视化遵循一定的逻辑规则,能够将一些抽象的、冗余的数据排除在外,但需要考虑图表、逻辑和工具三个要素的适当选择与使用。

(一)图表

为了使数据可以更加直观清晰地展现,最大限度地满足用户可视化需求,数据可视化基本图表逐渐得到丰富,12种常见图表如表1-1所示。各种图表有不同的应用场景和配置规则,目标受众需要结合数据特征、可视化诉求、目的,合理选择图表。

表1-1 12种常见图表

(二)逻辑

数据可视化的展现逻辑以目标受众为中心,采取合适的展现方式帮助用户在海量数据中快速捕捉有用信息。数据可视化的展现逻辑一般包括时间逻辑、排序逻辑、空间逻辑、角色逻辑、业务流程逻辑、其他逻辑等,具体如表1-2所示。虽然展现逻辑种类较多,但需要明确图表展现的目的,使图表为目的服务。

表1-2 数据可视化展现逻辑

(三)工具

在大数据、云计算、人工智能等行业前沿技术高速发展的今天,数据可视化工具市场已经十分广阔,但数据可视化工具在国内市场仍处于起步阶段。2023年,湖南睿略信息咨询有限公司针对数据可视化工具市场容量展开调查,结果显示2022年全球数据可视化工具市场规模达到383.83亿元人民币,依据市场历史趋势并结合市场发展趋势,预测到2028年全球数据可视化工具市场规模将达到649.22亿元人民币。数据可视化工具可以将数据转换为条形图、柱状图、环形图、丝带图、瀑布图、散点图、树状图等形式,进而反映不同的数据内涵。那么,当前市场上主流的数据可视化工具有哪些呢?

1.Excel

Excel是微软公司研发的一款电子表格,不但能够管理数据,而且可以提供各种标准的图表,如柱状图、面积图、折线图、条形图、散点图、饼状图等。Excel操作较为简单,可以快速处理小数据集合,但对大数据集合的处理稍显迟钝。同时Excel制图功能生成的图表简单,不需要编写程序,但单调的模板使生成的图表较为死板,因此,Excel只适合用于进行简单的数据分析,并不适合用于进行深度的数据分析。

2.Python

Python是一款开源的编程语言,利用大量的函数库高效地实现各种应用功能,具有简单、高级、扩展性强、可移植性强、函数库丰富、可嵌入性强等特征。Python主要通过tkinter模块、turtle模块、Matplotlib模块实现不同的数据可视化,能够提供丰富的绘图功能。人们普遍认为Python是一个不错的数据可视化开发工具,功能十分强大,但从艺术角度来看其还有改善空间。

3.D3

D3(Data-Driven Documents)是一种由数据驱动的文档。D3的关键要素是数据,利用数据确定如何绘制可视化图表的程序设计模型,主要使用JavaScript实现数据可视化,本质是JavaScript的一个函数库。D3简单、易于操作,可以实现JavaScript的全部功能。D3也是一个开源的软件,方便用户下载使用,是当前热门的数据可视化工具之一。

4.eCharts

eCharts是一款基于JavaScript的数据可视化图表库,提供直观、生动、可交互、可个性化定制的数据可视化图表,用于满足不同领域的需求,实现各种2D、3D图表的可视化。eCharts拥有许多开源免费的图形模板,允许自定义可视化图表,能达到动态的可视化效果。该工具能高效地进行数据量较大的可视化处理和三维图形的可视化处理,并且能非常智能地利用代码编程生成可视化图表。

5.Tableau

Tableau提供的产品包括Tableau Desktop、Tableau Public、Tableau Server、Tableau Online、Tableau Reader,其中前两项属于开发人员工具,后三项属于共享工具。其官网描述是成为“所有人都能学会的业务分析工具”。类似于Excel,Tableau不需要编程,只需要“拖动”动作就可以实现强大的可视化功能。Tableau具有操作简单、实时连接、数据更新快、数据提取效率高等特征,具有十分实用的数据可视化功能。

五、数据可视化的作用

在数字经济时代,数据可视化对大数据信息准确呈现起到了重要的推动作用。

(一)增强数据洞察力

数据可视化能够帮助数据使用者理解数据,发现其中深藏的规律和未来趋势。通过可视化工具,数据使用者能够缩短发现数据关系的时间,如数据中的相关性、趋势、重复值、异常值等。尤其是在分析销售数据时,通过可视化工具能够发现销售额、时间、区域等之间的关系,还可以清晰地看到各种产品的销售情况。因此,数据可视化分析能够帮助企业更好地掌握市场需求,提前制定适应市场的营销策略。

(二)提升决策效率

数据的受众有很多,如高管、普通员工、政府等。将数据通过图形、表格或线条等形式呈现,能够满足不同数据使用者的需求。数据可视化能够帮助决策者快速了解数据,并做出合理的决策。例如,在金融领域,可视化工具实时显示股票价格涨跌情况,帮助投资者快速地做出投资决策。

(三)促进沟通交流

数据可视化能够提升数据使用者向其他人传达数据分析结果的效率。通过可视化工具,数据使用者将数据以更为直观、高效的方式展示给其他人,方便第三人理解和掌握数据分析的结果。同时,可视化工具能够帮助数据使用者及时发现当前的问题与不足,并帮助他们解决问题,有效降低在传统数据分析时出现误差的概率,提高数据信息的准确度。

(四)实现价值最大化

数据使用者在数据可视化分析过程中及时发现当前存在的风险与问题,快速解决问题,降低风险。数据可视化能够帮助数据使用者发现数据中的隐藏信息,激发数据使用者的创造力,从数据中寻找新的机会。数据可视化应用增强了企业获取经济效益的能力以及帮助企业合理分配和利用企业人力、物力等,深入挖掘潜力,实现经济价值与利益的最大化。