2.2 可视化的模型
2.2.1 顺序模型
Ben Fry在他的著作《可视化数据》里把数据可视化的流程分为7步:获取、分析、过滤、挖掘、表示、修饰、交互(见图2-14)。为了使这个流程更便于理解,本书把这7步归纳为3大部分,即原始数据的转换、数据的视觉转换及界面交互。
图2-14 顺序模型
1.原始数据的转换
原始数据的转换包括7个阶段里的获取、分析、过滤和挖掘。
获取,即得到数据,可以出自存储在本地端的文件,也可以从网络抓取,又称数据采集或数据收集。而后对获取的数据进行分析,即用结构图表明数据的意义并按类别排序才能知道它们有何意义,分析数据的价值对之后的过滤步骤是非常必要的。过滤即留下有用的数据,删除多余数据,减小处理量实际上也是确保数据的质量,增加精准度。挖掘即用数据挖掘或统计学方法对数据格式进行辨析,或是把数据放在数学环境里,目的是在一堆杂乱无章的数据中寻找某种规律,从而为之后的数据表示提供有组织的原材料。可以说,数据挖掘就是数据可视化的中枢系统。
原始数据的转换过程可繁可简,这取决于需处理对象的类型和复杂程度。
2.数据的视觉转换
数据的视觉转换包括7个阶段里的表示和修饰。
表示即选择一个基本的视觉模型表述出来,相当于一个草图,这个步骤基本决定了可视化效果的雏形,需要结合数据的维度考虑合适的表示方法,可能采取列表、树状结构或其他;同时,这也是对前面数据转换过程的审查和检验,特别是数据的获取和过滤。所以,表示是可视化过程中一个关键性步骤。
修饰即改善这个草图,尽可能地使之变得更清晰有趣。这一步骤就像对草图上色,突出重点,弱化一些辅助信息,使数据的表示简单清晰却又内涵丰富、实用美观。
3.界面交互
界面交互包括7个阶段里的交互。
交互提供了一种让用户对内容及其属性进行操作的方便途径。交互的操作者,可能是负责数据可视化的工程师,也可能是使用该可视化的用户,在有些情况下他们是同一人。例如,当对某一属性进行研究时,用户可以隐藏其他属性,专注于某一特定区域的研究。而对于三维空间的可视化效果,用户可以通过交互操作进行视角的变化,从而对数据有更全面的认识。
不仅如此,用户的心理感受变化也值得注意,之前的所有步骤主要由计算机完成,而在交互阶段,用户地位由被动变主动,由接受转为去发现、去思考,界面交互提供了他们控制数据和探索数据的可能,这才能在真正意义上将计算机智能和人的智慧结合起来。