1.1.2 统计思维何以重要

1.统计思维和能力的培养及发展,是大数据时代学科发展的迫切要求

管理信息化、教育信息化、企业现代化的快速发展,促使各行各业极快地积累起了大量数据,使人类快速进入“大数据时代”。如何充分地利用这些数据,从中总结出规律,以便为下一步的决策提供依据,或者依据数据分析实现智能化推送,已经成为社会科学的重要研究领域。

分析数据内部所蕴含的规律、预测相关系统的运行趋势,已经成为当代信息处理的主要任务,成为每一个机构、每一个科研项目必须面临的课题。基于这一需求而快速发展起来的数据建模技术、数据挖掘技术已经成长为计算机科学的重要应用领域,也成了管理与决策的重要依据。

因此,大数据时代,每一位研究者都应该成为“数据之海”的弄潮儿,具备专业化的数据挖掘和数据分析能力,这些能力也是个人发展的重要助力。在科学研究活动中,以统计学的原理为指导,借助统计学的技术,开展各种层次的统计、分析、归纳和挖掘,对科研成果的生成、研究结论的论证非常重要。综上所述,科研统计思维培养是大数据时代学科发展的迫切要求。

2.统计思维能力的提升,能够促进学科融合,提升科技人员的科研素养

众所周知,统计分析是理工类专业实验数据处理、结论归纳,获得有价值的研究成果的重要方法。然而,在计算机科学和统计分析软件真正地普及以前,基于大量的调查数据开展统计与分析是一项计算量很大的工作,而且要求研究者精确地了解统计学的基本理论,掌握每个统计分析算法的机理和规范。因此,彼时对量化研究者的要求非常高。在社会科学的研究中,传统的研究以质性研究方法为主。然而,随着专业化统计分析软件的普及,借助统计分析工具开展量化研究已经成为很多文科科研人员的常规研究方法。

不同学科所形成的统计研究方法在计算机科学与技术的支持下实现了快速发展。自然科学的主流研究方法范式——实验数据的量化处理,发展出了一整套形式语言理论、编译理论、检验理论及优化理论。而人文社会科学的主流研究范式——思辨研究、质性分析,也受到了计算机科学和数据处理理论的冲击,从基本文本分析到语义分析、语料分析处理,都能借助计算机将原本只有人工才能进行的复杂分析机器化和程序化,并借助数据处理的理论和方法获得了可信度更高的研究结论——“基于数据做论证”已经成为广受认可的研究方法。

当统计分析方法作为工具和技术所承载的方法论属性渗透进来后,它已经超越了学科疆域的研究规则和框架,而是形成了跨学科的研究范式。也就是说,科研统计思维的理念和模式已对众多学科的研究方法体系产生了重要影响,甚至从根本上改变了其原有的研究范式。

3.统计分析软件为科研统计思维的快速发展提供了可能

在传统的科研数据处理中,如果想基于数据开展量化研究,则需要以统计学、统计分析的理论为基础,通过大量的数据计算,分析数据之间的相关性、差异性,甚至包括归因分析、聚类分析(降维分析)等,才能获得研究结论。这一过程涉及的规则很多、计算量庞大,对非计算机专业和非统计学专业的多数学者来讲,都存在着很大困难。然而,随着众多统计分析软件的出现,为面向数据的统计与分析提供了很好的工具,特别是SPSS、SAS等软件的出现,极大地促进了科研统计思维的普及与发展。目前,对多数从事人文科学研究的科研人员来讲,SPSS和SAS中的各类统计分析工具就像一个只有“输入”和“输出”的“黑匣子”,在开展量化研究的过程中,不需要了解黑匣子的内部结构,只需要能精确地掌握其输入数据和各项参数,并解读其各类输出结果所代表的具体含义,就能够很好地使用它们。统计分析软件的广泛使用,推动了科研统计思维的普及,使科研统计思维在人才培养中的地位日益提升,科研统计思维的策略在科研、教学中日益重要。

因此,尽管面向非计算机专业和非统计学专业学生直接讨论数据挖掘和统计分析技术的原理和算法会存在困难,但是,如果只是把数据建模和数据挖掘技术的概念、方法和工具以科研统计思维的模式介绍给学生,允许学生在借用数据建模和数据挖掘的现有工具时不必详细掌握其内部的算法结构,只需了解每个工具的输入、输出及其参数规范,让学生逐步具备准确地使用统计分析工具并解读统计分析结果的能力,还是完全可行的。如果做到了这一点,我们的学生在参与普通科研活动时就能借助这些工具开展统计分析并能根据分析结果获得比较准确的量化结论。与此同时,如果学生们熟练掌握了这些工具的用法,也一定能够拓展学生的解题方法,使研究的科学性、严谨性都能得到很大的提升,从而优化其思维方式,促进其科研能力的发展。