1.5 本章总结

本章介绍了大数据的基本概念,大数据是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据集。它具有海量的数据(Volume)、快速的数据处理(Velocity)、多样的数据类型(Variety)和价值密度低(Value)四大特征,统称“4V”。

大数据对企业的价值主要体现在以下四个方面:精准的市场营销、辅助决策、催生产品和服务、改善产品和流程。在发掘大数据价值时,需要的关键技术有大数据采集技术、大数据预处理技术、大数据存储和管理技术、大数据分析和挖掘技术、大数据可视化技术等。

大数据在金融、医疗、制造业、能源、互联网、政府公共事业、媒体、零售等领域得到了日益广泛的应用,对社会发展产生了深远的影响。

练习题

一、选择题

1.大数据是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据集,以下哪个不是大数据的主要特征( )

A.价值密度高

B.海量的数据

C.多样的数据类型

D.快速的数据处理

2.目前,半结构化数据和非结构化数据占总数据量的( )

A.50%~60%

B.60%~70%

C.70%~80%

D.80%~90%

3.(多选)数据挖掘的常见任务有( )

A.关联分析

B.聚类分析

C.回归

D.分类

二、简答题

1.简述大数据的4V特征。

2.大数据对企业的价值有哪些?

3.大数据需要用到哪些关键技术?