1.5 本章总结
本章介绍了大数据的基本概念,大数据是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据集。它具有海量的数据(Volume)、快速的数据处理(Velocity)、多样的数据类型(Variety)和价值密度低(Value)四大特征,统称“4V”。
大数据对企业的价值主要体现在以下四个方面:精准的市场营销、辅助决策、催生产品和服务、改善产品和流程。在发掘大数据价值时,需要的关键技术有大数据采集技术、大数据预处理技术、大数据存储和管理技术、大数据分析和挖掘技术、大数据可视化技术等。
大数据在金融、医疗、制造业、能源、互联网、政府公共事业、媒体、零售等领域得到了日益广泛的应用,对社会发展产生了深远的影响。
练习题
一、选择题
1.大数据是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据集,以下哪个不是大数据的主要特征( )
A.价值密度高
B.海量的数据
C.多样的数据类型
D.快速的数据处理
2.目前,半结构化数据和非结构化数据占总数据量的( )
A.50%~60%
B.60%~70%
C.70%~80%
D.80%~90%
3.(多选)数据挖掘的常见任务有( )
A.关联分析
B.聚类分析
C.回归
D.分类
二、简答题
1.简述大数据的4V特征。
2.大数据对企业的价值有哪些?
3.大数据需要用到哪些关键技术?