- 大话数据科学:大数据与机器学习实战(基于R语言)
- 陈文贤
- 327字
- 2020-11-23 14:43:53
2.5 R的数据绘图
用R函数包“ggplot2”的数据集“diamonds”钻石,来说明R的数据绘图。
钻石数据
钻石数据是数据框的结构,有53940行(样本),10列(变量):
(1)价格Price美金$326--$18,823
(2)克拉Carat质量0.2--5.01
(3)切割Cut Fair,Good,Very Good,Premium,Ideal
(4)色泽Color J(worst)to D(best)
(5)净度Clarity I1(worst),SI2,SI1,VS2,VS1,VVS2,VVS1,IF(best)
(6)长 X length in mm(0--10.74)
(7)宽 Y width in mm(0--58.9)
(8)高 Z depth in mm(0--31.8)
(9)深度 Depth = z / mean(x,y)= 2 * z /(x + y)(43--79)
(10)形状Table = top of diamond relative to widest point(43--95)
【R例2.1】钻石数据:diamonds,函数{包}:qplot ggplot {ggplot2}
如图2-10~图2-15所示。
图2-10 钻石价格直方图
图2-11 钻石价格和切割箱线图
图2-12 钻石克拉和切割小提琴图
图2-13 钻石价格和净度箱线图
图2-14 钻石变量相关系数1
图2-15 钻石变量相关系数2