1.5 会产生什么价值

在我们生活的这个时代,数据挖掘已经深入到了工作、生活和学习的方方面面。下面简单介绍几个方面,更翔实的案例会在本书的第 8 章中展开。

支撑决策

数据挖掘能够帮助决策部门找出影响经济发展和环境质量的关键因素,帮助决策部门提前预知风险并做出正确判断。数据挖掘也可以帮助个人做出决策,如一些房地产大数据的创新企业可以提供对于特定地段楼盘和房型的房价未来走势的预测,这对于希望房产升值的用户而言是关键的。 William Poundstone 说,德国国家队守门员 Jens Lehmann 的袜子里藏着提示条,上面写着对方最可能罚 点球的球员以前点球记录中向左踢、向右踢和向中间踢的比例,这个提示条可以帮助他决定向哪个方向扑救点球[5]

优化生产

在很多生产线上,一个初级的产品甚至原料要经过十几甚至几十道工序,上百次加工处理,才能变成成品。很多智慧工厂的绝大部分加工处理的数据都有记录,包括电流、压力、振动、噪声、图像、时间等,结合产品测试的结果,如哪些是优品、哪些是良品、哪些是不合格品,就可以找到决定产品质量的关键环节,从而进行有针对性的生产线优化。对于有些长流程的连续生产线,好的算法可以在产品没有到达测试环节就准确判断出这已经不可能合格了,那么后面的大量加工就可以节省下来,从而降低成本。

提高销量

本章 1.4 节中已经举了一个简单的例子,就是通过分析用户的购买记录,找到频繁出现的商品,然后考虑把这些商品摆放在超市中临近的位置。随着电子商务的快速发展,现在我们可以做到的远不止此。实际上,利用数据挖掘,我们能够为用户推荐可能感兴趣的商品,而且可以做到给每个人的推荐都不一样,每个人登录同一个电商网站所看到的内容也不一样。这些技术可以大幅提高销量!

改善生活

通过分析海量体检指标和病历,我们可以发现指标或指标组合的异常,以及这些异常对应的危险,从而提供有针对性的健康管理方案。可穿戴设备采集 的实时身体状态数据,不仅能够给出更准确的关于健康程度的评估,还能提前预警一些可能的重大心血管疾病,提高人们抗风险的能力。通过对交通状况的分析,我们可以判断拥堵的严重程度,预测接下来的拥堵地段,并通过导航来避开拥堵。在医疗健康、交通出行、文化旅游、食品安全等方面,数据挖掘都能找到重大应用并实质性地改善我们的生活。

当然,数据挖掘的价值远远不局限于此。实际上,通过数据挖掘,我们的教育水平和教育效果能够得到大幅度提高,聪明的人还能够通过预测股价和期货价格获取巨大的经济回报,很多学者搜寻最新科学论文的时候,也在接收基于数据挖掘的文献推荐。尽管数据挖掘已经产生了巨大的社会经济价值,但比起它能够产生的价值而言,是微乎其微的。我们要利用数据挖掘实现不可估量的巨大价值,既需要充分掌握数据挖掘这一看似简单其实内涵丰富的工具,还需要教育整个市场,让大家产生数据挖掘的需求并形成尊重数据、让数据说话的风气。

路漫漫其修远兮,让我们共同探索前行!

  • [1] V. Mayer-Schönberger, K. Cukier.大数据时代——生活、工作与思维的大变革.盛杨燕, 周涛译.浙江人民出版社, 2013.
  • [2] 周涛.为数据而生——大数据创新实践.北京联合出版公司, 2016.
  • [3] M. Schmidt, H. Lipson . Distilling free-form natural laws from experimental data.Science, 324, 2009: 81-85.
  • [4] D. Silver, et al. . Mastering the game of Go with deep neural networks and tree search.Nature, 529, 2016: 484-489.
  • [5] W. Poundstone.剪刀石头布:如何成为超级预测者.闾佳译.浙江人民出版社, 2016.