- 数据不说谎:大数据之下的世界
- 城市数据团
- 1719字
- 2024-12-20 20:05:02
前言 我们在用数据做什么
在这本书的最开始,我们想要提出这样一个问题:
谁最了解你?
是自己?
是配偶/恋人?
是父母/子女?
是同学/同事/朋友?
毫无疑问,以上几种人都存在于我们的生命中。
但是,跟“它”比起来,以上几种人对我们的了解恐怕都不够全面和客观。
没错,“它”就是手机,与我们形影不离的手机。
看看你手机上的那一大堆APP——
微博和朋友圈知道,你今天心情好不好。
支付宝知道,你买了什么东西、花了多少钱。
微信和QQ知道,你都有哪些朋友,你跟哪些朋友的交流更密切。
豆瓣、知乎、每日头条知道,你都喜欢浏览哪些帖子和新闻。
虾米和酷狗知道,你喜欢听什么歌。
优酷和B站知道,你喜欢看什么视频。
饿了么和美团知道,你喜欢什么菜系和口味。
……
就算你什么APP也没装,只要你有一部手机,“它”就知道你什么时候工作,什么时候休息,知道你去了哪里,待了多久。
在手机面前,我们简直无所遁形。手机所知道的你,可能比你所知道的自己,更为真实。
而这些,都是我们自己告诉手机的。我们的每一次浏览、点赞、评论、下单、聊天,都以数据的形式被记录、被沉淀,最终塑造出了我们自己。
所以,请不要被“大数据”“开放数据”“数据挖掘”“深度学习”“神经网络”“云计算”“DMP”等奇奇怪怪的词汇所吓倒。我们每个人每天的生活起居、衣食住行,都在产生数据,并享受着数据给我们带来的便利服务。
事实上,数据已经和我们的视觉、听觉、触觉一样,成为了帮助我们去了解自己、了解他人、了解事物的重要方法。
与其他信息源相比,数据更有可能提供全面和客观的信息,从而帮助我们更快速和高效地了解问题、解决问题。
例如,你母亲催你去相亲,并提供了100位相亲者的资料。显然,你不可能一个个把他们约出来见面,一个个去了解和评价他们——你甚至都不可能仔细读完这100份资料。
我们通常的做法是,设立一些限制条件,对年龄、身高、学历、收入等进行筛选,再逐份阅读符合条件的相亲者的资料,直到将相亲对象数量减少到个位数。如此,我们的相亲效率就大大提高了。
然而,在享受数据给我们带来的高效便利的同时,我们还必须意识到:数据分析只能提供结果,不能提供结论;数据之所以能做许多事情,是因为使用数据的人做了很多的思考。
例如,2013年,Amazon Studios和Netflix,美国的两家传媒公司,都对自己网站上客户的视频浏览行为进行了分析。接受分析的浏览行为包括客户看了什么视频、什么时候看的、在何处暂停、在何处跳过、在何处反复观看、给视频的评分等。
根据数据分析的结果,两家公司一致认为观众会对政治主题感兴趣,但在视频的体裁、制作等方面则有着完全不同的认知。而后,Amazon Studios推出了由四位议员作为主角的情景喜剧,Netflix则推出只有一位议员作为主角的电视连续剧。前一部作品名为《阿尔法屋》(Alpha House),观众反应平平;后一部作品则是风靡一时、获奖无数的《纸牌屋》(House of Cards)。
所以,即使在一个“大数据”炙手可热、喧嚣尘上的时代,人仍然是主体,是人的智慧让数据具有了价值。
我们,城市数据团的小伙伴们,就是这样一群人:利用数据去了解城市的发展、挖掘城市生活中有趣的故事。对我们而言,数据是帮助我们认识城市的工具、帮助我们在城市里更好地生活的工具,而通过数据发现的东西才是价值和乐趣所在。我们乐意将这些发现拿出来共享。
本书由城市数据团组织编写,并写作了本书的大部分章节。城市数据团的主要成员包括高路拓、汤舸、王咏笑、王宇鹏等。参与了本书部分章节写作的其他数据团成员和合作伙伴包括(按文章收录顺序):
陈宇佳(1.1.2)、郭斌亮(1.2.1)、陈至奕(1.2.3/2.1.1)、冯里婧(2.1.2)、钱骏杰(3. 1.2)、张慈(3.1.3)、曹新(3.1.5)、曹湛(3.2.4)、韩旭(3.2.5)、方娴(3.3.1)、张健(3.3.2)、衣霄翔(3.3.3)、陈晨(3.3.4)。
除写作团队之外,感谢以下机构对本书内容提供了数据支持和技术支持(按文章收录顺序):
· 银联智惠信息服务(上海)有限公司(1.1.1/3.1.1/3.2.3)
· 滴滴大数据研究中心(1.2.2/3.2.2)
· 小猿搜题(2.1.1)
· BDP个人版(2.1.2/3.1.4)
· TalkingData(2.1.4/3.2.2/3.2.4)
· 阿里研究院(2.2.1)
· 大众点评研究院(2.2.2/3.1.2/3.1.3/3.2.5)
· 上海道融自然保护与可持续发展中心(3.1.5)
· 同策房产咨询(3.3.1)
本书由城市数据团这个活跃在互联网上的大数据团队完成。如果您看完本书以后,能够增加一些对这个数据时代的了解、愿意去热爱数据和使用数据,将是对我们莫大的鼓励。
城市数据团
2017年3月