今天是咱们的第二章。我要给大家讲清楚两个专有名词。这俩专有名词可不好讲,哪怕是计算机系的,到现在也很难把它们理解透彻。不过今天我要让每位读者都看懂、弄明白。之所以我一定要给大家讲明白,是因为只有搞清楚了,你们才能更好地理解未来的趋势和商业情况。
其实人工智能就三件事:算力、数据和算法。算法,大家都应该明白,通俗来讲就是那机器语言。在这里我主要跟大家说道说道算力和数据。首先我们来认识认识算力。
咱们都学过马克思的《资本论》,一个人或者一个时代想要获取财富,就得搞清楚生产力、生产关系和生产资料。要是理科生不太明白的话,我给大家解释一下。生产力就是在生产过程中,人们使用工具、设备、技术,把原材料转化成产品的能力。比如说,农业时代的生产力就是种农作物的能力;工业时代的生产力就是工厂里使用机器、通过流水线制造产品以及具备制造这些产品的能力。生产关系指的是生产过程中人们之间的经济关系和社会关系,简单说就是人们在生产过程中如何分工合作。在农业社会,生产关系就是地主和农民之间的关系,地主提供土地,农民负责耕种;在工业社会,就是大厂老板和工人之间的关系,老板提供设备、资源、场地,工人负责生产。生产资料就是用于生产产品的所有工具、设备、原材料,简单来讲,就是生产东西需要的材料和工具。在农业社会,像犁、种子、土地都是生产资料;在工业社会,机器、原材料、能源(比如碳、电力)等就是生产资料。
那我为什么要写这些呢?因为我要告诉大家,在新的时代,所有东西都变了,变得陌生了。而大家只有理解了这些,才能正确理解算力,算法,数据之间的关系。大家记住,在这个新时代,数据是新的生产资料,算力是新的生产力,算法是新的生产关系。今天这章课,我虽然没有具体去写算法,但是理解了算力也就自然能理解算法。因为全世界搞算法的就那么几十号特别厉害的人,还几乎都在美国。之所以咱们国家搞算法的人少,是因为算法需要极其复杂的数学能力。不过,就目前而言,普通人要是能理解算力和数据,就已经很了不起了。
我之前在自媒体就有提到过,未来一定是数字资产的时代。很多人问什么是数字资产,今天这章我也给大家讲明白。大家都应该知道算力和数据是驱动现代科技的核心,所以说算力的大小,数据的多少就是数字资产。至于算法,要是有一天ChatGPT能开源,算法其实就没那么重要了,因为大家得到的都差不多。那什么是算力?我用最简单的方法给大家解释一下,算力就是计算机处理数据的能力,就好比大脑思考的速度和能力。算力越强,电脑就能越快、更好地完成任务。那算力由什么决定呢?通常来讲是由芯片决定的。这就是为什么英伟达的市值那么高,因为到最后大家发现,算力的大小完全取决于芯片的能力大小。而芯片的大头制造商又是英伟达。这也是为什么算力这么重要。我们经常说被“卡脖子”,也是因为我们的芯片确实没有别人的强。计算机的基本工作原理靠的就是算力,计算机通过执行指令和处理数据来完成任务,这就是算力。那怎么提高算力呢?很简单,增加处理器的数量,算力就提高了。那怎么提升处理器的速度呢?在这里给大家推荐一本书——《算力时代》。不同的算力、不同的配置,计算机的性能就不一样。比如说,市面上常见的笔记本电脑价格差异很大,而苹果和华为电脑价格差异没那么大,为什么?因为它们的配置不同,配置高的就有更高的算力。为什么苹果和华为的电脑能卖这么高的价格呢?因为它不会卡顿,算力好,玩游戏、工作都不会卡,所以我多跟大家说一句,大家一定要买一台好电脑。手机也是一样的,算力越高,使用体验就越流畅,否则就会滞后、卡顿。
话说回来,我把算力这个词给大家解释清楚之后,后面再提到关于算力的很多内容,大家就不会觉得陌生了。要是没有算力或者算力处在很低情况,我们现在的生活肯定会大不一样。所以大家一定要看看《算力时代》这本书,这本书探讨了算力的未来走向,也间接的讨论了未来的生活。除此之外,咱们从历史的角度来讲一讲算力吧。从历史层面看,算力就是人类处理信息的能力,所以算力的发展历程就是人类处理信息能力的发展历程。这个历程从什么时候开始的呢?从人类进化出手指就开始有算力了,我们有两只手、十个手指用来数数,这就已经有算力了。为什么现在人们还用十进制算法呢?就是因为人只有十个手指,要是人有十一个手指,说不定就用十一进制了呢。到了中国的春秋时期,人们开始用长度、粗细不同的小棍子来记数。大家看《封神榜》就知道,周文王就是拿小棍子来算卦的。这些小棍子通过横竖不同的摆放来表示一到九,这就是算筹,这是人类最早的算力体现。算筹可以帮助人们实现基本的计算,但要是小棍子多了,或者涉及到加减乘除运算,就会比较麻烦。所以到了元代后期,就有了算盘,算盘取代了算筹,这可是咱们中国很厉害的地方。后来算盘流传到日本、朝鲜、东南亚,最后甚至还流传到了西方。不过,虽然算盘可以解决一些简单的算术问题,但要是遇到计算量特别大的,比如五百万乘以五百万,算盘就无能为力了,因为它的算力不够。这也是算盘被取代的原因。
到了1642年,法国有个数学家叫帕斯卡,他发明了一种滚轮式的加法器。这个加法器的外形是长方形的盒子,盒子里从右到左分布着定位齿轮,分别代表个、十、百、千、万。使用的时候,人们用钥匙拧紧发条来转动齿轮,顺时针转动齿轮做加法,逆时针转动做减法。这可是人类历史上第一台机械式计算工具,大家可别小看它,它对未来计算工具的发明有着重大的影响。因为30年后,德国著名数学家莱布尼兹在帕斯卡加法器的基础上,发明了莱布尼兹乘法器,这是历史上第一台能够进行四则运算的机械式计算器。大家知道,能做加减运算相对容易些,但乘除是一体的,乘就是除以多少分之一,除就是乘以多少分之一。
然后到了19世纪初,英国数学家查尔斯·巴贝奇又发明了一种更厉害的计算器——巴贝奇拆分机。大家可以看到,这个计算器不仅可以计算,还多了一个很重要的功能,就是可以把计算的东西存储起来。换句话说,就是算完之后能把结果记住。巴贝奇拆分机里有齿轮式的储存库,每个齿轮可以存十位数,由齿轮组成的列阵一共可以存一千个五十位数,这就是最早的数据存储。针对这些数据,巴贝奇还发明了一种分析机来分析数据。大家要知道,咱们现在使用的所有计算机都是这么来的,有了数据还不够,还得分析,而这种分析机就是由存储装置、运算装置和控制装置这三个部分组成的。直到现在,咱们所有的电脑还是这么个用法,还是这三个部分:存储、运算、控制。
到了20世纪中期,电子计算机出现了,人们的计算工具发生了质的变化,从机械工具变成了电子工具,从每一步都需要人工操作变成了下达指令后自动计算。而电子计算机的能力就是我们所说的算力,而算力取决于内部的芯片。这就是为什么我们老是强调芯片很重要,因为芯片决定了算力。通过讲述算力的历史,我想大家应该明白算力是怎么回事了。真正意义上算力成型是在20世纪中期第一台电子计算机诞生的时候。直到今天,我们会发现计算机的体积越来越小,运算速度越来越快,这就是摩尔定律的体现。从一开始计算机非常大,占地一百多平方米,像一栋房子那么大,到现在计算机小得像一本书,可以装进书包;从一开始每秒运行几百到几千次运算,到现在每秒能运行千万次、亿万次甚至更高。现在我们的智能手机、电脑把数据计算、图形计算、信号处理等多种功能集成在一个小小的芯片上,像智能手表、智能耳机、智能跑鞋、智能家居这些设备,之所以能够接收我们产生的行为数据,并且给出相应的反馈,就是因为它们内部有集成处理芯片。这一切都得感谢前面提到的巴贝奇,要是没有他,我们现在计算机的结构还不知道是什么样呢。所以现在计算机的专利,从算法、算力方面来说,大致就是这么来的。一句话总结就是:人类科技发展史的不断进步就是算力的提升,也就是对信息处理能力的提升。
讲完算力,咱们再来聊聊数据。咱们经常听到“大数据”这个词,因为大家都知道,我们现在在网上说的每一句话、打的每个字、拍的每一帧视频,全都是数据。数据越来越多,然后就慢慢的变成了大数据。大数据的特点就是容量大、类型多,而且随时随地产生新的数据。以前我们去买火车票,通行证只有纸质票,现在我们出行、吃饭、购物全部都在网上有记录,这些记录就是数据。所以说,一个人活到最后可能就是一堆数据。我们的出行数据、消费数据,还有打开微信运动看到的心跳数据、运动步数,几乎所有的行为慢慢都变成了数据。各位要知道,这些情况只是近些年才出现的,都是算力提升后,人们才有能力把人生中发生的事情变成数据,进而用来判断人的选择。以前你做了什么事,做了就做了,没人知道,现在只要你的手机在,你的数据就会被记录下来。就拿离婚来说吧,大家知道为什么中国和西方的离婚率越来越高吗?其实后来统计学家发现,很大一部分原因是手机,你的信息被对方看到了。以前你可能出轨了,出了就出了,没人知道,但是现在你出轨,你的数据就会被发现。所以数据是什么呢?数据就是我们人活过的一切的总和。
这些数据未来会越来越多,如果没有足够的算力,我们就没办法对这些数据进行收集、描述和归类,也没办法把数据放到数据库里,自然也就不能把这些数据应用到现实中。所以我给大家一个建议,要公开自己大部分数据,有人说要保护隐私,我告诉大家,数据放在那不用是没有意义的。数据只有公开才有用。那有人会问确确实实觉得隐私不可泄露怎么办呢?我的理解是,你认为重要的隐私就不要让它变成数据。但只要你觉得这个数据公开对自己有好处,那为什么不公开呢?尤其现在到了AI时代,像我的步数、我每天吃的东西等等,我都公开,为什么呢?因为只有这样对我的生活才更有帮助一些。那数据公开后是如何具体体现价值的呢?很简单,从数据到信息,再到知识。我给大家举个例子就明白了。比如说我在一家餐厅吃饭,餐厅老板收集了我的点单时间、点单菜品、付款金额,这些就是数据。这些数据对我有什么用呢?没什么用,就是简单吃个饭而已。但是把这些数据放到人工智能大模型里,长时间不停地计算,就能推断出顾客们对菜品的喜好,比如说有多少人喜欢这个菜,有多少人不喜欢这个菜,还有一天中不同时段客人点这个菜的可能性、流量的变化,这就是信息。再根据这些信息得到规律,餐厅老板就可以制定出什么时候该做什么菜、什么时候开门、什么时候关门,这就是知识。所以数据、信息和知识是有层级关系的,先有数据,然后通过人工智能把数据变成信息,再由人的大脑把信息提炼成知识。所以光有数据是没用的,一定要把数据经过系统的整理变成知识才有用。这就是为什么我跟大家说数据是这个时代的生产资料。现在大家应该知道数据和算力的关系了,因为数据越来越多之后,就必须要有强大的算力参与,每个人每天产生这么多数据,只有非常强大的芯片才能把这些数据通过运算落地,变成知识。
当然在大数据时代,光靠手机内部的芯片,算力也是不够的。我们出门在外总不能带一堆芯片提升算力吧,现实中再有钱也不可能这样。所以现在有个新词叫云计算,你可以把这些东西上传到云端,通过云服务器去整合计算,这是大数据时代一种重要的算力输出形式。通过网络把计算任务从本地转移到很远的地方,那地方有一个大的计算中心,而这个计算中心可能根本不在你的国家,在物理位置很远的地方。在那里计算完之后,再把结果传回本地,这样就节省了你手机本地的算力。我经常跟大家解释云计算是什么,大家看过《复仇者联盟》吧,钢铁侠和浩克打架的时候,钢铁侠召唤了一个装甲,这个装甲不是从身边召唤的,而是从天上召唤来的,然后制裁浩克。这就相当于一个独立于人类之外的超级大脑,把人类所有的信息都放在那里,因为人类的智能是有限的,所以你可以上传到那里就可以随时调用运算。比如谷歌,现在它的云计算拥有的服务器已经超过了一百万台,在加州、芬兰、比利时、亚太地区的日本、韩国、巴西等都有数据中心。谷歌的总部在美国,但它在全世界都有这样的运算中心,它的这些信息完全放在云端。我们中国的云端服务器目前是保密的,也不知道在哪里。不过根据中国信息通信研究院的预算,在2020年,我们的算力产业有两万亿元。各种直接、间接带动的经济产出加起来,大家有八万亿元。所以我们完全相信中国的数据中心已经形成了相当大的规模,综合经济数据来看,在算力产业上投入一块钱,会带动三到四块钱的GDP增长,而且算力产业规模每增长1%能撬动GDP的0.2%,这个数据是中国信息通信研究院发布的一篇文章里提到的。这也就是为什么在这本书里,我一直强调一定要拥抱AI,这里面有这么多钱的机会,你创业要是不跟AI沾点边,做事的时候要是不想想和AI有什么关系,你不去拥抱它,财富怎么会来到你身边呢?
最后给大家总结一下,数据、算力、算法构成了这个时代最基本的生产机制。数据就是新的生产资料,算力就是新的生产力,算法是新的生产关系。所以特别是在AI和科技领域,大家必须要弄明白这些东西代表着什么。像自动驾驶技术中的计算机,它处理了大量的实时数据,进行驾驶角色的转换,这就是现在的生产力。那这里面什么是生产关系和生产资料呢?不就是公司内部不同团队的合作或者是人和AI之间的互动吗?像数据、算法和软件工具等,这些就是生产资料。所以大家要知道,现在时代变了,一切都在数据化,生产力、生产资料等都在向数字领域倾斜。今天希望我已经把算力和数据这两点给大家彻底讲明白了。