什么是人工智能?这个问题,问起来容易,回答起来难。原因有二。首先,人们对“什么是智能”没有达成广泛的共识。其次,至少就目前来看,没有足够的理由相信机器智能(machine intelligence)与人类智能(human intelligence)有很大的关系。

人们为人工智能下了很多定义。这些定义各有千秋,但基本上都围绕着一个概念——如何创造出一些计算机程序或者机器,让它们能够做出一些如若被人类实施则会被我们视为智能的行为。该学科的开创者约翰·麦卡锡(John McCarthy)在1955年将该过程描述为“让机器的行为看起来就像是人类所表现出来的智能行为一样”J. McCarthy, M. L. Minsky, N. Rochester, and C. E. Shannon, “A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence,” 1955, http://www-formal.stanford.edu/jmc/history/dartmouth/dartmouth.html.

然而,这种描述人工智能的方法看似合理,实际上却隐藏着深层的缺陷。举例而言,请设想一下定义人类智能有多难,更别提对智能进行测量了。我们的文化总是喜欢将事物还原成数字来度量,方便直接比较,但这种偏好却常营造出看似客观和精确的错觉。很显然,对智能这样主观和抽象的东西进行量化,亦是如此。小萨莉得到了幼儿园最后一个宝贵的招生指标,只因她的IQ比小约翰高了7分?!拜托——麻烦找点更公平的方法来决定吧。许多人试图应对这种过于简化的模型,其中一个例子就是发展心理学家霍华德·加德纳(Howard Gardner)。他提出了一个极富争议的理论框架——多元智能理论,认为人的智能是多维的,从“音乐–节奏智能”到“身体–动觉智能”,再到“自然观察智能”,总共包含8个维度Howard Gardner,Frames of Mind: The Theory of Multiple Intelligences, New York, NY: Basic Books, 1983.

不过,至少在某些语境下,说一个人比另一个人更聪明是有意义的。有一些测量智能的指标被人们广为接受,并与其他指标高度相关。例如,对数列进行加减的速度和准确度被广泛用来测量学生的逻辑能力和计算能力,同时还与关注细节的能力有关。但是,把同样的标准运用在机器身上,是否合理呢?在计算这个任务上,售价1美元的计算器就能轻而易举地打败所有人类,根本不费吹灰之力。在第二次世界大战之前,计算器的英文“calculator”指的是计算员,这是一种熟练计算的技术工。有趣的是,计算员通常是女性,因为人们相信,在这种艰苦的工作上,女性比大多数男性更仔细。那么,计算的速度是否可以看成是评判机器拥有卓越智能的标志呢?当然不能。

在对比人类智能和机器智能时,有一件大多数人工智能研究者都同意,却让问题变得更复杂的事,那就是“你如何解决这个问题”和“你能否解决它”同样重要。要理解这一点,可以想象一个会玩井字棋(tic-tac-toe,也叫noughts and crosses)的简单的计算机程序。在井字棋中,玩家们需要在一个3×3格子的棋盘上轮流画出×或者〇符号,直到其中一个玩家将三个相同的符号在横、纵或对角线方向连起来就算赢(如果所有格子都填满了却没有连起来,那么这种情况算平局)。

在井字棋中,一共有255168种可能的棋局过程。在当今的计算机学界,很容易通过一些方法玩出一局完美的游戏,这些方法包括:生成所有可能的棋局过程、标记出其中的胜局,以及在表格中查阅每一步的走法。这些对今天的计算机来说是相当简单的事情井字棋的棋局总数最多为9的阶乘(9!= 362880),但是许多棋局在棋盘填满之前就结束了。如果你将所有对称和循环都考虑进去,这个列表会骤减。其中,先发者胜的棋局为13891个,后发者胜的为44个,平局为3个。所以,你最好抢占先手。。但大多数人都不会认为这种微不足道的小程序算得上人工智能。现在,请想象另一种方法:一个计算机程序事先并不知道游戏规则,但它通过观察人类玩这个游戏的过程,不仅了解了怎样才算获胜,还学到了哪些策略最有可能胜出。比方说,它可能会学到:每当一个玩家将两个符号连起来时,对方玩家就必须堵上第三个位置;或者,如果一个玩家占领了三个角并且每两个角之间为空,那通常会获胜。假如存在这种程序,那么大多数人都会同意它算得上人工智能,尤其是因为它能够在没有任何指导或指令的情况下获得所需的专业技能。

但是,并非今天所有的游戏(当然,也并非所有有趣的问题)都能轻易地通过井字棋这种“列举法”来解决将案例或解决办法的集合一一列举出来的方法被称为“外延式”(extensional);而用描述的方式来定义集合的方法被称为“内涵式”(intensional)。。与井字棋相比,象棋大约有10120种可能的棋局过程,远远超过宇宙中原子数目的总和Diego Rasskin-Gutman, Deborah Klosky (translator),Chess Metaphors: Artificial Intelligence and the Human Mind, Cambridge, MA: MIT Press, 2009.。因此,很多人工智能研究都可以看作是在尝试为那些因为某些理论和实践的原因,而既不能用确定性分析,也不能用列举法来解决的问题寻找可接受的解决方案。但是,仅这一条描述还不够,许多统计学方法都符合这个标准,但很难被称为人工智能。

然而,有一件虽不符合直觉但却符合实践的事是:“从数量极其庞大的可能性中挑选出一个答案”和“凭直觉通过洞察力和创造力得到一个答案”二者似乎是等价的。关于这个悖论,一个更常见的表述是:足够多的猴子在足够多的键盘上最终能敲出莎士比亚全集。一个更现代的版本是:一段特定音乐的每个可能的演奏版本都能用一个有限的MP3文件集合中的某个文件来表现。从该文件集合中挑选出那个特定的音乐文件的能力,与录制该集合的能力相比,是否拥有同等的创造性?很显然,二者并不相同,但或许这两种技能都值得我们喝彩。

当我们给学生的作业打分时,通常不会考虑他们究竟是如何完成作业的,我们假定他们只使用了自己的大脑和一些必要的工具,例如纸和笔。那么,为什么将机器作为测验对象时,我们就要关心机器是如何完成的呢?因为我们理所当然地认为,人类在完成任务时使用的是某种与生俱来或后天习得的能力,而这种能力从本质上说能够推而广之,应用在十分广泛的相似问题上。然而,当一台机器在同样的任务上表现相同甚至更加优秀时,我们却不相信机器也拥有同样的能力。

将人类的能力作为评判人工智能的标尺还有另一个问题。机器可以完成很多人类无法完成的任务,而其中许多似乎都能体现出智能。一个安全程序可以在短短500毫秒内从一段不寻常的数据存取请求模式中嗅出网络攻击的味道;一个海啸警报系统可以根据海平面高度的变化来发出警报,这些变化反映了海底复杂的地形,对人类来说根本难以察觉;一个药物开发程序可以在成功的治癌化合物中寻找过去从未被人类注意到的分子组合,从而提出一种新的混合药物。在未来,这些系统将会变得越来越常见,但并不代表它们可以与人类的能力相提并论。然而,我们还是可能会将这些系统看作人工智能。

还有一个智能的标志是,看我们犯的错误是否合理。每个人,甚至智能机器都会犯错,但是某些错误却比其他错误更合理。理解和尊重自身的局限,允许出现合理的错误,是拥有专业技能的标志。想一想将语音转换成文字有多难吧!如果一个法庭速记员无意中将“她犯了一个错(She made a mistake),从而导致了他的死亡”听成了“她为他煎了一块牛排(She made him a steak),从而导致了他的死亡”,这个小错是无伤大雅可以原谅的J. A. Wines,Mondegreens: A Book of Mishearings, London: Michael O'Mara Books, 2007.。但是,当谷歌语音(Google Voice)把“用常识来识别语音”(recognize speech using common sense)错听成“报复一个美丽的海滩,你平静地唱歌焚香”(wreak a nice beach you sing calm incense)时,却招来了人们无情的嘲讽,一部分原因是我们认为它作为一个专门的语音识别软件,在自己的专长领域内应该更游刃有余才对Henry Lieberman, Alexander Faaborg, Waseem Daher, José Espinosa,“How to Wreck a Nice Beach You Sing Calm Incense,”MIT Media Laboratory,inProceedings of the 10th International Conference on Intelligent User Interfaces,New York:ACM,2005,278-280.令人啼笑皆非的是,我很怀疑这个例子可以用除英语外的其他语言来表达。如果你读的是中文版本,而这段话对你来说完全莫名其妙,请记住,翻译这个例子是不可能完成的任务,译者已经尽力了。