- 大数据与人工智能导论
- 姚海鹏 王露瑶 刘韵洁
- 1756字
- 2024-11-28 17:12:43
1.2 人工智能
1.2.1 认识人工智能
人工智能(AI,Artificial Intelligence)最初是在1956年的Dartmouth学会上提出的。自此以后,众多的研究者们在发展理论的过程中,人工智能的概念也就逐渐扩散开来。从计算机应用系统的角度出发,人工智能是研究如何制造智能机器或智能系统来模拟人类智能活动的能力,以延伸人类智能的科学。
1.2.2 人工智能的现状与应用
随着AI技术的发展,现如今几乎各种技术的发展都涉及人工智能技术,人工智能技术已经渗透到许多领域,应用范围主要包括以下9个方面。
(1)符号计算
计算机最主要的用途之一就是科学计算,科学计算可分为两类:一类是纯数值的计算,通常是对函数、公式的求值;另一类是符号计算,也称代数运算,这种运算是对符号进行运算,并且符号可以代表整数、有理数、实数和复数,也可以代表多项式、函数、集合等。
(2)模式识别
模式识别就是通过计算机对数据样本进行特征提取,并用数学方法来研究模式的自动处理和判读。这里常说的模式是指文字、语音、生物特征、数字水印等环境与客体的结合体。
(3)机器翻译
机器翻译是通过计算机把一种自然语言转换成另一种自然语言的过程,用以完成这一过程的软件系统叫作机器翻译系统。它是计算语言学(Computational Linguistics )的一个分支,涉及计算机、认知科学、语言学、信息论等学科,是人工智能的终极目标之一,具有重要的科学研究价值。
(4)机器学习
机器学习是机器具有智能的重要标志,同时也是机器获取知识的根本途径。机器学习是一个难度较大的研究领域,它与认知科学、神经心理学、逻辑学等学科都有着密切的联系,并对人工智能的其他分支,如专家系统、自然语言理解、自动推理、智能机器人、计算机视觉、计算机听觉等方面,也会起到重要的推动作用。
(5)逻辑推理与定理证明
逻辑推理是人工智能研究中最持久的领域之一,其中特别重要的是要找到一些方法,只把注意力集中在一个大型数据库中的有关事实上,留意可信的证明,并在出现新信息时适时修正这些证明。
(6)自然语言处理
自然语言的处理是人工智能技术应用于实际领域的典型范例,经过多年艰苦努力,这一领域已获得了大量令人瞩目的成果。目前该领域的主要课题是:计算机系统如何以主题和对话情境为基础,注重大量的常识——世界知识和期望作用,生成和理解自然语言。
(7)分布式人工智能
分布式人工智能在20世纪70年代后期出现,是人工智能研究的一个重要分支。分布式人工智能系统一般由多个智能体(Agent)组成,每一个Agent又是一个半自治系统,Agent之间以及Agent与环境之间进行并发活动,并通过交互来完成问题求解。
(8)计算机视觉
计算机视觉主要研究的是使计算机具有通过二维图像认知三维环境信息的能力,这种能力不仅包括对三维环境中物体形状、位置、姿态、运动等几何信息的感知,而且还包括对这些信息的描述、存储、识别与理解。
(9)专家系统
专家系统是目前人工智能中最活跃、最有成效的一个研究领域,它是一种具有特定领域内大量知识与经验的程序系统。人类专家因其丰富的知识,能够高效、快速地解决相应领域的众多问题,基于这一事实,给计算机程序学习并使其灵活运用这些知识,也就能解决人类专家所解决的问题,而且能帮助人类专家发现推理过程中出现的差错。
1.2.3 当人工智能遇上大数据
大数据的发展离不开人工智能,而任何智能的发展,都是一个长期学习的过程,且这一学习的过程离不开数据的支持。而近年来人工智能之所以能取得突飞猛进的进展,正是因为这些年来大数据的持续发展。而各类感应器和数据采集技术的发展,人类开始获取以往难以想象的海量数据,同时,也开始在相关领域拥有更深入、详尽的数据。而这些数据,都是训练相关领域“智能”的基础。
与以前的众多数据分析技术相比,人工智能技术立足于神经网络,并在此基础上发展出多层神经网络,从而可以进行深度机器学习。与以往的传统算法相比,这一算法不像线性建模,需要假设数据之间的线性关系之类多余的假设前提,而是完全利用输入的数据自行模拟和构建相应的模型结构。这一算法特点决定了它是更为灵活的依据不同的输入来训练数据而拥有的自优化特性。
在计算机运算能力取得突破以前,这样的算法几乎没有实际应用的价值(因为运算量实在是太大了)。在十几年前,用神经网络算法计算一组并不海量的数据,辛苦等待几天都不一定会有结果。但如今,高速并行运算、海量数据、更优化的算法,打破了这一局面,并共同促成了人工智能发展的突破。