本书分为四个部分。图P-1 显示了其中的内容组织。有些章是独立的,与其他章没有直接联系,阅读时可以轻松跳过。

图P-1:本书结构

第一部分 基础,是本书其余部分的基础,给出了自然语言处理的概述(第1章),讨论了构建自然语言处理系统时所用到的典型数据处理和建模流水线(第2章),并介绍了自然语言处理中文本数据的不同表示方法(第3章)。

第二部分核心,重点介绍了最常见的自然语言处理应用程序,并强调了真实世界的用例。这些章会尽量就同一个问题给出多个解决方案,告诉你在不同的选项中如何选择。这些应用程序包括文本分类(第4章)、信息提取(第5章)和聊天机器人(第6章)。另外,这一部分还介绍了搜索、主题建模、文本摘要、机器翻译等其他应用程序,并讨论了实际的用例(第7章)。

第三部分 应用(第8~10章),侧重于大量使用自然语言处理技术的三个垂直行业,详细讨论了这些领域的具体问题以及自然语言处理在解决这些问题中的作用。

第四部分 综合(第11章),通过端到端部署自然语言处理系统来处理所涉及的实际问题,帮助读者将所学知识融会贯通。