本书希望提供一种整体和实用的视角,使读者能够成功地构建真实世界的自然语言处理解决方案,并将其嵌入更大的产品系统中。因此,书中的大部分章附有代码练习。本书还补充了大量的参考资料,供感兴趣的读者深入研究。全书处理问题的思路更是采用行业中的普遍做法:先从简单的解决方案开始,形成最小可行产品(MVP)后,再逐步构建更加复杂的解决方案。本书会根据作者自身的经验和教训给出适当的建议。每一章还会尽可能讨论相关专题的新进展。大多数章的最后会给出真实世界中的案例研究。

以构建聊天机器人或文本分类系统为例。在开始阶段,可用的数据可能很少,甚至没有。此时,不妨使用基于规则的系统或传统的机器学习来构建基本的解决方案。随着数据的积累,再使用深度学习等更复杂的自然语言处理技术(通常需要大量数据)。在整个过程中,每一步都有许多不同的方法可以选择。这本书将帮助你在选择的迷宫中确定方向。