2.9 小结

本章以数据的检索为切入点,主要介绍了搜索引擎的工作原理,对搜索引擎的核心模块如网络爬虫、网页分析、倒排索引、结果排序和中文分词等进行了详细说明,并介绍了近几年开源分词组件中Java语言栈的优秀代表Ansj和Jcseg。