第3章移动搜索用户行为研究进展_Web用户查询日志挖掘与应用-QQ阅读都市男生网

书名：Web用户查询日志挖掘与应用
作者名：王继民
本章字数：9865字
更新时间：2025-02-28 04:51:36

第3章移动搜索用户行为研究进展

移动搜索用户行为研究是移动互联网和搜索引擎技术领域的研究热点之一。本章在对国内外相关研究进行系统梳理和归纳总结的基础上，综述了基于日志挖掘的移动搜索用户行为研究的最新进展，主要包括：移动搜索的特点和研究方法；基于日志挖掘的移动搜索用户行为研究流程、主要特征指标、技术方法、主要实证研究结果；对比分析了不同移动搜索用户行为特征的异同点等。

3.1 引言

随着移动通信技术的快速发展和移动终端的优化升级，越来越多的用户选择从移动终端接入互联网并进行信息检索，以满足随时随地产生的信息需求。移动搜索是指在移动通信网络中，用户利用各种移动终端、通过多种接入方式查找Web或Wap站点上网页内容的一种信息搜索方式。移动搜索发展势头强劲，到2012年12月底，我国手机搜索用户规模达2.91亿，较2011年增长了32.0%，使用率达69.4%[1]。

与传统桌面网络用户 (或称PC用户) 类似，移动互联网用户也进行登录、查询、浏览、点击、下载、退出等一系列操作；不同的是，移动用户的设备 (如手机) 更加私人化和固定化，所接入的无线网络可以定位其所在的地理位置，便于搜索本地信息。终端设备、网络环境、搜索情景的诸多不同，导致了移动用户的信息需求、任务驱动和PC端用户存在一定的差异[2]，如移动用户所搜索的信息内容与所处的位置高度相关、搜索时间具有碎片化的特征等。基于日志挖掘的移动搜索用户行为研究，已成为移动互联网领域的研究热点之一。

本章试图对移动搜索的概念和特点，基于日志挖掘的国内外最新研究成果、所使用的技术方法及其用户行为特征进行系统的梳理、总结和对比分析。

3.2 移动搜索及其特点

移动搜索是移动互联网与搜索引擎技术结合的产物。其中，“移动”强调的是基于移动通信网络的方式 (包括2G、3G、Wi-Fi等)，而“移动终端”是指可以在移动和无线环境中使用的电子设备，广义地讲，包括手机、笔记本、平板电脑、PDA、POS机甚至车载电脑；但狭义地讲，是指传统手机 (非智能机) 或者具有多种应用功能的智能手机 (如iPhone)、PDA及类PDA工具 (如iPod)、平板电脑 (如iPad) 等。“手机搜索”、“手机移动搜索”的相关提法通常就是在移动搜索概念中把移动终端限定为手机。我们可以把“手机搜索”理解为移动搜索的概念子集。在相关外文文献和报告中，“移动搜索”一般等同于“mobile search”“mobile information retrieval”“wireless search”“cellphone search”等概念名词。文献[3]认为，移动搜索引擎是建立在传统搜索引擎基础上的、和移动通信技术融合的、以适应移动互联网发展的搜索引擎。据此，移动搜索引擎可以定义为：根据一定的策略、运用特定的计算机程序从传统互联网和移动互联网上搜集信息，对信息进行组织和处理，为移动用户提供检索服务，并通过移动网络传输将相关的信息反馈给用户的系统。

作为传统PC搜索在移动端的延伸，移动搜索处理信息资源的过程和传统PC搜索有较大的相似性，均包括信息收集、信息处理和用户查询三个阶段[4]。广义上讲，“移动搜索行为也是信息资源管理的一种形式，是用户通过各种途径满足信息需求的一种途径”[5]。但是，在信息来源、网络环境、设备终端和用户需求等方面，移动搜索有其自身的特点，主要包括：①在信息源方面，移动搜索的信息源非常广泛，不仅包括传统互联网和Wap站点上的海量信息，还包括用户的当前位置信息，这些信息由内容提供商组织，并由各类搜索引擎服务提供商进行抓取和索引；②在网络环境方面，移动搜索程序通过无线网络接入互联网，一般按流量向用户收取资费；③在终端设备方面，最终的信息结果通过手机、平板电脑等移动设备反馈给用户，移动终端屏幕小、系统简单、输入不够方便；④在市场结构方面，移动搜索市场主体不仅包括传统互联网中常见的搜索引擎服务公司和信息内容提供商，还包括移动运营商、终端设备商、广告商等，而主体之间并不“各司其职”，而是尝试在产业链中通过前向一体化或后向一体化的方式占据更多的资源；⑤在用户行为方面，根据现有的研究报告，移动搜索用户行为表现为搜索时间碎片化、搜索内容随机性和即时性、搜索需求和附近地点高度相关等。

按照研究方法的不同，移动搜索用户行为研究可分为两大类：一是运用问卷调查、用户访谈、实验观察和日记研究 (diary study) 的方法研究移动用户的搜索行为，还原移动用户的搜索过程和情景，量化处理后可以验证相关假设、构建用户行为模型。所得到的结论不仅可以丰富用户信息行为研究的成果，还可以帮助各大商业搜索引擎公司和网站改进产品和服务。但实验和访谈的样本数量有限，这使得结论不可避免地包含一定的主观性，问卷和访谈脚本的设计也直接关系到结论的可靠性和实用性。二是通过日志挖掘方法直接分析用户与系统交互的日志记录，经过数据抽样、数据预处理、模式发现、模式评估等步骤进行用户行为建模，日志分析的结果可以有效理解用户意图和行为模式，改进系统性能与设计。

3.3 移动搜索用户行为研究框架

3.3.1 主要量化指标

对移动搜索日志的分析与挖掘可以有多个层面，每一层面都包含多项统计指标和多种方法。根据现有研究文献，我们将移动搜索日志分析的各项指标及其之间的关系进行归纳和整理，结果如图3-1所示。

图3-1 移动搜索日志分析的主要指标

按照“研究层级”的不同，移动搜索的日志分析依次可以划分为基础分析、深度分析和综合分析。基础分析的指标是用户日志的基础数据项，主要包括词项(term)、查询串 (query)、浏览中的点击 (click) 和点击流 (clickstream) 的基本统计与分析；深度分析是在基础分析之上，以独立用户 (user) 和独立会话(session) 为单位进行统计分析，分析的内容为一系列基础数据的集合；综合分析更复杂一些，加入模型和对比，如移动搜索和传统PC搜索模式的对比分析；智能手机用户、非智能手机用户和平板电脑用户的信息行为的对比分型；以及随着移动搜索的普及，不同年份之间数据特征的对比分析等。

(1) 词项级 (term)：对移动用户在查询中输入的“单个词”进行统计分析。包括词语本身、多语言混合使用和词汇误拼写等[6]。例如，统计每个单词包括的字数，并绘制分布图，统计中文和外文及混合输入的分别占比等。

(2) 查询串级 (query)：查询串是指用户一次性在搜索框中提交的字符串集。查询串分析一般包括：①查询串长度 (length of query)：查询串中包含的term的个数；查询串包含character的个数；考察输入字符串长度和输入时间的关系、查询串的字节数等。②高级查询的比例 (boolean queries)，如包含“AND、OR、NOT”的字符串的比例和内容特征。③查询串多样性 (query diversity)：统计不同查询串 (unique query) 数量占总查询串数量的比例；抽取被查询频次前N高的TOP-N查询串，生成它们的频率累积图；统计查询串重叠 (query duplicate) 出现的次数，观察得到的图形是否服从幂律分布；引入指标entro-percent[7]，利用信息熵的原理来定量考察一个用户在所有查询会话中意图的多样性。④查询内容和主题 (query topic)：对出现次数前N的不同查询串，按主题进行分类。主要有两种分类方法：人工分类和机器自动分类。其中，类别的选择可以参照传统PC搜索日志挖掘研究中的主题分类，方便进行对比研究；也可以按照“导航型、信息型、事务型”对查询串分类，考察不同类型查询串的比重。⑤语音查询串 (voice query)：考察语音输入的查询串的长度、内容特征等。

(3) 点击级 (click)：考察移动用户在搜索过程中点击的URL的特征。比如结果列表 (result list) 中前N个反馈结果的点击分布特征、用户在一个会话中的总点击次数及其分布等。

(4) 点击流级 (clickstream)：也称为路径分析，用以发现移动用户点击链接的规律，以及用户在页面之间的跳转情况。其分析项包括：查询和浏览转化率、引用来源的比例、高频点击路径等。点击率分析可以揭示用户兴趣路径，进而优化Web站点的拓扑结构。

(5) 用户级 (user)：在一段时间内 (比如一个月、一周或者一天，根据数据源来划定)，以用户为统计单位进行相应的分析。具体包括：①分析不同时间段用户的访问量、查询量和浏览量，如平均每天提交的查询 (浏览) 次数、平均查询 (浏览) 时长、查询 (浏览) 时间分布和查询 (浏览) 内容等。②进行用户细分。如根据新老用户区分、根据地理位置区分、根据终端设备区分等。对于移动搜索，不同的终端设备可能导致不同的用户行为[8]。

(6) 会话级 (session)：同一会话中可能包含一个或多个查询串，或者包含一个或多个点击。统计移动搜索会话中提交查询 (query) 的个数、包含主题(topic) 的个数、持续时间、发送字节数、查询修正 (query modification) 的次数等数据的分布规律及其特征。

(7) 行为级 (behavior)：在更大范围、更加宏观的角度考察用户的操作情况，对日志数据可用“不同的操作”作为分类方法，可以建立在会话、用户等基础之上。主要有三种分析方法。方法之一：根据日志的不同，把行为分为“查询行为”和“点击 (浏览) 行为”，并考察这些行为持续的时间、操作的内容等。方法之二：根据点击URL中文件的不同 (或者访问页面的不同)，把用户的行为分为登录、浏览、查询、下载、退出几种。方法之三：根据网站或者搜索引擎用户界面布局、根据“分析挖掘的目的”来区分行为。

(8) 用户行为建模 (model)：基于上述层级的分析结果，可进一步利用各种数据挖掘的模型和算法提取有意义的结论，如“用户兴趣路径”、“用户高频检索主题”等，同时可以加入时间、地理位置和终端设备等变量，深入分析用户行为意图和环境，进而构建用户的行为模型。

(9) 演化分析 (evolution)：移动搜索的发展历史虽然不长，但是从技术水平到用户习惯都在快速发生着变化，可以从更宏观的视角考察不同时段之间移动搜索行为的变迁。

(10) 对比分析 (contrast)：在上述各层级的分析过程中，可以进行多维度的对比分析，如提取同数据源中的桌面搜索数据，对移动搜索和传统PC搜索的各个方面进行对比；对不同地域用户的搜索行为进行对比；对使用不同设备的用户行为进行对比；对使用不同搜索方式和搜索软件的用户进行对比。

(11) 搜索情景 (context)：由于移动搜索更依赖于搜索的情景 (search context)，在日志分析的过程中，各种环境变量可以渗透到上述各级分析当中。文献[9]的研究显示：用户的使用情景 (use context) 对用户的互联网行为影响显著。而用户使用情景的信息 (contextual information) 又可分为两个维度：用户的个人属性信息 (personal context element) 和用户的环境属性信息(environment context element)。

3.3.2 分析流程

结合现有的移动搜索用户日志分析可以发现，移动搜索日志分析的研究流程和通常的数据挖掘流程类似，包括“数据抽样、数据预处理、分析挖掘、解释评估”等步骤。具体来说，首先根据日志分析的需要，对原始的日志数据集进行数据抽样，得到某一时间段内用户与系统交互的数据；然后对日志数据进行数据清洗、集成、用户与会话识别等数据预处理，得到结构化的数据文件；随后，利用多种数据挖掘方法从不同维度进行分析；最后，通过数据检验、实用性评估和可视化展现，抽取出具有解释用户行为意义和实用性的规则模型，并应用于移动搜索系统功能的改善和用户体验的提升。

在对移动搜索日志数据进行数据预处理和用户会话识别时需注意两点，一是抽取“客户端代理”(user-agent) 所包含的所有数据项信息，如：移动终端浏览器、移动终端操作系统、手机型号等信息。二是用户会话的时间间隔不宜太大，至多采用“IP+15分钟”来划分一个移动搜索会话。这是由于移动用户搜索时间的碎片性特征更为显著[10,11]。

3.3.3 主要分析方法

目前搜索日志分析主要采用Web使用记录挖掘及自然语言处理中的一些技术和方法，包括：统计分析方法、建模分析预测、序列模式发现、关联规则挖掘、聚类分析等。

(1) 统计分析方法

利用统计学方法对用户日志中的各种属性信息进行统计分析，包括数据序列的中值、平均值、标准差等基本数字特征的计算，这也是移动搜索用户日志分析中最常见和最基本的方法。如用户会话的长度、时间间隔、用户输入查询项的个数、用户查看结果页面的个数、用户平均点击URL的个数等。

(2) 建模分析预测

针对整个数据集合的建模分析是一个高层次和全局性的描述。例如，不同搜索日志分析都显示：用户的查询、点击URL、查看结果页面的频次频级分布通常具有Power-law的特征；查询过程中不同查询串和不同用户点击的数量满足Heaps定律。

在移动搜索领域，网络资源的大小、资源的流行性、用户请求到达的时间间隔等都具有power-law分布特征。这是一个“严重拖尾”的分布，相比于一般的指数分布，其尾部的衰减速度要慢得多，具有无穷大的均值和方差。

(3) 序列模式发现

序列模式发现是研究如何从用户对系统访问记录中发现相对时间或者其他顺序出现的模式或者高频率子序列。例如，王继民等[12]将用户的查询量、点击量、不同IP访问量分别看成是按时间顺序排列的随机变量序列，利用时间序列的分析方法，分别建立了北大天网用户的查询量模型、点击量模型和不同IP用户的访问量模型，并用以用户访问情况的分析和预测，该方法同样适用于移动搜索用户行为的建模分析。

(4) 关联规则挖掘

关联规则挖掘用以发现日志数据中各种项集之间的有趣关联或相互关系，常选用支持度 (support) 与置信度 (confidence) 来度量一个规则的有用性和确定性。Fonseca等提出了利用关联规则确定相关Web查询的方法，该方法同样可以用于发现移动搜索用户查询主题之间的一些关联，如基于位置的移动搜索用户查询主题之间的相关性研究等，这些结果可用于用户查询内容的预测。

(5) 聚类分析

与传统日志分析类似，聚类分析的目的是将具有相似特征的移动搜索用户、查询串或者点击URL进行分组，使得组内的对象具有较高的相似度，不同组中的对象差别较大。常见的聚类方法包括：基于划分的、层次的、自组织特征映射(SOM)、遗传算法等。

3.4 移动搜索用户行为实证研究

3.4.1 主要的实证研究工作

在过去的十几年中，基于日志对传统网络用户行为进行实证研究成果较多，如Jansen、Spink、Silversten等分析了Excite、AltaVista等大规模搜索引擎的用户日志[13,14]，马少平、刘奕群、王继民等研究了以中文用户为主的搜狗和天网搜索引擎的用户日志[15-17]，刘颖等研究了Web日志数据预处理方法和用户访问路径的提取[18]，张卫丰等基于用户查询日志分析了查询语义之间的相关性[19], Xiang B等分别就点击、查询串和查询主题提出基于情景的网页搜索的排序原则[20]。Hu B等改进了模仿用户检索行为的动态贝叶斯网络模型[21]。Liao Z等提出了从用户的查询日志中抽取查询任务的一种有效方法[22]。

近几年，移动搜索日志挖掘领域出现了一批有影响的研究团队和研究成果。可大致分为四类：①以Kamvar和Baluja为代表，针对Google移动用户日志的分析；②以Baeza-Yates和Jeonghee Yi为代表，针对Yahoo！移动用户日志的分析；③以Church、Smyth等为代表，针对欧洲移动搜索用户日志的分析；④以Alia Amin等为代表的结合用户所在情境的移动搜索日志分析。具体如下。

(1) 对Google移动搜索日志的分析

Google实验室的Kamvar和Baluja等基于Google用户日志先后发表了三篇重要的文献。其中，文献[23]的分析对象为2005年的两批Google日志，分别为普通手机检索日志和PDA终端检索日志。他们分析了超过一百万条的页面请求记录，研究了移动查询字符串的长度、查询内容、查询串与移动设备之间的关系等。文献[24]继续对2007年的Google移动搜索用户行为进行了分析，并选取了同样规模的日志数据，研究显示：用户的移动搜索行为沿着和传统PC搜索行为初期类似的发展轨迹变化。随后，在2009年他们把搜索终端分为传统手机、iPhone和传统PC三类，对三类设备用户的搜索模式进行了详尽的对比[7]，结果显示：高端手机 (如iPhone) 和PC的搜索行为更加接近，但移动搜索仍然是在没有PC情况下的替代性搜索方式。

(2) 对Yahoo！移动搜索日志的分析

对Yahoo! Mobile数据的研究也有三篇比较经典的文献。Modern information retrieval一书的作者Baeza-Yates在文献[25]中研究了一个比欧美更加成熟的用户群——日本移动搜索用户，其数据集为2006年手机终端与雅虎日本(Yahoo! One-search) 移动搜索服务器的一批交互数据，该研究把来自移动端的一百万个查询串和来自传统PC搜索的十万个查询串进行了对比分析。一年后，Jeonghee Yi等发表了另外一批雅虎移动搜索日志的分析结果[26]，这批日志包括美国、加拿大、欧洲和亚洲用户提交的近两千万条英文搜索样本。作者比较了美国和其他国家用户的搜索模式，同时也比较了用户在不同搜索应用中的行为特点。延续性地，Jeonghee Yi在2011年发表了对2010年Yahoo！日志的跟进调查[27]，同样发现用户的查询主题更加多样化，证实了移动搜索用户行为沿着传统PC搜索的轨迹发展。比较有特色的是，作者抽取了一些语音搜索的样本，发现移动语音搜索的查询串更长，描述性更加丰富。

(3) 对多个移动搜索引擎日志集合的研究

Church等所选择的数据集比较有特色，它不是来自单一搜索引擎，而是来自欧洲某移动运营商 (mobile operator) 的事务日志 (transaction log)，不仅包含单纯的用户查询行为，还包含了与查询相关的浏览和点击行为。文献[8]分析了2005年某一天的60万个手机用户的使用情况，特别关注了用户和30多个不同的搜索引擎的交互记录。该文把移动搜索用户的行为分为“信息查询行为”和“信息浏览行为”，并加以对比分析，同时对用户提交的查询串进行了深度分析，研究了用户在一个会话中是如何修改查询串的。随后，在2008年，他们继续对欧洲的移动搜索引擎海量用户日志进行探究[28]，通过与前期研究对比，他们认为移动搜索还处在发展的早期，搜索体验并不尽如人意。此外，他们对用户的搜索点击分布进行了较多的统计。2011年Church等对基于手机门户搜索引擎(portal-based mobile search) 用户行为进行了分析[29]，结果显示：用户在门户搜索引擎中提交的查询串更富多样性，包含具体网址的导航类查询所占比例更高。

(4) 基于位置情境的移动搜索日志分析

比较突出的成果是由Alia Amin等所做的一项实验性研究工作[30]，该实验同时使用了日志分析和用户调研两种方法开展研究，共有12名用户参加。通过特定的日志工具 (Web-Based Diary Tool) 搜集数据，包括Google移动搜索日志数据、移动用户位置信息和用户调查数据。研究显示：基于位置的查询内容共包括6大类，分别为商家名称 (business name)、商业类型 (business category)、地名(location name)、活动名称 (event name)、产品或服务名称 (product or service)和网址 (web address)。进一步，①查询需求的分析结果为：67.7%的查询需求表现为简单查询，即仅包括一种查询内容，其中商家名称占22.9%，包含地址信息的URL查询占12.1%; 32.3%的查询需求为详细查询，即由多种查询内容组成，“商家名称+地名”占比为13.0%。②查询主题的分布为：零售类占27.0%(电子产品店、家具店、书店等)，饮食类占24.5%(餐馆、酒吧、咖啡厅等)，娱乐类占13.7%(电影院、剧院、演唱会等)，交通运输类占10.3%(火车、汽车、地铁、出租车等)。③查询任务的分析结果为：42.7%的查询为事实查询(fact finding)，即寻找某一具体的信息，如查询某个电话号码；43.8%的查询为信息收集查询 (information gathering tasks)，如为是否买一件衣服查询价格信息。④情境分析的结果为：超过四分之三的用户查询是在他人陪伴时提出的，甚至某些查询是集体信息需求，这和用户的社交活动密切关联。移动搜索使得用户的即时信息搜索变得简单，也培养了用户随时随地搜索的习惯。

相关研究还包括Richard Schaller等[31]对特定休闲活动情境中移动用户的搜索行为研究，所分析的数据为：在2011年的慕尼黑博物馆的Long Night活动中，用户与为此活动定制的一款手机APP搜索系统的交互日志。

3.4.2 用户行为特征的比较

结合移动搜索用户日志挖掘的主要特征指标，对比分析国外三大移动搜索研究团队的主要研究成果，结果如表3-1所示。其中，文献[7]、[23]、[24]展示了美国用户使用Google移动搜索的行为特征；文献[25]～[27]为多个地区Yahoo！搜索的用户行为特征；文献[8]、[28]、[29]为非单一搜索引擎的移动用户特征。从表3-1可以看出，尽管搜索入口、日志数据集的大小、设备终端各不相同，但移动用户的搜索行为存在一些共有特征。

表3-1 基于不同移动搜索日志的用户行为特征比较

(1) 移动搜索查询串的多样性较低，并呈现逐年上升的趋势，即移动用户搜索不同查询串的分布向扁平化的方向发展。

(2) 移动搜索的查询内容有其自身的特点。主要表现在：搜索内容中导航型 (navigational，即用户查找指定的站点和主页)、信息型 (informational，特定页面内容可以满足用户的信息需求，如人名、路线、天气等) 较多，而事务型(transactional，带有探索性质，进入某一服务入口，进行下一步访问，如下载等)非常少。搜索主题中，成人和娱乐内容比例较高。用户提交query的表述比较明确。

(3) 移动搜索会话平均包含的query较少。可能的原因是：用户希望进行快速的事实性信息搜索，满足信息型搜索需求后即离开。用户输入难度略大，在一个会话中用户提交相同query的比例非常高，这可能是终端屏幕小，用户需要不停地翻页造成的。

(4) 移动搜索用户的结果点击比较稀疏。可能的原因是：移动信息资源不如传统互联网丰富，用户没有看到满足需求的锚文本；或者是由于移动搜索结果的优化效果较好，很多结果经过“富摘要”(rich snippets) 处理，使得用户在点击之前已获得所需要的信息，导致“好的点击放弃”(good abandonment)[32]。

(5) 不同地区的移动搜索行为有较大差异。如美国用户比欧洲和亚洲的用户查询串更长，所使用的词项更多。

(6) 不同搜索入口的移动搜索行为有一定差异。Google移动用户输入的查询串平均更长；Yahoo！的Wap平台用户更倾向搜索娱乐财经信息，但Yahoo! SMS短信平台用户会更多关注运动与体育类信息。

(7) 不同移动终端设备对用户行为有较大的影响。移动设备屏幕小、输入不方便已成为移动搜索最主要的约束条件。随着移动终端的智能化和大屏化，这些影响因素将逐渐衰弱，例如，高端手机 (如iPhone) 的用户行为和传统PC搜索更加接近。

(8) 移动搜索和传统PC搜索有很多共性，如查询串都比较短、绝大部分点击集中在前几页。移动搜索在“进化”过程中经历着和传统PC搜索相似的过程，目前移动用户的搜索行为和早期Web搜索引擎起步时的用户行为类似，但改变速度更快。

3.5 小结

用户日志记录了用户与搜索系统交互的整个过程，基于日志发现用户的行为特征与规律，可以有效地改进移动搜索系统的性能并提升移动搜索服务的质量。从事该领域的研究工作需要用到信息科学、计算机科学、数据挖掘、人工智能、人机交互、教育心理学、认知科学等方面的知识。就目前公开发表的学术论文来看，我国在实证研究方面的研究成果较少。

在对国内外相关文献进行系统梳理与归纳的基础上，本章阐明了移动搜索的概念与主要特点，并与PC搜索的用户行为特征进行对比分析；提出了基于日志挖掘的用户行为研究框架，包括主要量化指标、分析流程与主要分析方法；对相关研究成果进行了分类总结，包括来自Google、Yahoo！和欧洲运营商的移动搜索日志数据的实证研究以及基于位置情景的移动搜索用户行为研究成果。本章所综合的研究成果对移动搜索系统与Web电子商务站点的改进，以及类似移动用户日志挖掘具有一定的参考价值。

随着移动用户数量的快速增长，移动搜索日志挖掘已成为用户行为分析领域的一个研究热点。数据的难获取性是影响本领域发展的主要因素之一，而如何利用日志挖掘的结果进一步改善移动搜索系统的性能是一个需要重点研究的问题，综合利用多领域知识对移动用户日志进行深度挖掘仍有许多挑战性的工作要做。

参考文献

[1]中国互联网络信息中心．第31次互联网统计报告[EB/OL]. 2013, http://www.cnnic.com.

[2]Bouidghaghen O, Tamine-Lechani L, Boughanem M. Dynamically personalizing search results for mobile users[J]. Flexible Query Answering Systems, 2009:99-110.

[3]张金增，孟小峰．移动Web搜索研究[J]．软件学报．2012, 23 (1) 46-64.

[4]李晓明，闫宏飞，王继民．搜索引擎—原理、技术与系统 (第二版)[M]．北京：科学出版社，2012.

[5]王知津，韩正彪，周鹏．网络信息移动搜索的结构框架与技术机理探讨[J]．中国索引，2011, 9 (1):10-14.

[6]王继民，李雷明子，孟涛．Web搜索引擎日志挖掘研究框架[J]．数字图书馆论坛，2011 (8):25-31.

[7]Kamvar M, Kellar M, Patel R, et al. Computers and iphones and mobile phones, oh my! : a logs-based comparison of search users on different devices[C]. //Proceedings of the 18th international conference on World wide web, ACM.2009.

[8]Church K, Smyth B, Cotter P, et al. Mobile information access: a study of emerging search behavior on the mobile Internet[J]. ACM Transactions on the Web (TWEB), 2007, 1 (1):4.

[9]Lee I. , Kim J. Use contexts for the mobile internet: a longitudinal study monitoring actual use of mobile internet services[J]. International Journal of Human-Computer Interaction, 2005, 18 (3):269-292.

[10]Silverstein C, Marais H, Henzinger M, et al. Analysis of a very large web search engine query log[C]. //ACm SIGIR Forum, ACM.1999.

[11]Kim Y, Jeon S, Kim M. User needs of mobile phone wireless search: focusing on search result pages[J]. Human Centered Design, 2009:446-451.

[12]王继民，彭波．搜索引擎用户访问量模型[J]．计算机工程与应用，2004, 40(25):9-11, 30.

[13]Spink A, Jansen B J, Wolfram D, et al. From e-sex to e-commerce: web search changes[J]. Computer, 2002, 35 (3):107-109.

[14]Beitzel S M, Jensen E C, Chowdhury A, et al. Hourly analysis of a very large topically categorized web query log[C]. //Proceedings of the 27th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, ACM.2004.

[15]余慧佳，刘奕群，张敏，等．基于大规模日志分析的网络搜索引擎用户行为研究[C].第三届学生计算语言学研讨会．2006.

[16]王继民，陈翀，彭波，等．大规模中文搜索引擎的用户日志分析[J]．华南理工大学学报 (自然科学版), 2004, 32 (S):1-5.

[17]马少平，刘奕群，刘健，等．中文搜索引擎用户行为的演化分析[J]．中文信息学报，2011, 25 (6): 90-97.

[18]刘颖，彭赓，吕本富，等．基于Web日志的用户访问路径提取与分析[J]．情报学报．2009, 28 (4): 548-556.

[19]张卫丰，张迎周，周国强．基于语义和直值程度的相关查询客观度量[J]．情报学报．2012, 31 (6): 574-582.

[20]Xiang B, Jiang D, Pei J, et al. Context-aware ranking in web search[C]. //Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR'10. ACM, New York, NY, USA, 2010.451-458.

[21]Hu B, Zhang Y, Chen W, et al. Characterizing search intent diversity into click models[C]. //Proceedings of the 20th International Conference on World Wide Web. WWW'11. ACM, New York, NY, USA, 2011.17-26.

[22]Liao Z, Song Y, He L-w, et al. Evaluating the effectiveness of search task trails[C]. //Proceedings of the 21st International Conference on World Wide Web. WWW'12. ACM, New York, NY, USA, 2012.489-498.

[23]Kamvar M, Baluja S. A large scale study of wireless search behavior: Google mobile search[C]. //Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, ACM.2006.

[24]Kamvar, M, Baluja S. Deciphering trends in mobile search[J]. Computer, 2007, 40 (8):58-62.

[25]Baeza-Yates R, Dupret G, Velasco J. A study of mobile search queries in Japan[C]. //Proceedings of the International World Wide Web Conference.2007.

[26]Yi J, Maghoul F, Pedersen J. Deciphering mobile search patterns: a study of Yahoo! mobile search queries[C]. //Proceeding of the 17th International Conference on World Wide Web, ACM.2008.

[27]Yi J, Maghoul F. Mobile search pattern evolution: the trend and the impact of voice queries[C]. //Proceedings of the 20th International Conference Companion on World Wide Web, ACM.2011.

[28]Church K, Smyth B, Bradley K, et al. A large scale study of European mobile search behaviour[C]. //Proceedings of the 10th International Conference on Human Computer Interaction with Mobile Devices and Services, ACM.2008.

[29]Church K, Oliver N. Understanding portal-based mobile search: a case study[C]. //Proceedings of the 2nd International Workshop on Research in the Large, ACM.2011.

[30]Amin A, Townsend S, Ossenbruggen J, et al. Fancy a drink in canary wharf? : a user study on location-based mobile search[C]. Proceedings of the 12th IFIP TC 13 International Conference on Human-Computer Interaction: Part I, August 24-28, 2009.

[31]Schaller R, Harvey M, Elsweiler D. Out and about on museums night: investigating mobile search behaviour for leisure events[C]. //Proc. of Searching 4 Fun Wksp, ECIR, 2012.

[32]Li J, Huffman S, Tokuda A. Good abandonment in mobile and PC internet search[C]. //Pro-ceedings of the 32nd International ACM SIGIR Conference on Research and Development in In-formation Retrieval, ACM.2009.