用户信息搜索策略转换模式研究

2020-08-14 06:16袁红
现代情报 2020年2期

袁红

摘 要:[目的/意义]搜索策略是搜索行为的规划,是搜索过程的核心,一直是搜索行为研究的重要课题。探索用户搜索策略的运用及其转换的规律,对于IR系统的功能优化及提升用户信息搜索效率具有重要意义。[方法/过程]研究确定了来自4个搜索主题的8个搜索任务,招募了30名参与者,开展了搜索实验,并对搜索行为视频加以编码,在统计不同搜索策略使用频次的基础上,构建了常见的用户搜索策略转换模式。[结果/结论]访问和评估策略是信息搜索的常见策略,而修改查询语句、学习等搜索策略运用较少。向前访问→评估单个项目、评估搜索结果→向前访问为用户信息搜索最常见的策略转换模式,而向前访问→探索等策略转换发生概率极低。此外,用户在搜索的不同阶段的策略运用及策略转换呈现较大差异,这为IR系统设计提供了详尽有用的指导。

关键词:信息搜索;搜索策略;策略转换

DOI:10.3969/j.issn.1008-0821.2020.02.006

〔中图分类号〕G254.9;G252.0 〔文献标识码〕A 〔文章编号〕1008-0821(2020)02-0044-08

On the Transformation model of Users Information Search Strategies

Yuan Hong

(School of Economics and Management,Nantong University,Nantong 226019,China)

Abstract:[Purpose/Significance]Search strategy is the planning of search behavior,the core of search process,and it has always been an important topic in search behavior research.Exploring the application of user search strategy and its transformation rules has important guiding significance for the function optimization of IR system and the improvement of user information search efficiency.[Method/Process]8 search tasks from 4 search topics were identified,30 participants were enrolled,and search experiments were carried out to encode users search behavior videos.Common transformation models of search strategies were constructed on basis of the statistics of the frequency of different search strategies.[Result/Conclusion]Access and Evaluation are the common search strategies,while Modify Query,Learning are seldom used.Access Forward→Evaluation Individual Project,Evaluation Results→Access Forward are the most common strategy transformation models,while the probability of strategy transformation models such as Access Forward→Exploration are very low.In addition,the users strategy application and strategy transformation in different design search stages would also show great differences,which provided detailed and useful guidance for the IR system.

Key words:information search;search strategies;strategy transformation

由于網络信息动态高速发展,网络环境的日益复杂,用户通过信息搜索获取所需信息难度也在日益加大[5]。对此,学者正努力探索用户网络信息搜索行为的特征和规律,希望设计出更好的搜索工具和更有效的信息组织方式,以应对信息爆炸以及随之而来的用户日益复杂的信息需求。搜索策略是搜索行为的规划,是搜索过程的核心,一直是信息搜索行为研究的重要课题。要深入了解信息搜索的动态过程,仅仅是识别搜索策略是不够的。搜索策略的运用及转换揭示了用户为实现其信息需求的连续的决策过程,是用户行为画像的核心要素。

在信息搜索过程中,用户选择多种搜索策略,如创建查询,点击超链接,并评估具体信息内容的相关性等,多重策略的转换链条构成了信息搜索过程的本质。在搜索策略分析中,策略之间的过渡可以作为一个分析单元或是策略本身[1]。目前国内学者只对搜索策略进行了概念性的描述,并以查全和查准为目标探讨了如何制定科学的信息搜索策略,且大多聚焦于单一搜索策略,较少研究关注了不同搜索策略间的转换[2-3]。因此,搜索策略及其转换模式研究具有重要的理论意义,同时,它还对信息检索系统的功能优化和用户信息搜索效率的提高也具有重要的指导意义。

2.4 實验流程

实验分为准备、实施、数据提交3个阶段。

实验准备阶段:通过QQ、人人网等平台发布实验者招募信息,实际招募30名,分别编号为1到30。在开始搜索任务之前,30位实验者需要填写背景资料的问卷,实验者阅读和明确搜索任务,实验人员介绍实验注意事项。

实验实施阶段:参与者根据自身情况完成两项搜索任务,自由选择网络查询系统和搜索策略来寻找相关资料,然后比较查询到的相关资料,选择实验参与者认为与搜索任务最相关的资料并保存下来,创建一个名为Morae的文件夹保存在指定文件夹。

实验数据提交阶段:收集并保存30位实验参与者的问卷及视频。

3 数据采集与数据编码

3.1 实验样本统计

搜索实验共回收有效视频30份。实验参与者的人口统计学特征见表2。实验参与者男女性别比例1∶2,大多为21~40岁之间的年轻人群,学历分布均衡,能较为熟练地操作计算机。

此外,30位实验参与者专业分布广泛,来自通信工程、信息管理与信息系统、电气工程、英语、纺织服装等6个专业。

3.2 数据编码

为了识别实验者使用的搜索策略,本研究在Xie I等[6]提出的基于互动意图的搜索策略的研究成果的基础上,确定了如表3所示的10种搜索策略,并进行了编码。

3.3 实验数据

通过视频数据分析,共识别出30位参与者执行60项搜索任务时的1 310项搜索策略。以实验者13的实验数据为例,该实验者选择的搜索任务为“最低工资标准”和“伦敦奥运会奖牌”,创建查询语句为“最低工资标准”、“里约奥运会中国奖牌数”。该实验者在搜索过程中搜索策略使用情况见表4,搜索策略转换频次见表5,不同阶段的搜索策略转换模式见表6。

统计汇总30位实验参与者搜索策略数据,展开以下的数据分析。

4 数据分析

4.1 不同搜索策略应用

4.1.1 基于整个搜索过程的用户搜索策略应用

整个搜索过程10种搜索策略的使用频次和比例如表7所示。

最常用的策略是向前访问(AF)。用户键入URL访问特定项目是网络信息搜索的主要策略,通过该策略不断接近搜索目标。第二个最常用的策略是评估单个项目(EI),用户信息搜索是理性决策行为,需要通过不断评估调整搜索策略,改变搜索路径。搜索过程中超过一半的策略应用都是向前访问或评估单个项目。评价搜索结果(ER)排第三,对搜索引擎返回结果相关性的判断是搜索的必经之点,发生的频次虽不及向前访问和评价单个项目,但也显示出搜索引擎返回结果的质量对于用户信息搜索的重要作用。

使用最少的是学习策略(LR),使用频次几乎可以忽略,这表明,用户的搜索努力是通过向前访问、评价单个项目、评价搜索结果、向后访问等诸多策略的频繁使用体现出来,而学习策略极少使用,这似乎与搜索过程也是一个学习过程的普遍认识相违背,从认知角度来说,搜索也是不断改变认知的学习,但本文界定的学习策略比较狭义,是获取特定系统特征、结构、数据内容,有学习如何使用之意,如谷歌地图的学习,相较于广义的学习,发生的几率要小得多,再加之实验任务的设定,也导致了该策略的极少应用。此外,在搜索过程中,保存记录(R)和修改查询语句(M)策略分别占比1%和3%,因为查询语句只是信息需求的表达,当用户需求逐渐明确后,更多的搜索行为是围绕着信息的评价和选择,查询语句不会频繁更改;保存记录策略使用少的原因在于从海量网络信息中获取有价值信息的难度越来越大,使得保存记录策略失去发生的前提。

4.1.2 不同阶段搜索策略的应用

表8显示,在搜索前期排名前5的搜索策略依次为向前访问(AF)、创建查询语句(C)、评价搜索结果(ER)、识别搜索线索(L)、评价单个项目(EI);搜索中期排名前5的搜索策略依次为向前访问(AF)、评价单个项目(EI)、向后访问(AB)、探索(XPL)、评价搜索结果(ER);搜索后期排名前5的搜索策略依次为向前访问(AF)、评价单个项目(EI)、向后访问(AB)、评价搜索结果(ER)、探索(XPL)。可以认为,搜索前期的策略运用与后续阶段差异较大,搜索中后期的策略运用较为相似。在各个阶段排名前5的策略中,向前访问(AF)、评价搜索结果(ER)、评价单个项目(EI)均在列,说明评价和选择一直伴随着用户的整个搜索进程。另一方面,除了各阶段排名前5的搜索策略外,其余策略的使用频次普遍偏低,均在5%以下,说明用户的实际搜索策略呈现部分策略主导的特点。

在搜索前期,识别搜索线索(L)、创建查询语句(C)和评价搜索结果(ER)的比例比后续阶段的都要高,用户处于需求表达、努力寻求信息线索并不断试探的状态。在搜索中期观察到的811次搜索策略中,向前访问(AF)和评价单个项目(EI)占比超过一半,且探索(XPL)策略的比例高于其它阶段。可以认为,向前访问和评价单个项目是用户在搜索中期的主要策略,且搜索中期的行为具有明显的探索性,通过搜索和学习,用户对搜索路径和搜索目标逐渐明晰。在搜索后期,评价单个项目(EI)比前两阶段的使用比例都高,且随着搜索的进行越来越多地评估具体的信息内容,相应地,评价搜索结果(ER)随着搜索的进行使用比例逐渐下降,意味着越接近搜索目标,用户的评估行为越聚焦于具体的信息内容,而非广泛地浏览判别搜索引擎的搜索结果。

4.2 常见的搜索策略转换模式

4.2.1 基于整个搜索过程的搜索策略转换

对30位参与者执行60个搜索任务的1 310个搜索策略编码统计,形成搜索策略转换矩阵(略),该矩阵每个单元格的值表示从行策略到列策略的转换频次。在10*10转换矩阵所表示的100对策略转换中,75对之间存在转换。最频繁的转换是AF→EI,共有142次。从AF到EI的切换表明,用户访问了某个项目,然后评估了它的相关性,该搜索策略组合不断推动着搜索向前发展。排在第二的转换模式是ER→AF,共发生122次,用户迅速评估搜索结果,继而访问有价值的信息项目。接下来的常见策略转换模式依次是“XPL→AF”(114次),“EI→AB”(96次)和“AB→ER”(91次),这几组转换模式充分体现了搜索过程的探索性和循环反复性。

另一方面,用戶搜索过程中存在大量的零转换和低频转换,如创建查询语句→向后访问的搜索行为没有观察到;不常发生策略转换也有很多,频次也都只有1~2次,如创建查询语句→识别搜索线索,向前访问→探索等,表明在用户的信息搜索行为的不确定性表面下仍然隐藏着确定的规律性。

4.2.2 基于不同阶段的搜索策略转换

选择表7中最常使用的7种策略(向前访问AF、评价单个项目EI、评价搜索结果ER、向后访问AB、探索XPL、创建查询语句C、识别搜索线索L)分阶段统计使用顺序和频次,结果见表9。

从表9可知,在搜索的3个不同阶段分别形成了如图1所示常见策略转换模式。

5 结论及启示

研究结论从3个方面为IR系统设计提供了指导:1)如何有效地支持不同类型的应用策略;2)如何有效地支持最频繁的策略转换;3)如何有效地支持信息搜索不同阶段的策略转换。

5.1 用户搜索策略使用偏好

为了有效地支持不同类型搜索策略的运用,研究人员需要了解用户的搜索策略使用偏好。向前访问(AF)和评价单个项目(EI)的应用超过50%。通过几次点击或输入URL可以向前访问,评估单个项目需要用户较多的认知消耗以判断项目的相关性、实用性和可信度。系统设计必须强调有助于用户判断项目质量的信息,此外,呈现和突出显示文档的原信息、提示最佳段落或生成摘要、直接提供具体信息相关的答案而不仅仅是在全文中高亮查询关键词都是行之有效的设计思路。

评估搜索结果(ER)是排名第三的使用策略。系统可以通过为Web文档提供简明扼要的摘要和信息替代,为用户评估搜索结果提供更好的支持。可以对搜索结果列表进行有更多的信息组织,如分类和概述。Kules B等[17]通过实验研究了用户对Web搜索结果分类概述的使用,结果表明,分类概述不仅有助于用户对结果的有效评估,而且能促使用户能够改变和采用新的搜索策略。

学习和探索是最少应用的搜索策略。用户在搜索信息时通常不愿付出更多的努力重新组织信息或重新构建查询,学习和探索难以展开。这与缺乏系统功能支持或帮助功能设计不佳有关。搜索历史记录和搜索路径可以是用户快速到达目标的有用工具[14]。因此,帮助页面应该被集成到实际的浏览和搜索页面中,应创建搜索历史和搜索路径选项,以辅助用户的学习与探索。

5.2 用户搜索策略转换模式

如何促进基本转换和如何减少不必要的转换是明确了用户常见搜索策略转换模式后需要思考的问题。基本转换是指搜索过程中关键的转换,不能被忽略,而不必要的转换是指可跳过或合并的转换。每种类型的搜索策略都有自己最常见的策略转换。对于IR系统来说,重要的是要帮助用户更有效和便捷地实现转换。而这些最常发生的转换模式有助于帮助IR系统预测接下来用户最可能使用的搜索策略,并提供支持该策略的功能选项。例如,向前访问(AF)→评估单个项目(EI)是最常见的转换模式之一。当用户单击链接或键入URL时,IR系统检测到向前访问策略,这时,系统就可以提供前面讨论过的评估单个项目的支持功能,以帮助用户快速准确地使用资源。

在搜索过程中搜索策略的应用并不总是“越多越好”。通过改进IR系统的设计,使用户实际操作时实现某些合并策略的功能,减少不必要的搜索策略的使用。例如,在评估单个项目(EI)后,如用户对此项目不满意,往往会向后访问(AB)搜索结果并识别下一个将要访问的项目。IR系统可以设计为将搜索结果保留在与所选项目相同的页面上进行评估,大大减少不必要的搜索步骤。此外,用户在搜索时如遇到一些访问问题,如死链接,系统错误等也会采用向后访问(AB),此时IR系统如果能指导用户进入更新的站点或相关站点将有助于搜索进程的推进。

5.3 不同任务阶段的用户搜索策略模式

由于不同阶段应用了不同的搜索策略,所以IR系统能够根据排名靠前的策略转换模式预测后续策略。因此,IR系统可以设计有不同的模板,对处于不同搜索阶段的用户提供支持,以引导用户搜索行为。在搜索前期,IR系统可以为用户提供两种类型的选项:便于用户通过检索词来搜索,或帮助用户根据最初识别的信息来探索。在搜索中期,对于喜欢通过输入查询进行搜索的用户,系统设计应该通过减少不必要的过渡来整合评估过程;对于喜欢探索的用户,IR系统的设计需要创建一个并行页面,可以探索更高或更低级别的页面。在搜索后期,IR系统可以整合用户的个人空间,以便用户可以多途径的利用信息,如将搜索结果引用到论文中或者通过电子邮件发送给同事等。

6 结 语

本研究不仅确定了最频繁和最不常用的搜索策略,而且分析了这些策略在不同阶段的应用。频繁策略的识别确立了用户网络搜索的关键行为,IR系统的优化必须促进这些必要的转换,同时也要化繁为简,减少不必要的转换,以减少用户的搜索成本。本研究最重要的贡献是通过分析搜索策略的顺序转换,总结了用户在网络搜索过程中最常见的行为模式,为建立真正以用户为中心的IR系统提供了切实的设计原则,以提升用户搜索体验。后续研究将结合用户个体特征研究其搜索策略转换模式,以期为基于用户分群的IR系统的个性化功能设计提供深入的指导。

参考文献

[1]Xie H I.Shifts of Interactive Intentions and Information-seeking Strategies in Interactive Information Retrieval[J].Journal of the Association for Information Science and Technology,2000,51(9):841-857.

[2]马海群,杨志和.身心语言程式视阈下的信息检索用户认知模型研究[J].中国图书馆学报,2011,37(3):38-47.

[3]代君,郭世新.协同信息搜索行为的触发情景因素探析——基于高校学生个人信息搜索失败情景[J].图书情报知识,2016,(5):62-72.

[4]Bates M J.Where Should the Person Stop and the Information Search Interface Start?[J].Information Processing & Management,1990,26(5):575-591.

[5]Marchionini G.Information Seeking in Electronic Environments[M].Information Seeking in Electronic Environments,1995.

[6]Xie I,Joo S.Transitions in Search Tactics During the Web-based Search Process[J].Journal of the Association for Information Science and Technology,2010,61(11):2188-2205.

[7]Bates M J.Information Search Tactics[J].Journal of the Association for Information Science and Technology,1979,30(4):205-214.

[8]Bates M J.Toward an Integrated Model of Information Seeking and Searching[J].The New Review of Information Behaviour Research,2002,(3):1-15.

[9]王庆稳.基于寻路理论的网络用户信息浏览行为研究[D].重庆:西南大学,2009.

[10]俞碧飏.信息偶遇概念与特点的实证辨析:以科研人员为例[J].情报学报,2012,31(7):759-769.

[11]Nachmias R,Gilad A.Needle in a Hyper Stack:Searching for Information on the World Wide Web[J].Journal of Research Technology in Education,2002,34(4):475-486.

[12]Croft W B,Lafferty J.Language Modeling for Information Retrieval[M].Springer Publishing Company,Incorporated,2010.

[13]Kim H N,Rawashdeh M,Saddik A E.Leveraging Collaborative Filtering to Tag-Based Personalized Search[C]//International Conference on User Modeling,Adaption,and Personalization.Springer-Verlag,2011:195-206.

[14]Zhang M,Jansen B J,Spink A.Information Searching Tactics of Web Searchers[J].Proceedings of the American Society for Information Science & Technology,2006,43(1):1-14.

[15]Wilson T D.Human Information Behavior[J].In-forming Science,2000,3(2):49-56

[16]Morae官網[EB/OL].http://www.techsmith.com/morae.html,2017-08-30.

[17]Kules B,Shneiderman B.Users Can Change Their Web Search Tactics:Design Guidelines for Categorized Overviews[J].Information Processing and Management,2008,44(2):463-484.

(责任编辑:郭沫含)