学术期刊APP应用中交互式检索的情景设计与技术实现*

2019-07-22 05:35徐彤阳邓颖慧

数字图书馆论坛 2019年6期

徐彤阳邓颖慧

（1.山西财经大学信息管理学院，太原 030006；2.中国科学院文献情报中心，北京 100190）

约翰·麦卡锡在1956年第一次将人工智能（Artificial Intelligence，AI）引入学术研究领域，AI被看作21世纪继基因工程和纳米科学之后出现的第三大尖端科技，尤其AlphaGo的出现，更是使得AI成为热点话题，许多国家将AI技术发展列入国家战略规划[1]。随着宽带网络提速、上网资费降低以及移动智能终端功能的日益完善，手机上网呈现常态化。越来越多的用户使用智能手机设备来检索、加工和处理信息，打破了信息传播的时空及地域限制，为移动化信息获取、利用和共享创造了便利条件，且用户也经逐步养成利用碎片化时间快速获取信息的阅读习惯。海量的移动应用（Application，APP）逐渐成为互联网连接多媒体信息的触点[2]，同时也将其发展与信息科学技术紧密关联，AI技术的快速发展将会给移动应用带来巨大的影响，如何将AI与学术期刊自身特点相融合，显得尤为重要。

学术期刊作为期刊论文和科研成果发布与交流的平台，向读者提供了权威的信息资源，为学术资源的传播提供方便快捷的传播途径和清晰明了的表现形式[3]。学术期刊APP作为传统的学术期刊延伸到移动终端而创办的一种新的大众媒体，在智能手机上提供文献检索、过刊浏览、论文下载及信息订阅等服务，以满足用户快速获取相关文献与学术信息的需求，促使知识成果的转化，且可快速传播相关研究领域的发展前沿动态，促进相关学科的发展[4]，提升学术期刊的服务水平，扩大学科领域的影响范围。

虽然国内学术期刊APP在近几年有了突飞猛进的发展，但相对于国外学术期刊APP而言，我国学术期刊APP应用仍显得相对匮乏。目前国内学术期刊APP主要存在以下问题：①移动应用虽然对相关数据进行了一些处理（包括文本分类、添加标签等操作），但由于文献总体数量较大，分类粒度较粗，导致用户难以快速定位所需信息[5]；②学术期刊APP大多使用的是基于关键词匹配的简单文本检索，运用传统的布尔逻辑检索和空间向量检索，根据文档表示与相似度算法的匹配程度反馈检索结果，未充分考虑用户与系统的交互，当用户无法完整且明确地表达检索需求时，其检索结果无法满足用户需求。

本文针对国内学术期刊检索效率低、交互性差等缺点提出了一种智能交互式检索模型，该模型检索界面简洁明了，方便用户进行检索操作，并将用户的检索体验放在首位，着重分析研究用户需求、用户偏好、用户差异分析以及检索习惯等方面内容，增加用户、系统或学术资源提供者之间的及时互动和反馈操作，提高用户的参与度，增强学术期刊检索的简便性、易用性以及快捷性。通过实验发现智能交互式检索模型可有效提高检索效率，为APP用户提供更准确全面的学术信息资源。

1 交互式检索相关技术研究

信息检索主要经历了基于关键词、基于内容和基于用户交互的三个阶段，研究人员逐渐将注意力从文本数据的底层特征信息转向理解主题或接受者意图上。交互式检索是指用户由于自身学科知识和表达能力的限制，出现不能准确表达自身查询意图的情况，检索系统根据构建查询式、查询式扩展和相关反馈等技术和方式与用户进行实时的信息交互，系统根据用户提供的反馈信息不断修正查询式，逐渐接近用户真实的检索意图，为用户提供更为准确合理的检索结果[6]。

目前，交互式检索在多语言/跨语言信息检索中的应用较为广泛，相较于面向系统的信息检索，交互式检索的优势在于可根据相关反馈、查询式构造和查询结果优化等技术实现用户对检索的参与和控制，关注用户在检索过程中产生的反馈信息，增强用户和检索系统的交互性，进而提高检索准确率和用户体验满意度。多语言/跨语言信息检索是通过构建一种或多种语言的查询条件，从多语种信息的信息集合中检索出所需语种信息，建立用户与检索系统间的有机联系完成检索任务的一种信息检索模式。

国内外多位学者对交互式信息检索在多语言/跨语言方面做出了相关研究。吴丹[7]针对跨语言信息检索普遍存在的查询翻译歧义性问题，提出了一个英汉交互式跨语言信息检索系统，消除不同语言间的翻译歧义，将翻译优化和查询扩展等功能应用在检索系统中，可明显提高检索效果。朱榕等[8]针对数字图书馆中信息的查全率和查准率较低等问题，提出将语言自动处理技术和智能交互信息检索技术进行有机结合，加强和改善检索结果的质量和效率。Salim等[9]旨在识别和分析相关语言本体，以加强精确词汇表的使用，实现通过多语言搜索门户同时检索不同语言的检索功能。Ruecker等[10]利用多语言叙词表的语义丰富性，实现搜索、浏览导航和结果显示功能，为不同用户提供多样化的检索结果展示界面。

查询式的构造、推荐和扩展以及相关反馈技术是交互式检索发展的关键。吴丹等[11]采用系统日志挖掘法，考察了查询式关联性、查询重构模式等方面内容，实现通过查询推荐功能和高级检索功能等来提高检全率和检准率。刘畅等[12]通过对国内外相关文献的梳理，从查询式的构建和重构以及质量和效果评估等方面进行分析和总结概括，提出未来可加入语义信息来更深入地理解查询式的内涵。Yoo等[13]针对文档检索效率低等问题，提出基于伪相关反馈（Pseudo Relevance Feedback，PRF）的查询扩展技术，可有效提高检索的查准率和查全率。Almasri等[14]提出利用深度学习实现自动查询扩展，用于从含有数十亿个单词的大量非结构化文本中学习高质量的词汇向量表示方法，提高文本检索性能。Liu等[15]采用PRF算法，提出一种创新的PRF排序方法，将用户相关反馈与检索结果相联系。

随着AI技术突飞猛进的发展，交互式检索智能化程度较低等问题日益凸显。可借助深度学习技术，使交互式检索系统能够进行自我学习、调整和优化，使其更好地与数据库进行对接和信息交互，处理异构化、非结构化和多样化的海量数据。充分考虑用户的差别性，根据不同用户的检索喜好和需求，为其提供个性化信息服务，将用户情感融入检索过程。实现一种友好的人机交互检索模式，提高检索系统甄别用户检索意图的能力和检索的精确度，是交互式检索发展的趋势。

2 智能交互式检索模型构建

APP用户在进行智能交互式检索过程中，首先需登录学术期刊APP界面，在进行检索操作前，用户需构造查询式，学术期刊检索系统根据用户提交查询式的内容和期刊论文的头部信息进行特征提取，构建特征集合，通过用户特征集合与期刊数据库中的文档进行查询匹配，输出中间结果。若当前结果满足用户需求，则将检索结果返回给用户。如果返回结果不满足用户需求，检索系统将利用深度学习和相关反馈技术，进一步挖掘用户的信息需求来修正查询式，再次学习期刊论文深层内容特征，改变检索策略，过滤不相关信息，为下一次检索提供保障。检索系统通过对期刊论文内容特征和用户检索需求的深度挖掘，使检索结果逐渐接近用户真实的检索需求，从而实现学术信息资源的智能检索。智能交互式检索模型充分考虑用户的检索体验，为用户和学术期刊检索系统建立一种智能交互平台，可有效提高检索效率。智能交互式检索模型如图1所示。

图1 智能交互式检索模型

2.1 用户检索界面模块

该模块的主要任务是学术期刊APP用户进行构造查询式操作，包括用户设计、构建、确定和输入查询式的全过程。但用户在构造查询式时，大多取决于对检索内容的认知程度且普遍青睐于构建简洁的查询式[16]，多采用关键词间的搭配，因而导致检索结果不准确，传统的检索方式需不断调整查询式进行二次检索操作。本文采用互信息值指标考察关键词的内在关联性。用户可根据自身对检索内容的相关性判断，列出关键词构造查询式。智能交互式检索系统通过分析用户提交查询式的长度、内容和特征学习用户的检索行为偏好，优势在于用户可以随时进行查询式重构操作，得到top-ranked文档信息，选择符合检索需求的关键词重新构造查询式。关键词在构造查询式中扮演重要的角色[17]，简单的关键词搭配已不能满足检索的需要，深度挖掘其间内在联系，构建符合检索用户需求的查询式成为智能交互式检索的关键所在。

2.2 查询模块

2.2.1 特征提取

特征提取操作能够表征期刊论文内容的主要特征，是实现特征集合和查询匹配的前提条件。本文拟以期刊论文中出现的头部信息（包括标题、摘要和关键词等文本信息）作为内容特征，提取到的特征越能够表达期刊论文的内容，查询匹配的效果也将越好。因此，选择有效的内容特征是实现查询匹配的关键。本文采用基于概念特征的特征提取方法，先对期刊论文中的头部信息进行分词，形成词语集合；然后进行数据清洗操作，即去除停用词等无意义词汇；在向量空间模型（Vector Space Model）的基础上对清洗后的数据进行语义分析，将具有相同语义的词汇聚类，形成特征集合。降低文献处理的计算量，方便进行查询匹配操作。

2.2.2 查询匹配

在查询匹配阶段，对于任意一篇期刊论文，如果其中包含提取到的某特征词汇，则在该特征上记为“1”，若不包含提取的特征词汇则记为“0”。但在实际的查询匹配处理过程中，常出现空结果查询和多结果查询。即当用提交的查询式过于严格时，检索的结果可能为空；当用户提交的查询式过于宽松时，检索的结果又会出现多种组合。在这两种情况下，查询匹配操作可以根据特征标记结果自动选择排序检索结果，将最邻近用户检索需求的查询结果返回给用户，得到最优的查询匹配结果。

2.3 验证结果模块

验证结果模块功能实现的是用户主动参与的人机交互机制，主要是验证用户第一次构造的查询式是否可以得到满意的检索结果。当系统返回给用户中间结果后，通过用户交互来判断文献是否相关，如果对检索结果不满意，检索系统通过交互方式引导用户，结合深度学习和相关反馈技术修正和优化查询式并进行新一轮的检索。由于检索算法是既定的，检索效率的高低主要取决于用户构造的查询式，若用户输入的查询式不能有效命中检索目标，会大幅降低用户的检索满意度。智能交互式检索系统将根据用户第一次提交的查询式和检索结果，准确预测数据，优化查询式，得出更符合用户检索需求的集合。

2.4 查询优化模块

查询优化模块是整个智能交互式检索的关键，直接影响学术期刊APP检索的效果。在查询优化过程中，如果第一次查询结果未能满足用户的检索需求，系统将在深度学习计算基础上再次识别用户的需求，挖掘期刊论文潜在的特征信息，细化用户的兴趣偏好[18]，并将相关信息及时反馈给用户，对用户第一次提交的查询式进行优化。查询优化过程结合用户需求和期刊论文的特征信息，对原有查询式进行修改优化，再次进行检索操作，直到检索出用户满意的检索结果为止[19]。

2.4.1 深度学习

深度学习是机器学习的一个分支，源于人工神经网络，可通过组合底层特征形成更高层的属性特征，改善非结构化学术期刊论文数据特征表示，从学术期刊数据中挖掘出更多的潜在特征。深度学习在某些方面与人类大脑学习机制非常相似，可通过模拟人脑对文本数据进行解释和分析，不再单纯依赖人工提取数据的文本特征，深度学习可以尝试主动学习并自动完成文本特征提取操作，甚至还可以处理更加复杂的数据。如在文本特征提取操作中，深度学习可以挖掘出文本的底层特征（单纯和词组）、中间特征（短语和句子）以及高层特征（段落和文章），最终模拟人脑对文本信息进行语义理解，为检索模型的查询匹配提供前提保障。

本文利用卷积神经网络的模型训练深度学习文本类别标注器，对期刊论文信息进行特征标注。首先是卷积层，包括低层次的卷积层和高层次的卷积层，低层次的卷积层提取字、词和句子等，高层次的卷积层可以提取段落、章节和语义特征等，层次越高提取到的特征越抽象且越准确；其次是池化层，把具有相同或相似语义特征合并起来，提取到更精准的特征；最后是全连接层，将以上操作得到全部特征进行汇总，对期刊论文信息分类。虽存在耗时长、工作量大等问题，但在很大程度上提升了特征标注的准确率。

此外，深度学习在用户检索需求表达方面也发挥着重要作用。深度学习技术可以根据用户提交的查询示例、浏览记录等信息来确定用户检索需求，生成个性化的检索词。当用户在智能交互式检索平台输入检索词时，系统会根据用户之前的浏览记录自动推荐检索词，用户只需根据自身需求选择查询词进行检索即可。当用户提交检索词得出相关检索信息后，深度学习会为用户筛选出最符合用户需求的检索结果。用户可以不再受自身学科知识的限制，根据深度学习提供的检索词，在最短的时间内找到所需的期刊论文信息。

2.4.2 相关反馈

采用相关反馈技术可以减少在获取用户查询需求时产生的负面影响，减轻用户负担，通过用户交互来提高检索效率。由于信息检索有“以用户为中心”的服务宗旨，因此用户交互是跨媒体检索中很重要的一个环节。相关反馈技术的具体过程：当系统将检索结果返回给用户后，用户根据主观判断检索结果是否符合预期效果，若不符合可再次提交查询示例和反馈信息，检索系统根据反馈信息对查询示例进行二次检索。

本文采用的相关反馈算法是经典的Rocchio算法[20]，计算方法见公式（1）。将所有文档和查询式都表示成特征词权值向量，应用在空间向量模型中。在进行相关反馈操作时，通常将第一次检索得到的排序靠前的N项检索结果作为相关文档。

设Q0原始检索向量，Qnew是新的检索向量，Dr和Dnr分别代表相关和不相关文档集合，N和n分别表示检索得到的全部和相关文档的数量，N-n则表示不相关文档的数量。Di代表相关文档的特征词权值向量，Dj代表不相关文档的特征词权值向量。其中α、β和γ是可以调整的常量参数，有些系统为计算方便，常将α、β和γ的值设为1。可根据实际情况对系统变量进行调整，以获得最佳反馈效果。

3 仿真实验与分析

实验数据来自中国知网网站上下载的中文期刊数据集，由于学术期刊论文的关键词较明确，所以能获得比较清晰的结果。选定10类相关主题进行对比实验，它们分别是图书馆、学校图书馆、高校图书馆、公共图书馆、互联网+图书馆、图书馆服务、图书馆学、信息服务、读者服务、阅读推广。下载获取每类主题中的900篇期刊论文作为该类的数据样本，共得到9 000篇期刊论文文档的实验数据集并存储于期刊数据库中，将提取到的头部信息（包括标题、摘要和关键词等文本信息）作为内容特征存放在特征库。其中7 500条作为训练样本，剩余的1 500条为测试样本。

3.1 实验评价标准

在比较查询性能时采用标准的查全率R、查准率P来评价实验结果。查准率表明返回结果的正确性，查全率表明返回结果的完备性，两者之间相互制约，其定义为：查全率R即检索到的正确文档数与所有相似文档数的百分比；查准率P即检索到的正确文档数与检索到的相似文档数的百分比。

3.2 实验结果及分析

本实验采用对比实验法，分别对收集到的测试样本进行两组实验，一组是普通的关键词检索，另一组是智能交互式检索，共进行5次迭代，将查准率和查全率作为主要性能评价指标，得到两组实验结果（见表1）。两种检索方式的查全率对比见图1，查准率对比见图2。

实验对比发现，两种检索方式的查全率会随着查准率的升高而降低。智能交互式检索的查准率较高，其原因是智能交互式信息检索采用了深度学习技术，在查询式重构后的第二阶段检索过程中，能够使检索式信息更加准确且全面，可有效提高检索效率。而基于关键词的检索方式，用户对信息的描述都是自然语言的词语，文档与查询的关联程度取决于用户自身的经验知识和理解能力，且在检索过程中需要用户的实时参与，筛选和重新定义关键词，增加了检索系统的时间开销，检索效率难以满足用户的需求。

表1 两种检索方式检索结果 %

图1 两种检索方式查全率对比

图2 两种检索方式查准率对比

4 发展趋势与展望

近年来，国内外交互式检索的发展非常迅速，但在学术期刊APP领域仍处于发展阶段，通过研究发现未来的发展趋势可能侧重于以下3点。

（1）交互式检索过程中的用户体验。今后交互式检索研究将更多地引入心理学方法，准确分析用户检索行为，为其提供更智能的、全面的检索结果，开拓更人性化的检索界面，提高用户使用满意度。检索系统评价方式不再局限于查全率和查准率，成功的交互式检索系统须考虑用户的参与度，实现用户和检索系统的有机联系。

（2）将多媒体技术引入学术期刊APP中。随着时代的发展以及用户日益增长的检索需求，学术期刊APP会逐渐将文本、图像、音频和视频等多媒体内容引入APP中，为用户提供更加多元化的信息资源，支持学科发展和个人学术研究。如VR/AR技术可使得用户的视觉和听觉感官体验更加立体化。

（3）语义信息被广泛应用于检索系统中。要想从海量数据中快速获取符合用户需求的信息，需要挖掘数据的高层语义特征，揭示知识之间的区别和联系，形成统一的资源群体，提高系统的检索性能。

5 结论

从国内的情况来看，尽管互联网技术在学术期刊APP中的应用不断丰富，但随着海量数据的产生，单一检索已不能满足用户对学术信息的准确检索要求。针对这一问题，本文提出了一种智能交互式检索模型，将用户的检索体验放在首位，实现系统、用户和学术信息资源的实时交互及反馈，提高用户在检索系统中的参与度。通过实验发现智能交互式检索模型可有效提高检索效率，为APP用户提供更准确全面的学术信息资源。下一阶段我们将对检索模型和相关算法进一步深入研究，以期提高智能交互式检索系统的性能。