从专利信息聚类角度出发,提高检索效率

2019-05-14 08:52涂丹辉
锋绘 2019年2期

涂丹辉

摘要:本文从专利信息聚类角度出发,通过对实际案例检索过程的分析,阐明了深入挖掘文献的属性,将具有相同或相近属性的文献进行聚类,对于提高检索效率的影响。

关键词:文献;专利;检索效率

对专利审查员来说,检索是日常工作的基础,快速、准确地找到合适的对比文件,直接影响到发明专利申请的审查周期和走向。常见的检索系统和检索方法已被大家所知晓,尽管如此,在实际工作中仍然存在检索效率低等问题。审查员在日常检索工作中,通常会利用分类号、关键词、主题等进行检索,这类检索过程本质上是对专利信息聚类的过程,即根据专利信息的属性,例如领域、主题、时间等等,将具有相同或相近属性的文献筛选出来。

下面将通过两个实际案例来介绍如何从专利信息聚类角度出发,提高检效率。

案例一:一种票据信息安全保护方法

权利要求:一种票据信息安全保护方法,所述的方法所使用的票务安全系统包括:票务数据中心服务子系统,安装在影院中并与各个影院售票系统连接的影院端票务数据安全服务子系统;其特征在于,所述方法的步骤如下:获取数字证书的步骤……,发出出票请求的步骤……。

案情分析:本申请的技术领域是票据信息的保护方法,具体涉及影院票据信息的保护。发明点在于采用了特定的系统架构,并通过多个步骤的安全及验证操作保证票房数据的准确与安全。

检索思路概述:在专利库中利用主题和分类号限定领域,初步检索没有找到合适的对比文件。考虑到各个行业大都有自身的行业标准或规范,本申请涉及到电影行业的票据管理,因此,在GOOGLE中利用检索词“电影(票务OR票据)(规范OR标准)”检索到《电影院计算机票务管理系统软件技术规范》,但该规范只能作为背景技术文件。

进而转入非专利库,在CNKI期刊库中对发明人进行了追踪,结果发现该发明人在《现代电影技术》这一刊物上发表过多篇与电影产业相关的文章,这一检索结果从另一方面给出了指引,即《现代电影技术》期刊中的文献大都是与电影产业或技术相关的文献聚类。依据刊物聚类的原则,限定刊名为《现代电影技术》并利用主题“票务”进行检索,在17篇文献中找到了最接近的现有技术。

小结:针对专业性较强的专利申请,可以尝试利用刊名这一属性,再结合主题、关键词等字段进行检索,可以有效缩小检索范围,提高检索命中率。

案例二:一种处理信息的方法及电子设备

权利要求:一种处理信息的方法,应用在包括有M条信息记录的电子设备中,所述M条信息记录有N条信息记录为与一主题相关的记录,其中,所述N为小于等于M且大于等于2的整数,其特征在于,所述方法包括:获得用于判断是否要收集所述N条信息记录的参数信息;判断所述参数信息是否符合一预设条件。

案情分析:结合对说明书的理解,可以认为权利要求中的处理信息的方法是指对邮件系统、会议管理系统或短消息系统中相同主题的信息进行收集的方法,通过设置触发条件进行信息的自动收集。

检索思路概述:首先确定分类员给出的IC分类号G06Q10/10(办公室自动化,例如电子邮件或群件的计算机辅助管理,时间管理,例如日历、提醒、会议或时间核算)是准确的分类号。在CNABS中进行初步检索:1 CNABS 12770(or消息,邮件)S(or回复,转发)2 CNABS 2680 G06Q10/10/IC3 CNABS 118 1 AND 2

对于初步检索结果进行概览有助于扩展关键词,确定其他准确的分类号,对调整检索策略大有裨益。

通过浏览检索式3的检索结果,发现这些专利文献的申请人大都集中在IBM,ORACLE,阿里巴巴,雅虎等公司,即,与本申请聚类度高的专利大都是由上述申请人所申请的。再联系到本申请在背景技术中提到的“现代信息技术为人们提供了许多高校、便捷的信息管理工具……例如,使用IBM的Lotus Notes邮件系统进行各种邮件信息的管理”,试探性地用IBM公司对申请人进行限定。

4 CNABS 13787(OR IBM,國际商业机器/pa√5 CNABS 8 3AND4

结果,在8篇文献中找到了X文献CNI01360092A。将文献浏览量从118篇缩小为8篇,显著提高了命中率。

小结:各领域大都有处于核心地位、掌握关键技术的申请人,例如,电子支付领域中的万事达、维萨、银联以及阿里巴巴,数据库领域的Oracle、IBM等,这些申请人在其擅长领域所申请的专利往往也代表着相关领域的技术走向。在检索过程中挖掘该领域或行业的龙头企业或领导者,对检索范围进行限定,有助于提高检索效率。