科技查新中ProQuest Dialog的专利获取策略

2016-08-24 07:21季叶克
图书馆学刊 2016年5期

陈 婷 季叶克

(华侨大学厦门校区图书馆,福建 厦门 361021)

科技查新中ProQuest Dialog的专利获取策略

陈婷季叶克

(华侨大学厦门校区图书馆,福建 厦门 361021)

专利文献是科技查新的重要文献,介绍了专利文献的有效检索方式:采用主题词和分类号组合检索,并在PQD平台上进行运用。同时分析了PQD检索结果的显示特点,另外根据德温特专利库的特点,提出从其他专利数据库中查找德温特原始专利的途径,旨在充分利用PQD资源提高专利检索效率。

ProQuest Dialog(PQD) 科技查新专利文献德温特专利

1 专利文献在科技查新中的重要作用

科技查新是查新机构运用信息资源,通过文献检索手段,对委托项目的科学技术内容进行查证,根据检索结果的对比分析得出客观性结论。科技查新要求信息资源必须广而全,以公开发表的出版物为查证资源,公开出版物包括期刊、专利文献、图书、标准文献、学位论文、报纸、科技报告、政府出版物、产品资料等。在这些文献类型中,专利文献是以一个标准的方式形成的独特的信息源。专利文献拥有庞大的信息量,内容广博,几乎涵盖了所有的技术领域,包含了世界上95%的研发成果。专利文献信息及时并以最快的速度集合了最新技术,且80%发明创造只在专利文献中公布,是科技信息的重要来源,具有其他信息查询不可替代的价值。科技查新的课题多是查证工艺技术、方法设备或性能指标,这些技术方案和技术效果都完整详尽地记载于专利文献中,专利文献对技术特征分层次公开,内容相对真实可靠,给待查证的技术内容提供了明确的对比资料,是科技查新的必查文献。

2 PQD专利数据资源

2.1PQD特点

Proquest Dialog是科技查新的强大工具,其数据库整合了全球国别最全的专利信息资源,收录了96个国家和组织的专利数据,专利数据库40个,包括31个国家和组织的英文翻译专利全文数据库以及65个国家和组织的摘要级别专利数据库。PQD平台具有如下独特的优势:①精确的指令算符和指令有助于快速准确命中文献;②检索人员可以根据需要自由组合专利库;③对检索结果去重,命中的同族专利只显示一条专利信息,适用于INPADOC和全文专利数据库。

2.2PQD专利信息检索策略

PQD提供了基本检索、高级检索、命令行、查找专利4种检索模式。查新人员或专业检索人员一般采用命令行检索,以检索字段和指令算符制定检索策略,提高检索效率。为获得比较全面而准确的检索结果,查新人员必须分析技术主题,确定检索要素,规范使用检索词,制定正确的检索策略式。

2.2.1检索要素确定

在专利检索中,最常用的两种检索要素是主题词/关键词以及专利分类号。主题词或关键词是代表技术特征的相关词,能够反映技术主题的实质,选择专指词、专业术语、通用术语、特定概念、意义明确的词汇作为主题词或关键词,同时注意词汇的扩展,从多角度考虑同一技术概念的多种表达方式,充分利用词表、辞海、术语标准、词典等工具书,以及从已检出的文献中,扩展检索用词。在PQD平台,系统会自动查找单词单复数、英美拼写变体和形容词比较级、最高级等形式。

专利分类号代表技术主题所对应的专利分类类别,是体现技术概念的另一种表达方式。世界各国一般有自己的分类体系,除使用自己编制的专利分类系统外,还采用国际间通用的专利文献分类系统即国际专利分类(IPC)。采用IPC分类号进行专利信息检索时,可以直接查阅IPC表选定分类号,或者借助辅助分类工具查询,从技术主题中选出主题词,对照“关键词索引”或“分类表索引”找出该技术主题的大致分类,也可以进入分类查询系统,通过输入关键词查询分类号,然后用分类表进行分类位置验证。

2.2.2检索式构建

检索式将检索要素的表达按照一定的逻辑关系组合起来,同一概念面的检索要素采用逻辑“或”运算关系,不同概念面的检索要素的表达用逻辑“与”连接。

案例:抽油烟机专用电动止逆阀

第一概念面:抽油烟机

第二概念面:止逆阀

基本检索式:抽油烟机and止逆阀

对各个概念面分别进行主题词和分类号表达:

主题词:①抽油烟机/吸油烟机/排油烟机/油烟机/抽烟机

②止逆阀/逆止阀/止回阀/防逆阀/单向阀

IPC分类号:①“抽油烟机”分类号F24C15/20,F24F7/06,

F24F7/007

②“止逆阀”分类号F16K15

电动阀分类号:F16K31/04

检索式直接关系到检索质量与效率,检索式应完整而准确地反映出信息检索的主题内容,从多个角度、不同层次进行表达,采用不同概念面的主题词与主题词组合、分类号交叉组合(分类号与主题词组合、分类号之间组合)检索,查新工作实践表明,两种途径互补检索能得到令人满意的结果。

①两个技术主题词进行组合

(油烟机or烟机)and(止逆阀or逆止阀or止回阀or防逆阀or单向阀)

②分类号与主题词组合

抽油烟机的分类与止逆阀的主题词组合:

(F24C15/20 or F24F7/06 or F24F7/007)and(止逆阀or逆止阀or止回阀or防逆阀or单向阀)

止逆阀的分类与抽油烟机的主题词组合:

(F16K15 or F16K31/04)and(油烟机or烟机)

③油烟机分类号与止逆阀分类号组合

(F24C15/20 or F24F7/06 or F24F7/007)and(F16K15 or F16K31/04)

得到4组符合“抽油烟机止逆阀”主题的结果,最后采用“电动”进一步限制检索。

2.2.3PQD平台专利检索

在PQD平台进行专利检索,检索式的组配必须符合该系统的功能及限制规定,检索要素要与该系统的索引体系和检索语法规则相匹配。PQD检索语法[5]有:逻辑算符“and,or,not”;通配符“?”和截词字符“*”;位置算符“P/n,N/n”。PQD支持多条指令同时检索和对检索结果进行组合或二次检索,多个检索式可以先进行独立检索,再组合检索。选择PQD中31个专利全文数据库和德温特世界专利索引库(DWPI)进行检索,将主题词或关键词限定在题名(ti)、摘要(ab)和权利要求书(clm)检索字段。

以上述案例为例,先列出主题词在PQD表达式:

油烟机:range p/1hood/extractor p/0 hood/vent*p/0 hood/ lampblack p/1 machine/smoke p/0 exhauster/fume p/0 extrac⁃tor/extractor p/0 fan

电动止逆阀:electric p/0 check p/0 valve/motorized p/0 non p/1 return p/1 valve/electric p/0 clack p/0 valve/electric p/ 0 one p/1way p/1 valve

PQD的检索格式:字段代码(检索式or检索词)

在命令栏中输入以下检索式,分别对应上例的4个中文检索式:

①ti,ab,clm((range p/1 hood or extractor p/1 hood or vent*p/1 hood or lampblack p/1 machine or smoke p/0 exhaust⁃er or fume p/0 extractor or extractor p/0 fan)and(electr*or mo⁃torized)n/3(check p/0 valve or non p/1 return p/1 valve or clack p/0 valve or one p/1 way p/1 valve))

②ipc(F24C15/20 or F24F7/06 or F24F7/007)and ti,ab,clm((electr*or motorized)n/3(check p/0 valve or non p/1 re⁃turn p/1 valve or clack p/0 valve or one p/1 way p/1 valve))

③ti,ab,clm((range p/1 hood or extractor p/1 hood or vent*p/1 hood or lampblack p/1 machine or smoke p/0 exhaust⁃er or fume p/0 extractor or extractor p/0 fan)and(electr*or mo⁃torized))and ipc(F16 K15 or F16K31/04)

④ipc((F24C15/20 or F24F7/06 or F24F7/007)and(F16 K15 or F16K31/04))and ti,ab,clm((electr*or motorized))

分别得到S1,S2,S3,S4的检索结果集合,然后合并这4个检索结果,命令行中输入:S1 or S2 or S3 or S4

在“预览检索结果计数”中仅显示出命中结果数目(图1所示),再进入检索结果界面,点击“每个家族显示一个成员”,删去重复文献。上述案例列出了PQD检索式的构建过程,当然检索式的制定不是一挥而就,需要在检索过程中视检索结果情况而进行调整。

图1 PQD命令行检索专利

2.3PQD平台专利结果的显示

PQD专利的显示方式分别为粗略、详细、kwic3种(专利的KWIC和详细显示信息相同),其中kwic为收费项目。粗略显示只有专利名称、专利国别代码、公开时间、专利来源。由于显示信息有限,不利于进一步筛选相关文献,所以一般要选取详细显示来查看命中结果。PQD集成了多个专利库,不同专利数据库其检索结果有不同的显示格式,各国(中国、欧洲、美国、WIPO等)全文专利库的显示信息不仅包含粗略显示的内容,还包含检索词的句子、部分绘图和预览项目,其中检索词以黄色字体显示,“预览”项还给出了部分摘要、IPC分类号、ECLA分类号、美国分类号等。德温特专利数据库显示出的信息量很少,只有标题、更新时间、包含检索词的相关句段,在“预览”项仅显示分类号,如IPC分类号、德温特分类号和手册代码。在PQD平台上各专利数据库显示的信息如表1所示。

表1 来源于不同专利库的显示信息

各国专利库的专利可以从专利申请国官方免费专利库中搜索下载得到全文。德温特专利数据库比较特殊,其以标题的检索方式只适用于德温特专利库,在其他专利库上则找不出指定专利,原因是德温特专利数据库对原始专利的发明名称和摘要进行了更改。

3 PQD专利数据库的利用

专利检索中,笔者选取了PQD中31个国家专利库作为检索对象。各国专利库出版的专利文件结构一致,包括扉页、权利要求、说明书、附图等几部分内容,唯一区别是各国专利局所采用的分类方法有所不同,并且各国专利库收集的专利是原始文献。与这些国家专利库相比,德温特专利库是加工数据库,是二次文献,德温特专利的内容、排版方式不同,在PQD显示的信息也不同,由于该库在查新工作中应用的频率较高,也是查新不可或缺的专利库,因此,笔者对德温特专利进行详述。

3.1德温特专利数据库特点

德温特专利数据库(Derwent Innovation Index,DII)对原始专利数据进行人工整理,由各个行业的技术专家重新编写形成具有描述性的英文标题、摘要。加工后的标题准确清晰地揭示了发明的内容和创新性。在摘要部分,提供更详细的发明技术概括,强调了技术的用途和优点。经过DII深加工后,避免了专利本身的摘要概括不当、拼写错误等造成的漏检,研究人员可以快速获取全面而准确的专利文献。DII数据库是商业集成专利系统,只有购买该数据库资源才能进入检索系统,而对于条件受限制的机构而言,则无法使用DII数据库。

3.2挖掘PQD的德温特专利数据的潜在内容

3.2.1德温特数据库的“隐形”信息

PQD平台具有统计分析功能,能对命中结果进行分析筛选。统计分析功能包括:对检索结果的排序、同族专利去重以及一些缩小检索结果的条件,如专利受让人、专利受让人国家、发明者、分类号等。统计分析栏项目可以作为显示结果的补充。对于检索命中的结果,在统计分析功能中可以进行二次检索,选择相应的筛选条件,提炼出更符合需要的目标文献。对于单篇专利,统计分析栏列出了单篇专利的其他著录信息,即专利受让人、发明者等信息,其获取步骤是:在PQD检索栏输入单篇专利的标题找出这篇专利,在统计分析栏依次点开“专利受让人/专利权人”“专利受让人国家”“发明者”即可显示具体信息。所以,从PQD平台还可以得到除标题外的其他信息,这些信息往往成为查询专利的重要线索。

表2 德温特专利库在PQD中显示部分的信息

3.2.2德温特专利信息的利用

由于DII数据库对原始专利进行了修改,所以以标题的方式检索只适用于DII库,其他专利库则采用原始专利数据信息进行检索,从统计分析栏找出的“专利权人”“发明者”,其能否作为检索信息有待验证。

PQD的蓝页说明书给出了德温特专利样本文件输出格式(如图2所示),内插图是原始专利信息。以优先权号EP20037663A为例,德温特专利的专利权人与原始专利保持一致,发明者采用缩写名方式,因此,可用“专利权人”全称、“发明者”中的“姓”搜索德温特专利的原始专利信息。关于人事的著录项目,德温特专利保留原始专利数据,若原始专利的公司名称或人名名称有误,则对错误的拼写、不正确书写格式等进行修正。

虽然德温特专利对原始专利的某些方面进行更改,但它并未改变原始专利的技术特征,其与原始专利的发明实质一致。在PQD平台进行检索时,德温特专利与它的原始专利可能同时命中,但检索结果不能去重,需要人工判断是否为同一专利。在“高级检索”或者“查找专利”检索模式中,通过输入指定专利的专利权人和发明者,就可以检出同族专利以及德温特版本的专利信息。德温特专利也可采用这种方式找到它的原始专利。以图2专利为例,在PQD平台以专利权人“ALTANA PHARMA AG”和发明者“ALSTERS”进行检索,得到12个结果,其中11篇专利来源于各国专利库,1篇是德温特专利。前者构成专利族,任意一篇都可以作为德温特专利的原始专利。

图2 PQD蓝页德温特专利样本格式(内插图是原始专利内容)

4 目标专利下载策略

专利全文可以到已购买商业集专利库、官方专利库或其他免费专利网站下载。由于从PQD里筛选的专利文献来源于不同数据库并涵盖多个国家,所以最直接的方式是从PDQ导出专利全文,但这需要一定的费用,而专利文献是开放的资源,可以寻找免费方式。若按照专利国别逐一访问各国官方专利网站,效率很低,而且不能快速找出来源于德温特专利库的专利。其原因在于PQD提供的免费信息里没有德温特专利的国别,需要查找它的原始专利来源方能到相应的国家专利库获取全文。一些开放的专利搜索引擎有着丰富的专利资源并能够提供全面的专利信息检索,其原文获得性高,速度快,对于PQD选中的专利,数量不多且具有多国别种类,专利检索引擎基本上可以满足指定专利的查找,成为下载目标专利的首选工具。几个具有代表性且免费开放的世界专利搜索引擎如表3所示。

表3 可免费利用的专利检索下载网址

续表

任意选择上述专利搜索网址,在检索栏项以专利权人结合发明者、分类号的方式作为检索条件就可以在其他免费专利库中找出德温特专利的原始专利。世界各国专利也能在上述网站搜索,以专利名称为检索条件可快速找到特定专利。

5 结语

PQD平台强大的资源优势已成为科技查新的有力保障。在专利文献检索方面,查新人员应根据专利文献的特点和PQD的检索语法,编制有效的检索策略,充分利用PQD检索功能和显示信息,选择适当途径获取专利全文。

[1]闫冬.浅谈科技查新中专利文献的检索与利用[J].科技情报开发与经济,2015(6):110-112.

[2]谭淑琴,等.PQD在科技查新中的应用[J].山东工业技术,2013(12):186.

[3]张岚,张柏秋,于非.科技查新检索质量优化策略研究[J].情报科学,2011(6):852-855.

[4]杨铁军,曾志华.专利信息利用技能[M].北京:知识产出版社,2011:10-11,51-54.

[5]张仁琼.ProQuestDialog在科技查新中的应用[J].大学图书情报学刊,2015(3):49-53,85.

[6]张秉斋.德温特世界专利索引(DWPI)数据库加工过程的研究[J].专利文献研究,2008(1):1-7.

[7]蔡东蛟.网上专利全文获取技巧与失效专利开发利用[J].现代情报,2010(1):50-55,55.

[8]罗亚泓.国际专利检索在科技查新中的应用[J].科技管理研究,2012(16):188-190.

[9]方红.网上免费专利信息的检索策略[J].浙江省科技信息研究院.2007(10):173-175.

陈婷女,1985年生。硕士,助理馆员。研究方向:科技查新与学科服务。

G255.53

(2016-02-02;责编:杨新宽。)