基于大数据的专利价值评估研究

2021-04-20 02:23毛岱波陈丙赛柯伟扬陈雯罗韵晴
电子技术与软件工程 2021年2期
关键词:专利权重公式

毛岱波 陈丙赛 柯伟扬 陈雯 罗韵晴

(宁波市科技信息与发展战略研究院 浙江省宁波市 315100)

近年来,随着我国提出创新型国家发展战略,以专利为主的知识产权事业得到了蓬勃发展,但是对比欧美发达国家,我国仍只属于专利申请大国而非专利强国,尤其是专利的交易转移率极其低下。其中主要原因是因为目前国内知识产权交易的服务机制并不成熟,存在条块分割、自成一体的情况,并且知识产权价值评估的主观性较高。专利交易服务是知识产权服务的重要内容,专利价值精准评估也一直是专利交易服务内容的关键,现实中经常会碰到评估结果无法得到供需双方的共同认可从而导致最终无法完成专利交易等问题,因此本文将围绕专利价值评估开展技术研究。

从整体来看,目前国内外对于专利价值的研究主要分成三大类。第一类是经济学方法,主要利用成本法、市场法等方法对专利进行定价,优点是操作简单,易被接受,缺点就是交易市场体系尚不完善,偏差较大。Lee 等[1]认为专利价值涉及技术价值、直接经济价值和间接经济价值三个方面,其中直接经济价值包括专利权使用费及专利权使用收入,间接经济价值则通过专利维持信息进行评估。

第二类是综合评价法,主要利用层次分析法、主成分分析法等算法对专利进行定性定量分析,优点是降低了主观因素对评价结果的影响,缺点是指标选取较为片面。Lanjouwg[2]认为专利诉讼和专利的权力要求数相关,且被诉讼的专利往往具有更大的市场价值,因此选择专利请求数作为专利价值的评估指标。Harhoff等人[3]考虑到专利范围是决定专利保护效力的重要因素之一,所以将专利范围、同族专利数、专利异议等列为专利价值评估指标。

第三类是其他新兴方法,主要利用机器学习对专利进行评估,优点是有效性强、科学性强、效率高,缺点是研究尚浅,不够深入,对训练样本依赖较大。赵蕴华等[4]把专利价值评估视为一个强度分类问题,采用神经网络、决策树、支持向量机三种机器学习算法对专利价值的评估指标进行选择;胡启超[5]通过全面分析影响专利成交价格的相关因素,采用BP 神经网络程序对指标数据进行模拟,得出专利价值评估的一般模型.

本文通过对三类评估方法的对比分析,最终决定采用以综合评价法为主,吸收经济学法的优势,提取专利著录项信息中跟经济有关的指标作为评价中的经济指标,同时在以往学者建立的指标体系的基础上再度深化、细分,提出了以专利稳定性、专利保护范围、专利经济价值以及专利技术质量四个维度构建专利价值评估指标体系。

1 专利价值评估基本流程

本文利用全国2000 多万件专利作为数据基础,进行专利价值评估模型的研究,主要流程分为4 个部分:(1)指标选取;(2)数据处理;(3)权重计算;(4)计算得分。

1.1 指标选取

本文遵循系统性、科学性和可操作性的原则,从专利稳定性、专利保护范围、专利经济价值以及专利技术质量4 个方面确定了19 个指标。如表1所示。

1.2 数据处理

通过观察本文选取的指标,发现指标大致可以分成两类:一类是正向指标,即指标量化后数值越大越好;另一类是反向指标,即指标量化后数值越小越好。因此为简化模型,本文先将反向指标进行正向化处理。

1.2.1 数据正向化

假设一个指标的所有数据记为X,其中第i 件专利该指标的数值记为xi,表示计算后的结果,具体公式如下:

通过这种方法,即可将一个反向指标转换为正向指标。

1.2.2 数据标准化

通过数据正向化处理后,所有指标已经转换为正向型指标,接着本文通过对数据进行标准化处理来消除不同种类数据量纲的影响。具体公式如下:

其中xi表示第i 件专利指标X 的数值,zi表示标准化后的结果。

1.3 权重计算

本文采用熵值法对标准化后的数据进行赋权计算。首先假设A为数据矩阵,具体表示如下:

其中xij表示第i 件专利第j 个指标的数值。

接着计算第j 个指标下第i 件专利占该指标的比重,具体公式如下:

利用计算得到的比重pij计算第j 项指标的熵值,具体公式如下:

其中k>0,ln 为自然对数,ej≥0。式中常数k 与样本数m 有关,一般令k=1/lnm,使得0≤e≤1。

利用熵值再计算第j 项指标的差异系数,具体公式如下:

gi=1-ej

对于第j 项指标,指标值xij的差异越大,对专利价值的影响就越大,熵值就越小,因此gi越大指标越重要。

最后利用差异系数计算各指标的权重,具体公式如下:

其中wj即为第j 项指标的权重。

1.4 计算得分

根据熵值法计算得到的权重对专利数据进行价值得分计算,具体公式如下:

其中Si即为第i 件专利的得分。

2 实验结果及分析

本文采用蒙特卡洛随机算法从2000 多万件全国专利中随机抽取10000 件专利进行模型构建,通过指标量化、数据正向化及标准化和熵值法计算权重,最终得到的指标权重如表2。

表1:指标选取详情表

表2:指标权重系数表

为了验证模型准确性,本文从第二十一届中国专利奖金奖和银奖中各随机抽取了30 件专利进行验证。通过上述模型计算,最终获金奖专利平均得分为77.67 分,获银奖专利平均得分为72.53 分,差距较为明显。如图1所示。

图1:第二十一届中国专利奖部分获奖专利得分情况

3 结束语

本文以综合评价法为主,吸收经济学法的优势,提取专利信息中专利申请是否提前公开、被引次数、许可次数和转让次数4 个指标作为评价中的经济指标,同时在以往学者建立的指标体系的基础上再度深化、细分,最终效果与中国专利奖评选结果基本相似,即金奖专利平均得分明显高于银奖专利。但由于样本选取未考虑国外专利以及被引次数指标新专利相对于老专利不占优势等,因此该算法的结果仅供读者参考。

猜你喜欢
专利权重公式
专利
组合数与组合数公式
排列数与排列数公式
等差数列前2n-1及2n项和公式与应用
权重常思“浮名轻”
发明与专利
为党督政勤履职 代民行权重担当
基于公约式权重的截短线性分组码盲识别方法
层次分析法权重的计算:基于Lingo的数学模型
专利