基于关联规则和技术功效矩阵的企业技术创新机会发现和辅助决策方法

2021-07-07 11:42战洪飞余军合邓慧君
关键词:机会功效专利

石 幸, 战洪飞, 余军合, 王 瑞, 邓慧君

基于关联规则和技术功效矩阵的企业技术创新机会发现和辅助决策方法

石 幸1, 战洪飞1*, 余军合1, 王 瑞1, 邓慧君2

(1.宁波大学 机械工程与力学学院, 浙江 宁波 315211; 2.宁波大学 信息科学与工程学院, 浙江 宁波 315211)

为助力科技型创新企业准确且快速地从外部捕获创新技术机会, 提出一种企业技术机会发现和辅助决策方法. 首先, 挖掘领域内的技术热点、技术重点和有潜力的技术作为领域技术创新机会. 然后, 通过关联规则分析领域技术机会和企业已有技术之间的相关性, 进一步结合技术掌握度和新颖度, 识别更适合企业的技术创新机会. 最后, 创新性地采用Sen-BERT语言模型和K-means聚类方法构建技术功效矩阵, 辅助企业从功能需求的角度进行技术创新决策. 以电动汽车领域为例验证了该方法的可行性.

技术机会发现; 技术创新; 关联规则; 文献计量

国内外学者已经对技术机会识别相关研究开展了较多工作. 技术机会分析主要包括3个部分: 关键技术、技术研究前沿和未来技术趋势[1]. 潘东华等[2]基于共词分析、突现词检测和关键词聚类图谱对重点技术、领域热点和发展趋势进行分析. 冯灵等[3]通过专利与论文关键词的中心度以及词频, 分别挖掘高铁的热点技术领域和重点技术领域, 并联系时序图分析高铁技术机会. 阮程等[4]采用词频统计研究第五代移动通信技术的发展趋势, 将高频词作为领域研究热点, 将具有变化趋势的低频词视为潜在发展趋势. 学者在分析低频且有潜力的领域技术创新机会时, 多采用基于词频的突现词或者增长趋势等方法, 本文在传统词频分析法的基础上加入权威机构评估来发现有潜力的技术机会.

较多研究分析技术创新机会的视角还是停留在某个技术领域, 很少从企业角度发现技术创新机会. 企业技术机会发现指企业通过收集、分析、研究等方法, 结合企业自身情况挖掘技术前沿、新兴技术或者新的技术组合等有价值的技术机会. Lee等[5]以企业专利为基础, 搜索相似专利形成数据库, 进一步结合专利引文数据, 通过关键词分析和SAO语义分析方法发现技术机会. Park等[6]采用协同过滤算法向企业推荐专利IPC号作为企业潜在的技术机会, 并且以竞争水平、异质性、增长度标准识别技术机会. Choi等[7]综合PrefixSpan算法和TOPSIS综合评价法, 研究龙头企业技术的动态变化, 为企业研发规划提供支持. 寇翠翠等[8]以企业专利为研究数据, 基于技术能力和相似度评估企业, 将得出的企业专利作为研究样本, 然后根据重要度、新颖度和复杂模糊性等指标识别技术机会. 朱琳等[9]基于三维功效图识别企业技术机会, 结合技术新颖度和实现可能性来评估技术, 辅助企业开展技术创新活动. 较少研究从企业的视角出发, 目前研究对企业现有的技术能力关注不足, 本文提出基于关联规则的企业技术机会发现方法, 在挖掘技术机会时将企业技术现状与领域技术协同分析.

技术功效矩阵是一种技术分析和可视化呈现的方法. 刘化然等[10]通过领域专家归纳技术的手段与问题, 进一步增加了布局难易程度来挖掘技术机会. 刘孜[11]采用word2vec词向量和聚类规则构造技术功效图, 用于合金材料技术分析. 张桂海等[12]提取技术词和功效词后, 使用LDA主题模型聚类归纳出技术类别和功效类别, 为产品概念设计提供支持. 张兆锋[13]通过知识图谱技术对专利文本中的词汇进行抽取并自动构建技术功效图. 本文创新性地采用Sen-BERT语言模型和K-means主题聚类构建功效矩阵, 比起常用的词向量聚类, Sen-BERT算法用句向量来归纳功效类别, 能够省略提取功效词的步骤, 直接用专利功效句更加简洁且快速有效.

1 企业技术机会发现和辅助决策方法模型

为解决技术机会识别与企业技术不适配的问题, 将基于行业领域的技术创新机会和企业自身技术能力相结合, 快速识别更符合企业的技术机会. 本文提出的企业技术机会发现方法模型主要分为数据预处理、领域技术机会发现、企业技术机会发现和企业技术机会辅助决策, 如图1所示.

图1 企业技术机会发现和辅助决策方法模型

企业技术机会识别方法模型以论文和专利数据为研究对象, 采取文本挖掘技术对数据进行清洗和预处理后, 抽出技术关键词归纳为专利和论文技术词库; 基于技术词库挖掘领域技术创新机会. 通过对领域技术关键词进行词频分析和共现分析, 挖掘领域内的技术热点和技术重点. 针对低频词分析维度单一的问题, 在传统分析方法的基础上, 结合文献发布机构的技术能力评估, 更加全面地衡量低频技术词的潜力. 基于技术占有率、技术质量、合作水平和技术覆盖率评估机构, 筛选出权威机构研究的有潜力的低频技术机会. 技术热点、技术重点和权威机构技术词即为领域技术创新机会.

以整个领域的技术机会为数据基础, 进一步挖掘适用于企业的技术创新机会. 构建数据驱动的企业技术创新机会发现方法, 为解决技术机会发现过程脱离企业实际的问题, 引入关联规则算法将领域技术机会和企业自身技术联系起来, 采用Aprior算法计算技术词之间的关联关系, 以关联规则置信度表征技术相关性; 在此基础上, 结合已有技术掌握度和技术机会新颖度, 综合3个维度评估技术创新机会, 更加精准且快速地识别适用于目标企业的技术机会. 将Sen-BERT语言模型和K-means主题聚类算法相结合, 计算得出的功效类型为纵轴, 以评估得出的技术为横轴, 构建技术功效矩阵, 协助企业根据功能需求完成企业技术创新机会选择.

2 企业技术机会发现和辅助决策方法

方法研究主要包括领域技术创新机会挖掘、基于关联规则的企业技术创新机会发现和基于功效矩阵的企业技术机会辅助决策.

2.1 领域技术创新机会挖掘

确定企业产品的特定领域, 获取技术领域相关的原始数据; 论文文献选取关键词进行分析, 中文专利关键词需进一步提取. 专利摘要预处理后进行分词、去除停用词和词性标注, 抽取文本中的实词, 用TF-IDF统计方法抽取每条专利的关键词.

某领域的技术创新机会通常指关键技术、技术前沿或者新技术形态, 通过提取领域内的技术重点、热点以及有潜力的低频技术, 构建技术机会数据库, 作为后续识别企业创新技术机会的数据基础.

2.1.1技术热点分析

基于齐普夫定律, 关键词在领域科技文献中出现的频次一定程度上代表了研究点在相应时间段内的冷热程度. 因此, 高频技术关键词表征的主题反映了该领域热点研究成果, 也是领域技术创新机会. 统计科技论文的技术关键词词频, 并且根据数据特点进行时间切片, 设定阈值能筛选出高频关键词; 应用回归分析得到词频呈现显著增长趋势的技术词; 专利公开时间不具备实时性, 因此不采用时序统计的结果, 而计算相对值“技术关键词词频/技术关键词中最高词频”得到领域技术热点[3].

2.1.2技术重点分析

领域技术重点通过共词分析法得出. 共词分析法基于一篇文献中关键词对共同出现的频率来展现词对的联系, 可以代表文献主题的研究重点. 在共词网络中, 节点的度中心性代表与其他节点相关的程度, 度中心性越高, 表示与其他节点间的信息流越频繁, 说明该节点是共词网络的关键也是技术领域的重点技术. 以度中心性为指标对关键词进行分析, 设定合理的阈值筛选出领域技术重点词.

2.1.3权威机构技术分析

领域技术重点和热点通常都是高频关键词, 为避免遗漏低频但有前景的技术机会, 本文筛选出词频呈增长趋势的低频词, 并且进一步对文献的发布机构进行技术能力评价, 技术能力高的权威机构和组织提出的低频技术关键词被视为有潜力的技术机会, 将三者归纳整合为技术机会数据库.

机构技术能力评估主要包括文献占有率、技术质量、合作水平和技术覆盖率4个指标. 机构文献占有率由文献数量相对文献总数的比值表示, 发文量多证明技术竞争力和科研能力强; 技术质量包括文献被引量和核心文献数量指标, 文献被引高表示机构在该领域的贡献多、技术质量高[14], 核心文献指核心期刊的论文文献和发明专利, 核心期刊和发明专利都意味着更高的科研水平和技术, 机构的核心文献数量多说明文献质量较高, 科研发明的技术能力强; 机构合作水平通过与其他科研机构和企业合作的次数来计算, 合作水平高说明机构间共享知识和共同研发的能力强, 也说明企业技术能力受到更多的认可; 技术覆盖率通过专利IPC号和专利族两项指标确定, IPC号是国际通用的专利分类, 机构发布的IPC技术类别多说明其技术涉猎广泛; 专利族指企业向国外提交专利申请和保护的专利数, 反映机构专利在国内外发布的覆盖广度, 专利族的申请和维护需要花费一定的时间和精力, 也能说明该技术具有一定的市场前景[15]. 筛选有潜力的低频词需要结合机构的技术特征, 因此将关键词所在专利的IPC号标出并分类, 机构在相应分类下发表的文献能够说明机构的技术特长, 基于此进一步归纳技术词. 文献占有率1、技术质量2、合作水平3、技术覆盖率4和机构技术能力分别表示如下:

2.2 企业技术机会发现

识别技术机会的评价方法从关联规则延伸而来. 关联规则作为数据挖掘领域常用的推荐算法, 被广泛应用于各类产品推荐, Seo等[16]基于关联规则为企业识别和推荐新产品开发机会, 本文以此为参考并结合词频-逆文档频率算法思维, 将企业类比于用户, 将技术机会类比于产品, 基于关联规则挖掘领域技术机会和企业现有技术之间的相关性, 确定企业技术掌握度和技术新颖度, 识别适合企业的技术创新机会. 计算方法包括:

(1)关联规则置信度.

置信度表示关联规则的可信程度, 包括前项技术和后项技术两个部分, 前项技术属于目标企业已有技术集合, 后项技术属于领域技术机会集合. 置信度高表示技术机会与企业技术具有较高的潜在相关性, 拥有前项技术的企业能够实现后项技术的可能性更大.

(2)目标企业对前项技术的掌握程度.

(3)后项技术机会相对企业的新颖度.

综上, 对于目标企业T, 技术机会的价值评估如下:

2.3 企业技术机会辅助决策

某项技术能否成为企业技术机会, 更重要的是需要评估技术是否能够满足企业需求. 本文利用技术功效矩阵实现技术机会和需求功效映射, 为企业提供技术创新机会辅助分析.

功效类的确定采用句向量聚类方法完成, 本文将Sen-BERT语言模型和K-means聚类方法结合, 实现功效语句分类. Sen-BERT语言模型是一种基于BERT衍生而来的神经网络训练算法, 能够通过语料训练获得句子对的相似度. BERT语言模型基于Transformer编码器, 并采用MLM (Masked LM)任务和NSP (Next Sentence Prediction)任务来训练语义模型. Sen-BERT语言模型在BERT的输出结果上加入池化(pooling)操作来生成固定长度的句子向量, 并通过孪生网络和三胞胎网络赋予句子语义意义, 计算句子的相似度[17]. K-Means是属于无监督学习算法的一种聚类算法. 从已知的数据集里选择个子集, 确保各个子集数据点有着相似的特征, 即子集内的数据距离尽量小, 同时使得子集内的数据异于其他子集数据点的特征, 即让子集间距尽量远. 将Sen-BERT训练得到的句向量结果通过K-means聚类, 根据分析的技术领域归纳总结每个类别的技术功效, 以功效类为纵轴, 以企业技术机会为横轴, 进一步标注专利在功效矩阵中所属的位置, 绘制技术功效矩阵. 将两个方法结合能够直接对专利功效句进行分类, 比传统的功效矩阵构建方法、机器学习算法更加高效准确, 采用句向量能够直接对专利功效句进行归纳, 比起词向量的方法省略了功效词提取过程, 更加简便快捷.

利用技术机会与功能效果映射, 有助于企业从自身需求和用户需求角度出发, 进一步分析技术创新机会, 为决策提供有效支持. 企业可通过技术创新战略和企业愿景确定自身的需求, 结合用户需求调研, 明确所需要的技术功效. 通过技术功效矩阵检索功效所映射的技术创新机会, 协助企业从功能视角出发进一步分析技术, 选取满足企业需求的技术, 为技术创新机会分析提供更多的参考维度. 另外, 通过技术功效矩阵的呈现, 也能在一定程度上展示技术的空白点和可供研究的机会, 为企业在技术与功能角度提供技术机会选择的思路.

3 实例验证

以电动汽车领域为例, 实证研究企业技术创新机会识别方法的可行性.

3.1 领域技术机会识别

选择某新能源汽车公司作为研究目标企业, 该企业规模和研发资源有限, 基于自身技术识别技术创新机会能够有效降低投资风险和研发投入. 以中国知网和专利检索incopat为数据源, 以电动汽车、新能源汽车、混合动力汽车为主题, 采集2010—2019年间的论文和专利数据, 得到论文数据10120条和专利数据45497条. 专利关键词利用自然语言处理技术抽取, 剔除无效数据后, 采用jieba分词对专利摘要文本进行分词, 加入电动汽车领域词典和论文关键词优化分词效果; 基于停用词表剔除文本中无意义的停用词; 通过词性标注技术, 抽取名词、动词、形容词等实词作为关键词候选, 将无效词删除的同时加入停用词库; 最后通过计算技术词的TF-IDF值, 筛除小于阈值的词得到专利关键词, 与论文关键词共同储存于技术关键词库.

电动汽车领域的技术热点分析采用词频分析法. 论文数据以年为单位进行时间切片, 专利数据统计词频相对值, 整理得到高频技术词作为电动汽车领域的技术热点, 结果见表1, 由于篇幅有限, 本文只展示部分结果. 电动汽车领域的技术重点通过共词分析得到, 通过计量分析软件citespace和Bigexcel计算论文和专利中技术关键词的中心度, 分析电动汽车领域的技术重点.

表1 电动汽车领域技术热点和重点示例

基于论文数据分析的电动汽车领域权威机构主要是高校和研究院, 机构技术能力的评价指标包括文献占有率、技术质量和合作水平. 专利机构主要是企业和研究院, 机构技术能力的评价指标包括文献占有率、技术质量、合作水平和技术覆盖率. 论文和专利权威机构评估结果见表2. 基于技术能力较高的权威机构, 提取这些机构提出的呈增长趋势的低频技术关键词, 部分机构发布的有潜力的低频技术机会见表3.

表2 电动汽车领域专利权威机构

表3 电动汽车领域低频技术机会示例

综合以上分析结果, 统计得到电动汽车领域的技术创新机会, 记录在数据库中作为后续企业技术机会发现和选择的数据基础.

3.2 基于关联规则的企业技术机会发现方法

表4 目标企业技术创新机会发现结果示例

3.3 基于技术功效矩阵的企业技术机会辅助选择方法

通过构建技术功效矩阵, 进一步对已发现的技术创新机会进行分析. 技术功效矩阵的横轴是上述研究得到的企业技术机会, 而纵轴对应的功效类别通过Sen-BERT和K-means聚类得到. 当主题数目设定为9时, 主题聚类的效果最好, 结果如图2和表5所示. 基于算法结果能够归纳出功效类别, 绘制技术功效矩阵, 如图3所示. 企业能够从功效维度出发进行技术机会的决策, 也能从不同的功效角度去选择专利.

图2 Sen-BRET语言模型的K-means聚类效果展示

表5 Sen-BRET语言模型的K-means聚类结果示例

图3 企业技术创新机会-功效矩阵

通过技术功效矩阵的呈现, 公司不仅分析技术创新机会是否适合当前的发展战略和技术需求, 还能够直观地分析这些技术还未实现的功能, 辅助企业进行技术创新机会决策. 例如, 企业需要优化充电性能, 更应选择超级电容相关技术, 并且通过技术功效图可以看出, 超级电容相关技术在降低成本的功能方面研究较少, 企业也可以选择致力于研究超级电容来实现降低成本相关功能, 突出技术的异质性.

4 总结

本文提出了一种基于关联规则的企业技术机会发现方法, 同时还提出了基于Sen-BERT和K-means构建功效矩阵进行辅助决策的方法, 为企业挖掘技术机会和辅助决策提供服务. 对企业技术机会发现进行了研究, 分析了某领域的技术创新机会, 进而基于关联规则识别企业技术创新机会, 并且基于技术功效矩阵辅助企业技术创新机会决策, 对电动汽车领域和某新能源汽车股份有限公司进行实例分析, 验证了本文所提方法的可行性.

本研究仍存在部分不足有待改进. 识别企业技术创新机会的价值评估只从企业的技术出发考虑了3个维度, 而忽略了技术机会的其他价值. 领域技术机会大多是市场上现存的或已在研究中还未投入市场的技术, 因此该方法能够减少自主研发时间, 降低失败率, 适用于急需创新或者想避开全新技术研发试错阶段的企业和需要协同合作的场合, 也能为需要购买知识产权的企业提供前期建议.

[1] 郭俊芳. 基于语义挖掘的技术创新路径分析与评价方法研究[D]. 北京: 北京理工大学, 2016.

[2] 潘东华, 徐珂珂. 基于共词分析的技术机会分析[J]. 科研管理, 2014, 35(4):10-17.

[3] 冯灵, 余翔, 张军荣. 基于专利信息的高铁技术机会分析[J]. 情报杂志, 2015, 34(12):95-100.

[4] 阮程, 刘娅. 基于论文和专利的第五代移动通信技术发展趋势研究[J]. 中国科技资源导刊, 2018, 50(6):73- 81.

[5] Lee Y, Kim S Y, Song I, et al. Technology opportunity identification customized to the technological capability of SMEs through two-stage patent analysis[J]. Scientometrics, 2014, 100(1):227-244.

[6] Park Y, Yoon J. Application technology opportunity discovery from technology portfolios: Use of patent classification and collaborative filtering[J]. Technological Forecasting and Social Change, 2017, 118:170-183.

[7] Choi J, Jeong B, Yoon J. Technology opportunity discovery under the dynamic change of focus technology fields: Application of sequential pattern mining to patent classifications[J]. Technological Forecasting and Social Change, 2019, 148:119737.

[8] 寇翠翠, 罗素平, 袁红梅. 全球竞争态势下技术机会实现路径分析—–以生物制药产业为研究样本[J]. 情报杂志, 2019, 38(6):50-56.

[9] 朱琳, 战洪飞, 余军合, 等. 基于专利数据的企业技术创新机会识别方法研究[J]. 生产力研究, 2019(7):134- 141.

[10] 刘化然, 曹旭, 张晓冬, 等. 基于专利技术功效矩阵的技术机会识别方法[J]. 图书情报导刊, 2020, 5(6):65- 70.

[11] 刘孜. 基于多维技术功效图的铂基合金技术机会识别研究[D]. 武汉: 华中科技大学, 2019.

[12] 张桂海, 余军合, 战洪飞, 等. 基于网评与专利数据的产品概念设计知识服务研究[J]. 宁波大学学报(理工版), 2018, 31(5):24-30.

[13] 张兆锋. 基于知识图谱的技术功效图自动构建及其应用研究[D]. 南京: 南京大学, 2018.

[14] 史璇. 基于科技文献的燃料电池汽车企业技术机会研究[D]. 太原: 山西大学, 2020.

[15] 寇翠翠, 金金, 吴亚坤, 等. 基于技术相似性和技术能力分析的中小型企业技术机会识别[J]. 情报理论与实践, 2019, 42(8):104-109.

[16] Seo W, Yoon J, Park H, et al. Product opportunity identification based on internal capabilities using text mining and association rule mining[J]. Technological Forecasting & Social Change, 2016, 105:94-104.

[17] Reimers N, Gurevych I. Sentence-BERT: Sentence embeddings using Siamese BERT-networks[C]// Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing, 2019.

Opportunity discovery in technological innovation for enterprises and assisted decision-making based on association rules and technology-efficiency matrix

SHI Xing1, ZHAN Hongfei1*, YU Junhe1, WANG Rui1, DENG Huijun2

( 1.Faculty of Mechanical Engineering & Mechanics, Ningbo University, Ningbo 315211, China; 2.Faculty of Electrical Engineering and Computer Science, Ningbo University, Ningbo 315211, China )

The global individualized competitive environment poses a huge challenge to the technological innovation capabilities of enterprises. It is particularly important for technological innovation enterprises to accurately and quickly capture technological opportunities from the external environment. Aiming at the problems identified in discovering enterprise innovation opportunities, a method of enterprise technological innovation opportunity discovery and assisted decision-making is proposed. Firstly, the technical hotspots, technical priorities and potential technologies are categorized into field innovation opportunities. Then, it analyzes the correlation between field technology innovation opportunity and the existing technology of the enterprises through association rules, and further combines the technological mastery and novelty to identify technology opportunities that are more suitable for the target enterprises. Finally, Sen-BERT language model and K-means clustering method are used to construct a technology-efficiency matrix, in order to assist enterprises in making innovation decisions based on functional requirements. The feasibility of this method is verified by conducting a case-study in the field of electric vehicles.

technology opportunity discovery; technological innovation; association rule; bibliometrics

TP39

A

1001-5132(2021)04-0035-08

2021−03−05.

宁波大学学报(理工版)网址: http://journallg.nbu.edu.cn/

浙江省公益技术应用研究计划(LGG18E050002, LGG20E050010); 宁波市自然科学基金(2018A610131).

石幸(1994-), 女, 浙江宁波人, 在读硕士研究生, 主要研究方向: 数据挖掘、企业信息化. E-mail: 412447645@qq.com

战洪飞(1970-), 男, 辽宁黑山人, 博士/教授, 主要研究方向: 知识管理、企业信息化. E-mail: zhanhongfei@nbu.edu.cn

(责任编辑 韩 超)

猜你喜欢
机会功效专利
红景天的神奇功效及作用
被扔掉的葱须大有功效
给进步一个机会
最后的机会
给彼此多一次相爱的机会
没机会下手
如何让你的化妆品发挥更大的功效
同角三角函数的神奇功效
2007年上半年专利授权状况统计