知识生态系统知识预见的提出逻辑及实现路径

2022-06-06 19:25储节旺李佳轩刘雅娇
现代情报 2022年6期
关键词:复杂网络知识图谱

储节旺 李佳轩 刘雅娇

摘 要:[目的/意义]知识创新与关键技术预见已经成为国家竞争的重要方向,通过将复杂网络结构、链路预测以及词向量训练引入知识生态系统之中,为知识生态系统引入新观点、新概念,为知识预见提供全新的思路。[方法/过程]在文献计量以及文本挖掘的基础上通过多种方式对相关文献进行关键词选取与聚类,并将聚类节点用于构建知识生态系统网络结构,利用词向量训练对知识生态系统网络结构进行调整并通过链路预测方法实现知识预见。[结果/结论]通过将复杂网络结构引入知识生态系统中,预测知识生态系统中不同知识社区间可能发生的交集对于新知识的预见是具有显著效用的,可以作为颠覆性技术预见的一个方法途径。

关键词:知识生态系统;知识预见;技术预见;复杂网络;链路预测;知识图谱

DOI:10.3969/j.issn.1008-0821.2022.06.003

〔中图分类号〕G201 〔文献标识码〕A 〔文章编号〕1008-0821(2022)06-0027-11

Abstract:[Purpose/Significance]Knowledge innovation and knowledge foresight have become an important direction of national competition.This paper introduces complex network structure,link prediction and word vector training into the knowledge ecosystem,introduces new ideas and concepts for the knowledge ecosystem,and provides new ideas for knowledge foresight.[Method/Process]On the basis of literature measurement and text mining,keyword selection and clustering of relevant literature were carried out in various ways,and the clustering nodes were used to construct the network structure of knowledge ecosystem.The network structure of knowledge ecosystem was adjusted by word vector training,and knowledge prediction was realized by link prediction method.[Results/Conclusion]The knowledge ecosystem is predicted by introducing the complex network structure into the knowledge ecosystem.The possible intersection between different knowledge communities in the system has a significant effect on the prediction of new knowledge,and can be used as a method of disruptive technology prediction.

Key words:knowledge ecosystem;knowledge foresight;knowledge mining;complex network;link prediction;knowledge map

“十四五”时期对于中国的科技创新是一个非常關键的时期,是中国实现科技自强的窗口期,也是关乎中国能否在2025年迈向科技强国的重要战略机遇期。面对“十四五”这样的特殊时期,要想实现科技自强就必须构建前沿技术态势感知的情报预警能力。因为,过去的科技情报工作有参照系、有标杆、有学习和模仿的对象,但现在中国越来越多的技术领域处于引领地位,进入无人区后,对前沿技术态势感知和情报预警能力的要求发生了重大变化[1]。技术预见是20世纪90年代由技术预测发展起来的,在欧美日韩等国家得到推广应用[2]。在以往研究中,我国学者对于关键技术的预见提出了许多途径与方法,都表达了自己的观点,如赵彦飞等[3]提出,利用德尔菲调查法结合三维指数的方法来使关键领域技术预见更为可靠。陈进东等[4]提出,对Delphi法的技术预见进行评估,并通过优化不同熟悉度咨询专家比例和权重来实现技术预见。王婷等[5]提出,基于通过多轮德尔菲调查法,以此来实现为新一轮中长期发展规划的制定提供支撑。这些学者都主张通过德尔菲调查法或局部使用德尔菲调查法来实现颠覆性技术的预见。当然也有学者从定量的角度出发,如周源等[6]使用文献计量、主题模型、社会网络分析等方法构建一种文献综述分析框架,通过对框架的分析、判断来达到技术预见的目的。张秀妮等[7]和王志玲等[8]采用文献计量的方法对技术预见进行综述,但只是识别了核心作者、机构、研究范围的抽象分析。

虽然众多学者对技术预见的实现路径都给出了想法,但实现以及操作的难度依然非常巨大。本文从知识生态系统的角度出发,将复杂网络结构与链路预测引入知识生态系统之中,通过构建知识生态系统网络结构并提出知识预见的概念,为前沿技术的态势感知提出新的思路以及方法。

1 相关文献研究

1.1 知识生态系统

1991年,George P创造了“知识生态学”这个概念,并且在知识社区中完善了相关方法,之后生态学开始被真正引入到知识管理领域,国内外众多学者由此展开了广泛讨论[9]。George P认为,知识存在于生态系统之中,并且多种知识的交融是知识生态系统得以形成的主要动因。他还认为,知识生态系统本身是一个集管理理论与实践为一体的跨领域学科,并将知识生态系统的相关理论与模型写进1995年发表的论文《寻求组织智能》一文中[10]。2006年,国际知识生态组织(KEI)成立,KEI的成立标志着知识生态系统研究到了一个全新阶段,并且KEI对知识生态系统进行了全新解读,其认为知识生态的存在是为了通过知识流动、物质交换和环境协同,进而促进知识共享和知识服务的发展[11]。以往研究中,大多数学者对知识生态系统的研究更多地从知识螺旋、创新价值链出发[12],但缺乏对知识生态系统的结构及知识预见的探讨。1A3419FC-6A12-4C1F-90D8-0C9B6DF905EA

沈阳[13]曾提出三度空间理论,他认为将相互分隔的封闭知识空间进行连接可以形成更大的知识空间。本文认为,知识生态系统同样是由不同知识社区相互连接而形成的更为庞大的知识社区,不同知识社区是由不同知识节点聚类而形成。Bary D[14]曾提出知识生态系统的关键是知识的相互作用及相互关联,他将知识生态系统描述为动态网络系统,在团队中,不同的员工是一个互联网节点,而不同网络节点间可以传输知识。Silvio L[15]也曾提出DIKW模型,并认为信息之间的关联是产生知识的关键。根据知识节点理论以及DIKW模型,得出知识节点以及知识社区之间的关联是知识产生的关键,也是新知识产生的重要途径。既然知识生态系统存在知识节点与社区的知识关联,本文从复杂网络结构的视角研究知识生态系统,对知识生态系统中的知识节点与知识社区进行链路预测,对知识生态系统进行一个全新的理解与解读。

1.2 复杂网络视角下的知识生态系统

复杂网络是指具有自组织、自相似、吸引子、小世界、无标度中或全部性质的网络,具有幂律分布的特征[16],知识生态系统便具有相似的性质。在知识生态系统中,宫平等[17]认为,知识生态系统存在3个层面,即知识个体、知识群体和知识群落,并认为这3个层面之间会产生交流、竞争。在复杂网络结构视角下,知识生态系统的不同知识种群、知识群落就像复杂网络结构中的知识节点与知识社区,相似的知识节点会逐渐聚集,当集群到一定程度时便会形成知识社区,这些知识社区分布呈现幂律,有些知识社区知识节点众多,知识发展、知识出现迅速,有些发展较慢,有些知识社区甚至会被其他知识社区所归纳融合。在复杂网络视角下对知识节点以及知识社区进行链路预测具有充分的理论逻辑,雷鸣等[18]利用复杂网络结构中的链路预测构建协同药物组合推荐模型,以此来对单一药物进行组合治疗特殊疾病。王军进等[19]利用链路预测对不同企业间的合作竞争进行预测,并以此构建了企业间的合作关系预测模型。李冰等[20]也利用链路预测对企业潜在的合作伙伴进行预测。在李冰等的研究中,复杂网络结构中的节点为不同的企业,在知识生态系统中,不同的节点为知识节点与知识社区。

通过将复杂网络结构引入知识生态系统,构建属于知识生态系统的知识生态系统网络结构,从而为知识生态系统的研究与发展引入新观点、新思路。通过知识生态系统网络结构的构建,为技术预见的实现途径提出建议,并根据链路预测的相关概念提出基于知识生态系统的知识预见。

2 知识预见的提出逻辑

知识关联是知识创新的基础,关联是信息、知识、情报产生的关联,知识之间的关联是产生新知识的关键[15],通过对知识关联进行探索发现可以对知识的产生进行推测,即知识预见。知识预见与知识发现的不同之处在于知识发现更多地从原有知识挖掘出新知识,而知识预见是对未产生关联的知识进行关联预测,推测其未来产生联系的可能性,以预测为主,挖掘为辅。近年来,技术预见的研究成为学者们关注的热点,是极为重要的研究方向。本文认为,技术预见是可以通过知识生态系统中的知识预见来实现的,如何实现知识预见也将成为未来知识管理领域所要研究的方向,同时知识预见的实现也将为颠覆性技术的预见带来突破性发展。

技术预见前提是科学知识的预见。但从目前公开的文献看,学界对知识生态系统知识预见的研究还相对缺乏。何为知识预见?本文认为,知识预见是技术预见的上位类,并将通过知识生态系统网络结构对知识预见进行较为全面详细的解读,通过实例分析,对知识预见的可能性进行证明。对于知识预见本身而言,知识预见的提出也具有现实和理论双重逻辑。

2.1 现实逻辑

20世纪90年代以来,为把握当代经济、科技大变革的机遇,增強国家竞争力,美国、日本、英国等诸多国家纷纷加强技术预见研究工作,实施技术预见行动计划[22]。各国学者对于技术预见的理论、方法和应用等方面进行了大量探索。Sun J等[23]运用TRIZ理论构建模型,对一项技术的落后与否进行判定,并对其未来前景进行预见。李政等[24]运用数学建模法即尖点型突变方程构建关键技术的预见模型,以实现科技评价和预见。对于知识生态系统而言,技术预见是具有更为明显的可行性,因为技术预见从属于知识预见,而知识预见则是知识管理中的重要一环。知识预见是在知识生态系统中通过对不同知识社区间可能发现的知识交集或者知识节点之间可能发生的交集进行预测,对一个交叉性知识产生的态势感知,以此来获得对知识更为全面的把握。

知识预见就是对知识创新的态势感知。知识社区的多样性与关联性[25]是知识生态系统稳定的前提,知识生态系统中存在着不同的知识社区,不同的知识社区或多或少存在着交集,知识的产生发展有一部分是不同知识社区之中知识节点相交而产生。本文通过构建知识生态系统网络结构推测知识社区及知识节点边联系的概率,以此达到知识预见的目的以及交叉性知识的提前感知。通过在知识生态系统中进行的知识预见,有助于把握颠覆性关键技术,对前沿热点进行提前感知。

2.2 理论逻辑

2.2.1 链路预测

知识生态系统如同自然生态系统一般,是一个开放的、动态的自组织系统,具有完整的系统结构[26]。在知识生态系统之中,有学者从知识生态系统维度开始探讨,从信息、人、灵感、洞察力以及组织等多个维度来解释知识生态系统。也有学者从知识生态系统的组成要素开始探讨[27]。本文在复杂网络视角下对知识生态系统进行解读,并将链路预测的相关方法带入知识生态系统之中,为知识生态系统中知识预见的提出提供理论逻辑。

在以往研究中,大量复杂网络分析方法,如关键节点识别[28]、链路预测[29]、异常检测[30]、社区检测[31]等都应用于各种学科的分析之中。复杂网络中的链路预测是指如何通过已知的网络节点以及网络结构等信息,预测网络中尚未产生连边的两个节点之间产生链接的可能性。这种预测既包含了对未知链接的预测,也包含了对未来链接的预测。王军进等[19]以及李冰等[20]利用链路预测对不同企业的合作竞争进行预测,本质便是知识社区之间的链路预测。在复杂网络视角下,不同的网络节点在知识生态系统之中就如同知识社区以及知识节点,对知识社区之间以及知识节点之间的链路预测将是知识预见的重要途径与方法。1A3419FC-6A12-4C1F-90D8-0C9B6DF905EA

2.2.2 知识节点

知识生态系统的网络结构具有动力学复杂性,知识社区会随着时间的发展而发生变化[32],在知识社区之中,知识节点也会随着时间的发展而有所交集或更为疏远。本文将以此来构建知识生态系统网络结构。

在知识生态系统网络结构之中,存在着多个知识社区,这些知识社区有些关系密切、有些较为疏远,知识社区之间也会存在着交集,在不同知识社区之中也会存在着相同的知识节点,知识节点即知识社区的组成要素。一个知识社区是由许许多多的知识节点构成,一个知识社区的产生由知识节点的集群所形成。本文将知识社区集群中的单一要素定义为知识节点,知识节点之间的边则是知识社区之间的相互关系[33],这些边的存在也就说明了两个知识社区之间存在着知识交集,当然这种交集可能仅仅是两个知识社区中某一方面的交集,但当两个知识社区交集愈发密集[34],一个交叉性的知识或者学科便会产生,也就是一个新的知识社区。

2.2.3 知识社区

知识生态系统是一个庞大且无组织的生态系统,知识生态系统与自然生态系统具有相似的演化特征,如协同性、整体性和自组织性[35]。其中,协同演化不仅是知识生态系统的主要运行机制之一,也是其演化过程中被重点关注的一大特征[36]。张鹏等[37]提出企业知识协同演化中依次经历寄生性、偏利性、互惠性和共生性的知识协同模式,并将间断或局部发生的竞争性协同也视为其演化过程的一部分。这种企业中的协同演化就如同知识社区中的协同共生机理。什么是知识社区?知识社区是知识生态系統中最重要的概念,是知识生态系统中重要的组成要素。知识社区的聚集是缘于对同一主题的共同关注及其引发的知识需求。这可以看出知识社区形成的核心是用户对同一主题的知识认知需求。一个知识社区并不是静止系统,而是将各种知识个体或种群之间的相互作用,通过概念化转变构成的一个生态系统,是能够观察生态系统中的元素为应对环境的变化不断做出适应和自我进化的过程[37]。知识社区之间产生的交集可以看作是知识产生的前提条件,那么对知识社区交集的预见在知识生态系统之中会格外重要。

在知识生态系统之中,知识预见这个新概念是不可缺少的一部分。笔者认为:①在知识生态系统之中,知识的产生是有其规律的,并且是可以预见的;②知识生态系统之中是存在着不同知识社区的,这些知识社区关系有密有疏;③复杂网络结构是可以引用在知识生态系统之中的,并且知识生态系统是一个符合幂律[38]分布的非同质网络,具有小世界、无标度特性[39]。即在知识生态系统之中存在着关键知识社区,而知识社区中同样存在着关键知识节点;④知识关联是知识创新的基础,但知识预见是知识创新的感知,知识节点产生的知识交集是知识预见的一个可以探讨的方面。

3 知识预见的实现路径——以知识图谱主题为例

根据链路预测的基本理论,需要构建复杂网络并判断需要预测的网络节点及其相关节点,通过对节点是否会产生连接进行判断以达到预测目的。在知识生态系统的网络结构中,知识预见的实现路径基本可以按照“知识节点选择→知识社区网络结构构建→知识预见形成与检验”的总体路径实现。对于知识节点的选择,不同的问题案例,存在多种构建的方法与途径,如刘奕涵等[40]通过选择不同城市作为节点,建立合作网络以此进行链路预测。王燕鹏等[41]通过文献聚类的方式选择节点并进行链路预测,总体而言,节点的选择对于链路预测是最为重要的。

本文以图情领域的知识图谱为预测核心,由于传统的文献统计方法选择节点存在疏漏,因此本文使用LDA主题建模与文献统计方法共同选取知识节点并建立知识生态系统网络结构。根据知识节点的数量以及计算复杂程度,可以选择对知识节点进行二次聚类以及Word2vec相似度匹配,对知识生态系统网络结构中的知识节点疏密度进行调整,通过可视化的方式展示网络结构并进行链路预测。本文以知识图谱为案例,具体方式如图1所示。

3.1 文献获取与知识节点选择

知识预见源于对知识生态系统之中不同知识社区的交集地推测,对某一技术或者知识地预见,首先要确定该领域的知识社区以及与该知识社区相近的社区,同时也要确定该知识社区中最为主要的知识节点。如图1所示,对于知识节点地选择,本文分别通过Citespace以及LDA算法对关键词进行分析聚类,之后通过人工筛选进行知识节点选择。

为了建立以知识图谱为主题的知识社区,选择中国知网(www.cnki.com)文献数据库为文献来源以此来获得较为全面的资料。CNKI是全球资源规模最大的数字内容出版商,收录的文章信息质量受到严格把关。本文以知识图谱为例,为了确保检索结果的全面性,使用高级检索,以主题=“知识图谱”进行精确检索,并将领域限定在图书情报领域。

国内文献的检索结果显示,2010—2021年10月,与检索词相关的文献资料有15 076条。如图2所示,2010—2014年,国内知识图谱发展处于萌芽阶段,因此发文量缓慢,发文量以及相关主题如图2、图3所示。2016年以后则发展较为迅速,为了获得更为清楚的知识图谱发展近况,将日期从1983年设置为2017年,将时间段逼近目前,并对相关性较低的文献、会议等进行筛选,在所得文献目录后再经过人工筛选得到相关文献量320篇。

3.1.1 文献分析下的知识节点选取

利用Vosviewer对2017—2021年320篇文献进行关键词聚类分析,将节点权重值设置为4,进行微过滤得到初步的关键词共现图谱,关键词图谱显示了文章关键词之间的潜在关系,如图3所示。图3中“十”字代表关键词节点,节点大小反映了词语出现频率,频率越高,影响力越大[42]。节点间的连线代表关键词共同出现的频率,频率越大,线条越粗,根据图3可知,知识图谱为中心节点,它与文献计量、可视化、知识结构、知识特征等有密切联系,这说明近几年知识图谱在图情领域被广泛应用。基于关键词共现图谱的基础之上,对所选文献中2017—2021年突现词进行汇总。对于研究领域趋势分析,Citespace提供了对突变词(Burst Words)的探测技术,即通过探测在某一时间段内被引频次或共现频次突现度增加的节点来预测领域内的研究方向[43]。在突变词中,得出信息计量学、可视化、研究热点、信息推荐、自然语言处理、社会网络分析、风险管理等关键知识节点,如表1所示。根据文献统计结果可以清楚看到,国内图情领域关于知识图谱出现的频率从2017年就已经有所增长,并且知识图谱的应用在不同年份会有新的突破,可见知识图谱在图情领域还会有新的应用方向,这也是知识生态系统网络结构中知识节点可以延伸的方向,即链路预测的目的所在。1A3419FC-6A12-4C1F-90D8-0C9B6DF905EA

3.1.2 文本挖掘下的知识节点选取

由于仅仅使用文献统计方法难以获得全面的关于知识图谱的知识节点,本文以近3年相关文献为数据源,利用LDA主题模型以及Textrank对文本进行整体词频统计以及语义关联性分析,为知识生态系统网络结构相关节点进行补充,并对文献中前35个重要词汇利用Pychart库进行展示,如图4所示,对其中频率较高的热词同样归纳为以知识图谱为核心的知识社区网络结构中的知识节点。

3.1.3 知识节点汇总

根据文献统计与语义分析的结果,将不同方法所得知识节点进行汇总,得到信息计量学、可视化、研究热点、信息推荐、自然语言处理、社会网络分析、风险管理、主题挖掘、事件库、主题聚类、人工智能、开放学术图谱等知识节点。但由于其中有不少节点是关于政策、地名等无用节点,因此需要对文献统计与语义关联所选择的知识节点进行二次筛选,并以此初步建立以知识图谱为中心的知识社区网络结构。

3.2 知识社区网络结构

3.2.1 知识社区网络结构构建

根据上述所列举的知识节点绘制知识生态系统网络结构,在知识生态系统中,以知识图谱为主题的知识社区就可以通过网络结构进行展示,不同的研究主题或研究方向成为这个知识社区中的一个知识节点。并对所选知识节点进行社区发现与社区检测,社区发现即一组紧密的知識节点所构成的知识社区关系网络[44],知识社区检测便是将知识社区聚类中容易被忽视的知识节点进行发现挖掘[45]。

在整个知识生态系统之中,一个知识社区的不同知识节点会有所交集,不同知识社区的不同知识节点也可能会产生关联,那么对未产生关联的知识节点进行预测可以对知识的产生进行预见。根据社区发现结果进行聚类,大致可以得出几个与知识图谱有关的知识社区集群,如人工智能节点、大数据节点等。并将聚类主题所属之下的重要知识列入知识生态系统结构之中。利用Python构建知识社区网络结构,具体如图5所示。在以知识图谱为核心的知识社区网络结构中,大数据、人工智能、社会网络分析、引文分析等知识节点与主题较为接近,可以判断这些热点与知识图谱已经发生密切的联系,因此可以将知识特征、自然语言处理、深度学习等与知识图谱关联度较少的知识节点视为知识生态系统中其他知识社区的重要知识,如深度学习可以认为是计算机科学知识社区中的知识节点。

3.2.2 知识社区网络结构调整

通过图6所构建的知识社区网络结构,可以看出知识图谱节点位于知识社区中间,那么与之关系较远的节点可以进行调整,并对知识节点中未产生边关联的节点进行知识预见。但是在大多数情况下,一个知识社区中知识节点众多,必须进行筛选,因此本文选择使用Word2vec进行相似度分析。

为了获得较为准确的知识预见结果,在对所有知识节点进行直接预测之前,为了减少预测范围以及计算量,本文将所有知识节点进行汇总。首先通过Jieba对文本进行分词,为了提高分词正确率,自行添加如知识图谱、社会网络分析、人工智能、深度学习等较为新颖的词语,以此来得到用于训练的中文语料。使用Gensim中Word2vec训练中文语料,将词向量维度设置为100,词向量间距离设置为5,HS值设置为1,需要计算词向量的最小词频为1,以此为基础进行词向量训练。由于所选文献数量不多,词向量训练会存在误差,本文将训练文本数量扩大至4 000篇,所选文献依然为图书情报领域。通过将知识图谱作为关键词,对全文与知识图谱相关的词语进行关联预测以及相似度匹配。为保证数据准确性,先对知识图谱以及自然语言处理进行相似性匹配得到数据为0.5454,可见两者在语料中关联程度并不大,经过多次训练测试,数据较为准确,以此大致可以确定词向量训练具有一定说服力。接下来开始对知识图谱的相似知识节点进行相关语料分析,得到数据如表2所示。

通过相似度以及关联度分析,可以看出知识图谱所展现的主要作用是可视化,是一种分析方法和工具,将知识图谱相关作用、应用领域大致了解。在表2中可以看出,知识图谱与信息行为、定量分析、网络舆情都是有一定的关联性的,基于此,已经有条件相信知识图谱可以应用在信息行为、网络舆情分析之中,但由于语料库不够大、词语本身分词等因素并不能作为唯一检验标准。因此,本文将对知识节点之间进行链路预测。加之知识预见的本质是为了发现知识生态系统之间不同知识社区中潜在的边联系,所以进行链路预测二次检验是极为必要的。

因此,可以暂且将表2中关键词如信息行为、引文分析、网络舆情、数据挖掘等相对应的知识节点进行链路预测。

3.3 基于链路预测的知识预见

通过链路预测对知识生态系统中所选知识节点与知识图谱为主题的知识社区的所选节点进行预测,即对原本不相连的两个知识节点分析是否存在边相连[46]。对于原本存在边相连的知识节点,本文认为这两个知识社区已经有所交集,但在不同的知识社区,可能存在着部分知识节点相连,而其他知识节点并不存在联系关系[47]。因此,本文引入Kata相似度指标[48],如式1表示不同知识节点中存在的共同路径,如图书馆学知识节点与信息行为知识节点路径为2,链路预测的一个指标便需要对这些共同路径进行汇总。在原本构建的知识生态系统网络结构中,共选择35个知识节点,但为了简化预测步骤,本文将知识节点进行缩减,选择9个知识节点画出知识社区简化网络结构,并求出二阶路径以及三阶路径,如图6所示。

在图6中的知识社区网络结构,将不同知识节点的路径进行计算,CNxy为两个知识节点之间路径数,基于计算出知识社区网络结构中存在的二阶路径数以及三阶路径数,给三阶路径设置权重α,并设置α为0.3,β设置为0.5得到式(2)。

表3中知识节点编号分别代表信息行为、计量学、技术、图书馆学、知识图谱、主题识别、可视化、情报学、网络舆情,Katz指标表示知识节点1即信息行为节点与其他知识节点的相似性。1A3419FC-6A12-4C1F-90D8-0C9B6DF905EA

通過相似指标计算,可以明显看出在知识节点相似度指标上,信息行为与网络舆情具有较高相似度,信息行为与主题识别也具有较高相似度,这与上文Word2vec训练中文语料的训练结果基本相同。但是值得注意的一点是,随着知识社区网络结构的复杂及知识节点的增多,Katz指标的计算量会显著增加,但依然有一定的参考价值,本文为了验证结构,通过对Katz相似性指标进行再次验证。对信息行为节点与网络舆情节点进行单独的Adamic-Adar系数计算,以此来论证前期猜想,Adamic-Adar系数[49]通过考虑知识节点的度来突出不同知识节点的重要性不同,知识节点的度越小,则该知识节点在共同邻居中所占的权重就越大,也就是说对于共同邻居的影响越大[50]。通过计算网络舆情节点与信息行为知识节点的AA值为0.72641,同样具有一定相似性。因此,本文认为在知识图谱这个社区中,网络舆情与信息行为的交叉性研究是存在较高可能性的,那么未来研究中,信息行为的研究方向便有可能与网络舆情相互关联,形成新的研究方向或方法。当然这只是两个知识节点的预测,根据词向量训练结果以及Katz指标,还有一些知识节点是有可能产生关联的,本文对此将不予赘述。

4 结 语

对于知识预见的实现,本文采用统计分析与智能挖掘技术、语义关联技术、本体建模技术、智能推理技术等方法,但无论是统计分析还是文本挖掘推理,其本质都是为了确定知识节点。而语义关联与链路预测是对网络结构调整与知识预见实现的关键,但由于Word2vec的语义关联方法具有训练瓶颈的问题[51],包括语料库不够庞大、难以处理一词多义等问题[52]。因此本文将其作为网络结构的调整方法,而链路预测才是知识预见实现的方法途径。当然,如何针对知识社区中一些新兴词汇进行无监督的新词发现,以及某一知识社区中多义歧义进行识别,也是词向量未来用于知识预见需要考虑的地方。

技术预见前提是科学知识的预见。虽然我国对知识生态系统的研究已经有了一定的成果,但研究的深度和广度离成熟还稍显不足。为了实现知识生态系统视角下的技术预见,本文创造性地将复杂网络结构引入知识生态系统,指出知识生态系统同样具有知识生态系统网络结构,并认为知识生态系统中是存在多个知识社区,以及这些知识社区中的知识节点会有所交集。通过知识生态系统网络结构的构建,本文将知识预见这个新概念引入知识生态系统之中,并给出了具体的知识预见方法。这为今后对交叉性知识或者先进技术的预见提供了一种思路。

但对于更为复杂的知识社区网络结构,应用链路预测可能会产生巨大的计算量。对于词向量训练以及链路预测相结合确有可行之处,但如果要得到更为准确的结果,本文方法还有待进一步改善,如对词向量训练进行进一步深化、加入外文文献预测、加入德尔菲法进行验证等。当然对于更为复杂的知识社区网络结构如何进行准确的知识预见是以后需要完善的地方,对于知识生态系统网络结构的构建以及研究也是今后需要更进一步挖掘探讨的方向。

参考文献

[1]赵志耘.“十四五”科技情报创新的思考[J/OL].信息资源管理学报:1-6[2021-11-19].http://kns.cnki.net/kcms/detail/42.1812.G2.20211020.1048.002.html.

[2]李健民.全球技术预见大趋势[M].上海:上海科学技术出版社,2002.

[3]赵彦飞,王孝炯,王丽.国家关键技术选择:三维综合指数方法研究[J].科学学研究,2021,39(6):1015-1025.

[4]陈进东,张永伟,周晓纪,等.专家熟悉度对技术预见的影响评估及参数优化[J].科研管理,2021,42(6):128-138.

[5]王婷,池康伟,蔺洁.面向2035中国公共卫生数字技术选择与布局研究——基于德尔菲调查的技术预见研究[J].科学学与科学技术管理,2021,42(3):16-28.

[6]周源,刘怀兰,廖岭,等.基于主题模型的技术预见定量方法综述[J].科技管理研究,2017,37(11):185-196.

[7]张秀妮,张薇.国内技术预见研究卓越机构及研究热点可视化描绘[J].竞争情报,2015,11(3):24-29.

[8]王志玲,蓝洁,管泉.国内技术预见研究综述[J].情报探索,2015,(8):50-55.

[9]George P.What is a Knowledge Ecosystem[EB/OL].http://www.co-i-l.com/coil/knowledge-garden/kd/kes.shtml,2021-11-06.

[10]刘健,张念祥,陈海涛.基于生态视域的企业知识生态系统构建与运行机理研究[J].情报科学,2018,36(8):155-159.

[11]陈茫,张庆普,陈洁.“知识生态系统”带来图书馆知识创新的新机遇[J].图书馆,2016,(5):15-20.

[12]徐可,何桢,王瑞.供应链关系质量与企业创新价值链——知识螺旋和供应链整合的作用[J].南开管理评论,2015,18(1):108-117.

[13]沈阳.虚拟社区与虚拟时空隧道[J].情报杂志,2007,(4):69-71.

[14]Bray D.Knowledge Ecosystems A Theoretical Lens for Organizations Confronting Hyperturbulent Environments[EB/OL].https://www.researchgate.net/publication/29824670,2021-10-24.

[15]Silvio L.The DIKW Hierarchy:An Information Exploration Framework[J].Knjinicˇarstvo:Glasnik Drutva Knjinicˇara Slavonije,Baranije Srijema,2020,24(1-2):136-162.1A3419FC-6A12-4C1F-90D8-0C9B6DF905EA

[16]杨博,刘大有,金弟,等.复杂网络聚类方法[J].软件学报,2009,20(1):54-66.

[17]宫平,徐跃权.图书馆微观知识生态系统的优化研究[J].图书情报工作,2010,54(21):40-44.

[18]雷鸣,夏梦鸽,汪雪锋,等.基于链路预测的协同药物组合推荐研究:面向疾病并发症诊疗[J].图书情报工作,2021,65(12):122-129.

[19]王军进,刘家国,李竺珂.基于复杂网络的供应链企业合作关系研究[J].系统科学学报,2021,29(3):110-115,130.

[20]李冰,丁堃,孙晓玲.企业潜在技术合作伙伴及竞争者预测研究——以燃料电池技术为例[J].情报学报,2021,40(10):1043-1051.

[22]朱庆华,李亮.社会网络分析法及其在情报学中的应用[J].情报理论与实践,2008,(2):179-183,174.

[23]Sun J,Gao J,Yang B,et al.Achieving Disruptive Innovation-forecasting Potential Technologies Based Upon Technical System Evolution By TRIZ[C]//IEEE International Conference on Management of Innovation and Technology.Bangkok:IEEE,2008:18-22.

[24]李政,罗晖,李正风,等.基于突变理论的科技评价方法初探[J].科研管理,2017,38(S1):193-200.

[25]George P.The Ecology of Knowledge:A Field of Theory and Practice,Key to Research & Technology Development[EB/OL].2021-10-24.

[26]Kapoor R.Ecosystems:Broadening the Locus of Value Creation[J].Journal of Organization Design,2018,7(1):1-16.

[27]李积君.知识生态理念下图书馆服务转型研究[D].湘潭:湘潭大学,2020.

[28]Lalou M,Tahraoui M A,Kheddouci H.The Critical Node Detection Problem in networks:A Survey[J].Computer Science Review,2018,28:92-117.

[29]Martínez V,Berzal F,Cubero J C.A Survey of Link Prediction in Complex Networks[J].ACM Computing Surveys,2017,49(4):69.

[30]Garg S,Kaur K,Kumar N,et al.Hybrid Deep-learning-based Anomaly Detection Scheme for Suspicious Flow Detection in SDN:A Social Multimedia Perspective[J].IEEE Transactions on Multimedia,2019,21(3):566-578.

[31]Fortunato S,Hric D.Community Detection in Networks:A User Guide[J].Physics Reports,2016,659:1-44.

[32]Basole R C.Visualization of Interfirm Relations in a Converging Mobile Ecosystem[J].Journal of Information Technology,2009,24(2):144-159.

[33]方锦清.非线性网络的动力学复杂性研究的若干进展[J].自然科学进展,2007,(7):841-857.

[34]Dunlavy D M,Kolda T G,Acar E.Temporal Link Prediction Using Matrix and Tensor Factorizations[J].ACM Transactions on Knowledge Discovery from Data(TKDD),2011,5(2):1-27.

[35]Abbate T,Codini A,Aquilani B,et al.From Knowledge Ecosystems to Capabilities Ecosystems:When Open Innovation Digital Platforms Lead to Value Co-creation[J].Journal of the Knowledge Economy,2021:1-15.

[36]姜紅,吴玉浩,孙舒榆.技术标准联盟知识生态系统的演化与治理机制研究[J].情报杂志,2019,38(10):191-199.

[37]张鹏,李全喜,张健.基于生态学种群视角的供应链企业知识协同演化模型[J].情报科学,2016,34(11):150-153.

[38]Ding F,Liu Y,Shen B,et al.An Evolutionary Game Theory Model of Binary Opinion Formation[J].Physica A:Statistical Mechanics and its Applications,2010,389(8):1745-1752.1A3419FC-6A12-4C1F-90D8-0C9B6DF905EA

[39]Nekovee M,Moreno Y,Bianconi G,et al.Theory of Rumour Spreading in Complex Social Networks[J].Physica A:Statistical Mechanics and its Applications,2007,374(1):457-470.

[40]劉奕涵,石安杰,李振威,等.粤港澳大湾区专利合作网络结构及链路预测——以芯片领域为例[J].中国市场,2020,(35):32-35.

[41]王燕鹏,韩涛,陈芳.融合文献知识聚类和复杂网络的关键技术识别方法研究[J].图书情报工作,2020,64(16):105-113.

[42]Chaturved A.An Efficient Modified Common Neighbor Approach for Link Prediction in Social Networks[J].Iosrjournals Org,2013,12(3):25-34.

[43]李杰,陈超美.CiteSpace:科技文本挖掘及可视化(第二版)[M].北京:首都经济贸易大学出版社,2017.

[44]Ancin-Murguzur F J,Hausner V H.CausalizeR:A Text Mining Algorithm to Identify Causal Relationships in Scientific Literature[J].PeerJ,2021,9:e11850.

[45]何道兵,刘小洋,丁楠.一种新的在线社交网络社区发现算法[J].计算机仿真,2021,38(9):322-328.

[46]骆志刚,丁凡,蒋晓舟,等.复杂网络社团发现算法研究新进展[J].国防科技大学学报,2011,33(1):47-52.

[47]崔爱香,傅彦,尚明生,等.复杂网络局部结构的涌现:共同邻居驱动网络演化[J].物理学报,2011,60(3):809-814.

[48]刘宏鲲,吕琳媛,周涛.利用链路预测推断网络演化机制[J].中国科学:物理学力学天文学,2011,41(7):816-823.

[49]吕琳媛.复杂网络链路预测[J].电子科技大学学报,2010,39(5):651-661.

[50]Kanika N,Lerman K,Kumaraguru P.Network Flows and the Link Prediction Problem[C]//Proceedings of the 7th Workshop on Social Network Mining and Analysis,2013.

[51]Liu B.Web Data Mining:Exploring Hyperlinks,Contents,and Usage Data[M].Berlin:Springer,2011.

[52]李小涛,游树娟,陈维.一种基于词义向量模型的词语语义相似度算法[J].自动化学报,2020,46(8):1654-1669.

(责任编辑:陈 媛)1A3419FC-6A12-4C1F-90D8-0C9B6DF905EA

猜你喜欢
复杂网络知识图谱
基于复杂网络节点重要性的链路预测算法
基于图熵聚类的重叠社区发现算法
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于复杂网络理论的通用机场保障网络研究
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
城市群复合交通网络复杂性实证研究