基于SBM-Malmquist的技术问答社区知识交流效率测度研究

2022-05-31 14:19丁楠曹玮倬相甍甍
知识管理论坛 2022年2期
关键词:开源板块交流

丁楠 曹玮倬 相甍甍

摘要:[目的/意义]目前在技术问答社区知识交流方面的研究尚不完善,旨在采用数据包络分析法研究技术问答社区知识交流效率,从而发现其不同板块之间存在的差异和变化规律,为改进社区管理和提高知识交流效率提供参考。[方法/过程]在构建知识交流效率评价指标体系的基础上,以“开源中国”社区15个热门板块为研究样本,基于SBM模型与Malmquist指数计算其知识交流的静态和动态效率值并进行深度分析。[结果/结论] “开源中国”社区15个热门板块之间的平均知识交流效率良好,但板块间差距较大,且总体知识交流效率处于上升趋势,主要是由于技术进步变化指数呈现19.50%的上涨幅度,说明技术振兴是“开源中国”社区知识交流效率上升的主要原因,但出现一定程度管理不当现象并且资源利用率较低。

关键词:技术问答社区    SBM模型    Malmquist指数    知识交流效率    开源中国

分类号:G202

引用格式:丁楠, 曹玮倬, 相甍甍. 基于SBM-Malmquist的技术问答社区知识交流效率测度研究[J/OL]. 知识管理论坛, 2022, 7(2): 101-115[引用日期]. http://www.kmf.ac.cn/p/278/.

1  引言

随着网络技术的蓬勃发展,信息交流和传播的方式开始多样化,越来越多的人在论坛和博客上通过发文(帖)和回文(帖)来表达观点、共享信息和获取知识,人际交流突破了时空的局限。用户提出问题后,社区吸引、发动来自各个领域的其他用户解答问题或提出对策,从而围绕一个主题不断地达成共识,形成了类似于现实中社区的网络团体——虚拟社区。近年来,虚拟社区逐渐成为人们通过互联网交流和获得知识的重要媒介,这使一些搜索引擎无法直接检索到的、存储在人脑当中的知识得以展现。专业性的网络论坛作为一类特殊的虚拟社区,是知识交流的重要工具之一,用户一问一答之间,便发生了信息交换和知识交流[1],例如技术问答社区是把IT技术作为论坛的主题,为技术人员提供知识交流的虚拟社区,其鼓励相关用户都能积极参与开放性讨论并分享创作过程,逐渐成为个人或团体开展知识交流和共享的有效平台。近年来,随着IT技术的广泛应用,技术问答社区的规模也逐渐扩大[2],本文主要对技术问答社区的知识交流效率进行研究,根据实际得到的数据结果,有针对性地提出优化和管理措施,从而增强用户知识交流效果以及创新力度,助力技术问答社区的持续发展。

“开源中国”社区是目前国内最大的开源技术社区[3],自2008年创办以来,致力于为IT开发者提供发现、使用和交流IT技术的问答平台,本文选取“开源中国”社区中最热门的15个标签板块作为用户知识交流的数据来源。首先,在梳理和总结已有文献成果的基础上,为测算技术问答社区知识交流效率投入产出值构建相应的评价指标体系;其次,采用数据包络分析方法中的SBM(Slack Based Measure)模型和Malmquist指数计算知识交流静态和动态效率值;再次,根据测算结果,对影响技术问答社区知识交流效率的主要因素进行分析;最后,根据所得出的结论,提出合理化建议,以期为促进技术问答平台知识交流,提高其知识创新水平提供参考意见。

2  相關研究

2.1  问答社区

目前,国内外学者对于问答社区的研究主要关注用户信息行为、用户问答质量以及社区间的对比等方面。关于用户信息行为的研究主要集中于知识贡献方面,例如,刘雨农等以知乎网“疫苗”话题为样本,研究虚拟知识社区的社会网络结构特征及影响因素,发现其用户关系是多层次、块状分布的,存在知识生产者和需求者两个中心,其中核心用户比边缘用户更倾向于贡献知识[4]。Z. Liu等研究发现知识贡献行为是用户在问答社区中获得所需信息的前提条件,其中用户的参与、兴趣和关联性等因素对用户的回答意愿有重要的影响[5]。J. H. Jin等研究发现用户的自我呈现、其他成员的认知和社会学习机会对知识贡献行为都有正向影响[6]。关于问答质量方面的研究主要以影响因素的特征为主,例如,沈洪洲等以知乎社区为研究对象,总结了10个对回答内容质量具有潜在影响的基本特征,回答内容的标注数量越多,重点内容及结构就越清晰,回答内容质量越高,同时,用户更易认同情感倾向积极的回答[7]。王伟等以知乎社区为研究对象,着重挖掘了答案及其编写者的特征,并通过逻辑回归、支持向量机和随机森林3种方法构建特征模型,对答案质量进行全面预测[8]。关于社区间对比方面的研究主要集中在中外社区运营视角的功能建设上,例如,李丹选取Quora和知乎进行对比,着重从产品性能、运营管理和用户特征3个层面展开分析,结果发现Quora拥有十分精准的功能定位、更简洁的功能区划分,相比知乎具有更多优势和成功经验[9]。万莉通过测度小木虫和人大经济论坛8门学科的知识交流效率,发现人大经济论坛知识交流效率和规模效率低于小木虫论坛,纯技术效率高于小木虫论坛[10]。

通过现有研究成果可以发现,国内外学者关于问答社区的研究主要集中于信息行为中知识贡献的研究,少数学者对问答质量的影响因素展开了研究,而对于社区间对比的研究较为匮乏且时间较为久远,并未涉及近年来的发展状态。其中,知识贡献主要涵盖了提出问题和浏览信息[11],而提问量与浏览量即可代表问答社区的活跃度[2],因此,本研究把问答社区中研究相对成熟的知识贡献作为指标体系,把能够反映主题使用情况的热门精选板块作为决策单元,以此为基础利用数据包络分析法对技术问答社区知识交流效率的测度展开研究,以期丰富问答社区的研究。

2.2  知识交流效率

目前,国内外学者尚未就问答社区知识交流效率展开研究,由庞建刚等[12]对虚拟学术社区的定义可知,问答社区可以被视为虚拟学术社区的一个子类。当前,对虚拟社区知识交流效率的研究主要集中于效率测度与影响因素两个方面。对于效率测度方面的研究主要基于数据包络分析法,例如,宗乾进等在2014年首次提出了知识交流效率评价指标体系,以科学网博客8个学科为例,采用数据包络分析法(Data Envelopment Analysis,DEA)方法进行了静态分析[13];晋升在DEA方法的基础上进一步拓展了Malmquist指数方法对小木虫论坛12个板块的知识交流效率进行研究[14];杨瑞仙等以在线健康社区“丁香园论坛”为对象,剔除外生因素后基于三阶段DEA模型对其中5个板块进行了研究[15]。也有少数学者采用其他研究方法,例如,庞建刚等选取经管之家论坛的3个区域为对象,采用随机前沿分析法(Stochastic Frontier Analysis,SFA)及Kernel方法对知识交流效率及其动态演化进行研究[12];胡德华等以4个学术虚拟社区的16个版块为样本,运用遗传投影寻踪算法进行知识交流效率的综合评估[16]。关于影响因素的研究主要通过结合效率测度进行综合分析,例如,吴佳玲采用Super-SBM方法及Tobit模型对小木虫论坛的知识交流效率及影响因素进行了分析[17];袁永旭等以丁香园论坛为研究对象,运用SBM(Slack Based Measure)模型和Tobit模型进行知识交流效率和影响因素的研究[18]。

综上,对于虚拟社区知识交流效率的研究以效率测度为主,且大多具有鲜明的学科特色,例如理工类学科的小木虫论坛、经管类学科的经管之家论坛和医学类的丁香园论坛等,而针对近年来活跃高的技术问答社区的研究较少。同时,在运用数据包络分析方法进行知识交流效率测度时,普遍采用CCR(Charnes & Cooper & Rhodes)模型以及BCC(Banker & Chames & Cooper)模型,对于SBM模型结合Malmquist指数的运用较少。针对此现状,本文基于SBM模型和Malmquist指數相结合的评价方法,对技术问答社区知识交流进行测度,并提出合理化建议。

3  研究设计

3.1  数据来源

本文选择“开源中国”社区中最热门的15个标签板块作为决策单元(Decision Making Units,DMU),其中包括“Java”“Android”和“PHP”等,于2021年1月借助“八爪鱼采集器”工具,分别对2018-2020年15个板块的数据进行相应指标体系数据的收集,并对采集到的发帖、回帖数据以及时间、投票和作者进行整理统计,以反映实际的知识交流情况。

3.2  研究方法

3.2.1  SBM模型

DEA模型于1978年被A. Charnes、W. W. Cooper和E. Rhodes提出,是一种用于评价多投入、多产出指标距离生产前沿面有效性的非参数方法[19]。传统的DEA模型为规模报酬不变的CCR模型和规模报酬可变的BCC模型,自问世便被广泛应用。但传统的DEA模型属于“径向”和“角度”的双度量[20],“径向”要求投入与产出同比例变化,“角度”通常只能考虑一个投入或产出的导向角度,忽略了DMU中松弛变量引起计算结果偏差问题[21]。经过学者们多年不断探究,在传统模型的基础上加入更多的限定条件,不断衍生出超效率DEA、SBM以及EBM等模型。本文使用K. Tone[22]于2001年提出的在目标函数中引入松弛变量的SBM(Slack Based Measure)模型,与传统模型相比,其规避了径向和角度问题的影响,且充分考虑了投入和产出的松弛度,使所得相对效率值介于[0,1],提升了效率评价的可信度和准确度,更偏重于知识交流效率最大化的考虑[19]。故本文运用SBM模型对技术问答社区知识交流效率进行测算,能够对技术问答社区的投入和产出松弛变量进一步优化,即将最小化的松弛变量作为目标函数,用以表明技术问答社区的知识投入冗余和产出不足越少,知识交流效率值则越高。

SBM模型如公式(1)所示:

公式(1)

其中,ρ*代表DMU的相对效率值,S1和S2为期望及非期望产出要素个数;x0、y0分别代表DMU的投入和产出向量;X、Y分别代表DMU的投入和产出矩阵。当且仅当ρ*=1时,DMU有效;当0 ≤ ρ* <1时,DMU无效。

3.2.2  Malmquist指数

Malmquist指数由瑞典经济学家S. Malmquist在1953年提出,随后R. Färe等将其与数据包络分析法相结合,用来测算生产和经营效率等问题,使其在金融、医疗和工业等领域应用广泛[14]。Malmquist指数是通过对比决策单元在t时期和t+1时期的距离函数比值来判定其效率变化情况和发展趋势,弥补了传统DEA无法测算动态效率的缺陷[23]。故本文运用Malmquist指数考量技术问答社区知识交流全要素生产率的演化趋势,其能够与数据包络分析法充分结合,进而对技术问答社区知识交流的动态效率进行测算,以便更好地分析社区的变化趋势。

Malmquist指数如公式(2)所示:

公式(2)

其中,xt和xt+1分别表示t和t+1时期研发投入量;yt和yt+1分别表示t和t+1时期研发产出量;tfpch、effch、techch、pech和sech分别代表全要素生产率、技术效率变动、技术进步、纯技术效率变动和规模报酬变动指数。若tfpch>1,则表示全要素生产率有所提高,整体呈上升趋势;tfpch=1,则全要素生产率不变,整体趋势稳定;tfpch<1,则全要素生产率降低,整体呈退步状态。

3.3  指标体系构建

技术问答社区是专门进行技术交流的问答社区,用户通过网络便可以实现知识共享、交流和创新。在技术问答社区中,知识提供者[24]通过发帖将隐性知识外化提供给使用者,知识使用者通过浏览来获取所需信息,同时可以结合自身知识储备使知识进一步外化,知识反馈者通过投票、评论等行为对知识提供者进行反馈,整个过程实现了知识共享、交流和创新[10]。本文基于万莉[10]的研究成果,并结合技术问答社区知识交流的特征构建技术问答社区知识交流效率的指标体系,如表1所示:

(1)投入指标X1——用户数量。用户是技术问答社区开展知识交流的主体,知识的提供和传播都依赖于这一主体。本文统计的用户数量为实际参与到知识交流中的人员数量,即各板块参与发帖和回帖的人员数量,不包括仅注册或投票的人员,本文认为这两类用户不能视作知识交流投入。

(2)投入指标X2——发帖数量。用户依据所探讨的主题选择相应板块进行发帖,发帖数量充分说明用户在这一领域知识交流精力的投入程度。

(3)投入指标X3——讨论时间。即从发帖到采集时获取到的最后回帖的时间跨度,衡量知识交流的持续时间,反映了用户在整个知识交流过程中的时间投入情况。

(4)产出指标Y1——浏览数量。即各个板块中每篇帖子截止到统计时间的浏览数量,直观反映出用户对帖子主题的关注程度,帖子的浏览数量越大,信息传播范围越广泛。

(5)产出指标Y2——回复数量。即用户对感兴趣的帖子进行相关内容的回复数量,其中一个用户针对不同帖子进行回复按帖子数量计数,针对同一帖子多次回复按1次计数。帖子的持续回复是将主题进一步内化和吸收的过程,直观反映了话题热度,回帖数量越多说明知识交流的程度越高,传播的影响力越大。

(6)产出指标Y3——投票数量。即用户针对答案的准确与否投赞成票和反对票,每人每帖限投一票,票数的高低与帖子的优劣程度息息相关,有助于用户快速甄别更优质的帖子,是技术问答社区知识交流效率评价的核心指标。

4  结果分析与讨论

4.1  描述性统计分析

本文通过对“开源中国”社区15个热门标签板块的数据依指标体系进行整理与统计,结果如表2所示:

如表2所示,不同板块间指标差异较大,总的来说,投入指标数量越多其产出指标数量也相应越多,如Java板块3个投入指标数量均为最高,其3个产出指标数量也最高;用户数量与发帖数量基本呈正比关系,如Java板块用户与发帖量均为最高,而用户量较少的jQuery和Ubuntu板块发帖量也较少;发帖量越多其讨论时间也越长,如Java板块发帖量的均值高达23 846.33篇,而Ubuntu板块仅为389.33篇。

4.2  基于SBM模型分析知识交流静态效率

本文基于MaxDEA PRO 6.3件中的SBM无导向模型对“开源中国”社区15个热门板块的投入和产出数据进行测算,分别得到综合技术效率、纯技术效率和规模效率。综合技术效率是衡量现有投入资源是否达到最优产出状态[25],测量技术问答社区中知识交流的整体管理水平;纯技术效率是指投入规模一致时各板块最佳的投入產出效果,由此评估技术问答社区在技术和管理等方面的客观状况;规模效率为综合技术效率与纯技术效率之比[26],是指技术因素保持不变时投入指标的增长所导致的效率变化,反映了技术问答社区的资源配置状况。

根据表3所示,“开源中国”社区15个热门板块的平均综合技术效率指数介于[0.652,1],平均值为0.841,处于良好水平。2018-2020年间,每年分别有6个、9个、7个板块知识交流效率达到DEA有效(综合效率指数为1),而各板块知识交流综合技术效率变化趋势各异,本文将其划分为以下4个类型:①成熟型,包括Java、JFinal和Apache Echarts板块。这3个板块每年均达到DEA有效,说明这些板块整体管理水平达最优状态,投入与产出要素的组合与规模合理,目前正处在生产前沿面上,知识交流效率达到理想效果。②成长型,包括PHP、Linux和CentOS板块。2018年这3个板块综合技术效率值均较低,但随着时间的变化不断发展,均逐步达到DEA有效状态。③波动型,包括Android、MySQL、Spring、Eclipse、jQuery、Apache Tomcat和Android SDK板块。这7个板块的综合技术效率发展趋势不稳定,均呈现出起伏状态,其中MySQL和Apache Tomcat板块在2019年出现最低值,表现为开口向上的具有凹折点的折线,其余5个板块在2019年均出现最高值,表现为开口向下的具有凸折点的折线,且Spring、jQuery和Android SDK 3个板块在2019年达DEA有效状态。    ④衰退型,包括Python和Ubuntu板块。这两个板块均在2018年达DEA有效状态,且Ubuntu板块在2019年也达DEA有效状态,但2020年二者均出现大幅下降趋势,说明其要积极寻找原因并借鉴成熟型板块的管理制度与发展模式,对投入产出要素的资源配置进行优化。

除此之外,从各板块知识交流综合技术效率三年均值来看,无效单元占比高达80.00%,即大部分板块未达到理想状态,顶尖水平与下游水平板块数量相差较大,说明各板块知识交流的差距较大。其中,Android板块和Eclipse板块三年来效率值均未达到有效,Eclipse板块效率值最低,仅为0.652,说明这两个板块在投入、产出以及管理上均存在较大问题,是未来关注的重点对象。

由图1可知,在2018年各板块效率均值为0.829,存在9个板块效率值高于均值;2019年各板块效率均值达0.927,相较于2018年出现显著提升,存在11个板块效率值高于均值;2020年各板块效率均值达0.767,出现大幅度下降趋势,存在8个板块效率值高于均值。15个板块知识交流效率均值呈现一定的波动变化,且在2020年最为明显,Eclipse板块出现0.423的极低值,说明2020年由于疫情等重大事件造成社区内各板块的知识交流效率差异较大。

根据表4可知,导致单元无效的原因可以分为3类:①板块的纯技术效率有效而规模效率无效,如2018年PHP、Spring、Linux和Apache Tomcat板块,2019年Python板块以及2020年MySQL、jQuery和Ubuntu板块的纯技术效率均达1,而规模效率无效且范围处于[0.427,0.966],板块间无效值差距较大,说明此类板块现有的技术与管理水平相对完善,在规模保持不变的前提下,充分利用了技术投入来保证知识交流效率的有效,但存在由于规模结构不合理产生的投入冗余现象,导致资源无法充分利用,且板块间实际规模与理想规模间存在不同程度的差距,只有对规模结构进行合理改善,才能有效提升综合技术效率,从而达到DEA有效状态;②板块规模效率有效而纯技术效率无效,目前只有Android板块在2019年规模效率达1,而纯技术效率无效,说明其规模结构较为合理,资源配置能力较高,对于投入要素的利用较充分且产出效率较高,但当前的技术和管理水平较差,是制约综合技术效率达有效的关键所在,该板块需要强化内部管理,引入较为先进的技术和设备,建立一定的技术壁垒,从而提高纯技术效率;③板块的纯技术效率和规模效率均无效,在2018-2020年间每年的板块数分别占比55.56%、66.67%和62.50%,说明此类板块资源配置与技术管理同时出现问题,二者均需加强。在第三类板块中,只有2018年jQuery板块出现纯技术效率较高,而规模效率较低情况,其余板块均为纯技术效率较低,规模效率较高,且规模效率范围处于[0.827,0.986],无效值较为集中且与有效值差距较小,说明其规模效率方面易改进,可以完善投入产出的合理配置,进行社区的精耕细作,从而实现知识交流综合技术效率有效。而纯技术效率方面的改进空间较大,社区内制度和技术管理水平均需要加强,同时应采取积极措施增加用户数量及发帖数量的投入,减少不必要产出,并提升发帖质量,促进投入要素的有效利用,以不断提升纯技术效率。值得一提的是,Android和Eclipse板块三年来从未达到过有效水平。

可以发现,“开源中国”社区DEA无效板块普遍存在规模效率较低的问题,这说明在知识交流过程中,忽视了规模的扩大,在今后的发展中应多加关注知识投入和产出的合理配置。此外,虽多个板块出现纯技术效率有效情况,但相较于规模效率值所处范围,社区内板块的技术管理水平较高,但两极化现象依旧严峻,制约着综合技术效率的提升,未来应不断加强技术管理水平和制度的约束,建立起能够激发用户参与的互惠政策,促使投入资源得到合理利用,提高知识交流的质量。

4.3  基于Malmquist指数分析知识交流动态效率

上文基于SBM模型对“开源中国”社区知识交流效率的分析是时间点上的静态分析,为了进一步探究知识交流效率变动的内在因素和趋势,本文根据“开源中国”社区15个热门板块在2018-2020年间的投入与产出数据,采用MaxDEA8软件测算出其全要素生产率指数(tfpch)、技术效率变化指数(effch)和技术进步变化指数(techch)[27],其中effch衡量DMU相对于生产前沿面的接近程度,用来反映社区内各板块对现有资源的有效利用能力,可由纯技术效率(pech)和规模效率(sech)决定[28],techch代表各个时期最佳效率值的变化规律,用来衡量社区内各板块的技术创新是否随生产前沿变化,上述指标可以直观反映出各板块知识交流动态效率的客观情况。

表5为“开源中国”社区2018-2020年各生产率指数变动情况。从全要素生产率来看,整个阶段均值为1.156,年平均增长率為15.60%,且每个周期指数均大于1,说明知识交流效率处于上升趋势;从技术效率来看,整个阶段均值为0.967,说明其总体技术效率变化呈现下降趋势,主要由于2019-2020年下降了25.90%;从技术进步来看,整个阶段均值为1.195,上升了19.50%,说明总体技术进步变化指数呈现上涨趋势,主要得益于2019-2020年上涨了41.40%,这表明技术振兴是“开源中国”社区知识交流效率上升的主要原因;从纯技术效率和规模效率来看,均处于下降趋势,平均降幅为1.30%和2.00%,二者在一定程度上限制了技术效率的改善,这与表3中所得结果相符。

综合前面分析发现,“开源中国”社区知识交流效率良好且2018-2020年间全要素生产率处于上升趋势,为探索其深层次原因,下文分别对15个热门板块的全时段和分时段Malmquist指数进行分析。

表6为“开源中国”社区15个热门板块全时段Malmquist指数情况,约66.67%板块的全要素生产率呈现增长态势,15个板块平均增幅为15.60%,其中技术效率变化指数平均降幅3.30%,但技术进步变化指数平均增幅19.50%,从而拉高了全要素生产率。从图2可以明显看出“开源中国”社区全要素生产率增长的动力来源是技术进步,这也得益于近年来我国IT技术产业技术水平的显著提升。15个板块中表现突出的是JFinal板块,全要素生效率增幅高达107.8%,高增长态势主要归因于技术进步增幅高达107.8%。技术效率呈现下降趋势,即使是呈现全要素生产效率上升状态的板块中也有约33.33%出现了技术效率下降的情况,说明技术产业各种资源的协调不够优化,现有的技术潜能也没有得到最大程度的释放,管理水平有待进一步提高。全要素生产率呈下降趋势的33.3%板块中,Java和Apache Echarts主要是技术进步出现下降,Python和Eclipse为技术效率退步,而Spring技术进步和技术效率均呈现降态。由图3可以发现,虽然纯技术效率和规模效率对技术效率存在绝对影响作用,但绝大多数技术效率呈现下降的板块,其规模效率也同时呈现下降趋势,而纯技术效率却没有呈现类似的变化情况,说明应加大对于现有资源结构和规模的整合,提高创新水平,将具有创新性的投入应用于研发关键技术和核心信息,提高资源配置状况,从而推动其各板块技术效率进步。

表7为“开源中国”社区分时段各板块Malmquist指数动态变动情况,2018-2019年间,53.33%的板块全要素生产率呈现增长态势,其中半数以上涨幅超过50%,15个板块平均涨幅11.20%,并且观察到其技术效率与技术进步均呈同步增涨态势,说明此阶段管理得当,技术水平发展良好,15个板块中以Android板块最为突出,全要素生产率高达2.887。2019-2020年间,53.33%的板块全要素生产率的增长态势,但技术效率呈下降趋势,技术进步呈上升趋势,均变化明显,技术效率的退步是由于纯技术效率和规模效率分别出现6.90%和9.20%的退步所致,说明虽然在此期间技术发展水平持续升高,但受制于资源利用率水平较低,导致发展不平衡,出现了一定程度管理不当现象。图4和图5为各指数2019-2020年与2018-2019年两个时段的差值,也佐证了第二时段综合发展情况突出,但技术效率发展限制了“开源中国”社区的整体发展水平。

5  结论与建议

本文在已有研究的基础上,基于SBM-Malmquist对技术问答社区知识交流效率进行测度评价,结果表明:2018-2020年间“开源中国”社区15个热门板块平均知识交流效率良好,但板块间的差距较大,每年仅有3个板块达到DEA有效,并且板块知识交流效率均值呈现“先上升后下降”的波动变化,以2020年最为明显,说明如疫情等重大事件可能会造成社区知识交流出现明显下降;无效单元中仅存在Android板块在2019年规模效率有效,说明板块资源配置水平参差不齐,投入资源并未得到优化配置,投入冗余而导致资源得不到充分利用;全要素生产率处于上升趋势,平均涨幅15.60%,技术效率变化呈现下降趋势,技术进步变化指数呈现19.50%的上涨幅度,且2019-2020年间上涨了41.40%,充分说明技术振兴是“开源中国”社区知识交流效率上升的主要原因,但存在管理不够完善及资源利用率不够高的问题仍亟待解决。

基于上述研究结果,本文从运营管理角度出发,为提高技术问答社区知识交流效率提出以下建议:

第一,整合技术问答社区资源管理。社区管理者应根据自身定位,积极对标国外先进技术问答社区,结合自身实际情况吸纳有效改进措施。同时,合理定位用户群体,针对Java、JFinal和Apache Echarts等每年均达到DEA有效的板块设置相应的门槛,保证用户质量与数量的同时打造出其特有的文化氛围。另外,技术问答社区的有序运行不仅依赖于用户的发帖、投票和浏览,社区管理者应主动引导,例如定期发起时效性强的热点内容吸引用户参与并讨论,同时规避由于技术问答社区的不断发展而引发的信息激增现象,这会导致内容重复、低相关性和低质量的信息大量堆积,从而影响用户体验效果。

第二,优化技术问答社区资源配置。可以采用集约式管理,针对资源配置水平较低的板块从量的提升逐步过渡到质的把控,有针对性地根据内容对帖子进行筛选,例如管理员可通过选取精华帖子并邀请具有较高活跃度和荣誉值的用户进行回帖,同时为回帖和发帖质量等级相对较高的用户提供一定的激励,如社区虚拟金币等。同时,优化投票机制,同一回帖者下的再回帖者和发帖者均设置投票功能,并对得票数量高的用户给予一定的物质和精神奖励,从而不断调整社区的内部激励机制。除此之外,社区可以在主页或功能栏为新用户设置实操性较强案例的教程,提高用户信息素养,提升用户黏性,从而优化技术问答社区单位投入的所得产出量。

第三,推动技术问答社区技术创新。可以设置同类问题的推送功能,例如根据用户的发帖、浏览与回帖等情况锁定用户所感兴趣问题的搜索进程和轨迹,通过对用户深度挖掘并聚类构建用户画像,可以更精准地进行同类问题的推送并及时推荐可参考的相关评论,同时设置内部监管,屏蔽不良信息,使用户尽可能多地获得有用信息。另外,人工智能技术的进步可以促进技术问答社区人机对话模式的形成,匹配数据库将同类问题的答案自动回复给用户,并可以根据用户所提关键词引导用户进入相关领域或展现类似知识图谱的推荐功能,激发用户进一步思考并提升知识交流效率。

本文所选取的研究对象和方法具有一定的创新性,但也存在着一定的不足和局限,在指标体系的构建中,根据技术问答社区自身特征加入了“帖子投票数量”这一新指标,但只从微观层面对知识交流效率进行了测度,对于宏观层面上影响知识交流效率的因素有待进一步研究,因此在未来持续跟进研究中,可将数据包络分析法与其他方法相结合,在测度知识交流效率的同时,进一步分析知识交流效率的影响因素,从而对技术问答社区提出更深层次改善建议。

参考文献:

[1] 彭红彬, 王军.虚拟社区中知识交流的特点分析——基于CSDN技术论坛的实证研究[J]. 现代图书情报技术, 2009(4): 44-49.

[2] 李胜利, 钟滢.中外技术问答社区的实证对比研究与启示——以CSDN和Stack Overflow为例[J]. 情报学报, 2020, 39(9): 989-1000.

[3] 蒋竞, 吕江枫, 张莉.中文软件问答社区主题分析研究[J]. 软件学报, 2020, 31(4): 1143-1161.

[4] 刘雨农, 刘敏榕.虚拟知识社区的社会网络结构及影响因素——以知乎网为例[J]. 图书情报工作, 2018, 62(4): 89-96.

[5] LIU Z, JANSEN B J. Questioner or question: predicting the response rate in social question and answering on Sina Weibo[J]. Information processing & management, 2018, 54(2): 159-174.

[6] JIN J H, LI Y J, ZHONG X J, et al. Why users contribute knowledge to online communities: an empirical study of an online social Q&A community[J]. Information & management, 2015, 52(7): 840-849.

[7] 沈洪洲, 史俊鹏, 马巧慧.社会化问答社区回答内容质量影响特征研究——以“知乎”为例[J]. 情报杂志, 2020, 39(10): 169-175, 202.

[8] 王伟, 冀宇强, 王洪伟, 等.中文问答社区答案质量的评价研究:以知乎为例[J]. 图书情报工作, 2017, 61(22): 36-44.

[9] 李丹.中美网络问答社区的对比研究——以Quora和知乎为例[J]. 青年记者, 2014(26): 19-20.

[10] 万莉.学术虚拟社区知识交流效率测度研究[J]. 情报杂志, 2015, 34(9): 170-173.

[11] 闫安, 李添秀.虚拟社区中知识获取方式对获取结果的影响研究——以知乎社区为例[J]. 图书馆理论与实践, 2020(1): 65-71, 87.

[12] 庞建刚, 吴佳玲.基于SFA方法的虚拟学术社区知识交流效率研究[J]. 情报科学, 2018, 36(5): 104-109.

[13] 宗乾進, 吕鑫, 袁勤俭, 等.学术博客的知识交流效果评价研究[J]. 情报科学, 2014, 32(12): 72-76.

[14] 晋升.基于DEA方法的学术虚拟社区知识交流效率研究[D]. 郑州:郑州大学, 2019.

[15] 杨瑞仙, 黄书瑞, 王元锋.基于三阶段DEA模型的在线健康社区知识交流效率评价研究[J]. 情报理论与实践, 2020, 43(10): 122-129.

[16] 胡德华, 张又月, 罗爱静.基于遗传投影寻踪算法的学术虚拟社区知识交流效率研究[J]. 图书馆论坛, 2019, 39(4): 67-73, 83.

[17] 吴佳玲.虚拟学术社区知识交流效率研究[D]. 绵阳:西南科技大学, 2019.

[18] 袁永旭, 张亚飞, 马瑞敏, 等.基于SBM-Tobit模型的在线健康社区知识交流效率研究[J]. 情报科学, 2021, 39(5): 106-114.

[19] 魏权龄.数据包络分析[M]. 北京:科学出版社, 2004.

[20] 陈晓红, 易国栋, 刘翔.基于三阶段SBM-DEA模型的中国区域碳排放效率研究[J]. 运筹与管理, 2017, 26(3): 115-122.

[21] 万莉, 程慧平.管理科学部重要期刊知识交流效率评价——基于Super-SBM与SFA模型的实证研究[J]. 现代情报, 2017, 37(11): 69-73.

[22] TONE K. A slacks-based measure of efficiency in data envelopment analysis[J]. European journal of operational research, 2001, 130(3): 498-509.

[23] 孙红蕾, 马岩, 郑建明.城市信息基础设施效率测评研究[J]. 图书馆论坛, 2017, 37(5): 1-9.

[24] 杨瑞仙, 张广轶.学术虚拟社区知识交流过程与机理研究[J]. 现代情报, 2020, 40(10): 52-61.

[25] 王俊俊.基于SBM-Malmquist的广西旅游生态效率研究[D]. 桂林:桂林理工大学, 2020.

[26] 方叶林.中国省域旅游业效率及演化机理研究[D]. 南京:南京师范大学, 2014.

[27] 洪图, 李飚.我国农业类上市公司研发效率测度与划分——基于SBM-Malmquist模型和企业生命周期的实证分析[J]. 经济问题探索, 2020(9): 65-77.

[28] 陈明红, 谢晓惠.网络信息资源生态化配置效率评价研究[J]. 情报理论与实践, 2020, 43(10): 81-87.

作者贡献说明:

丁  楠:设计和改进研究方案,修改论文;

曹玮倬:提出研究选题,搜集与分析数据,撰写与修改论文;

相甍甍:参与研究方案、研究思路设计。

Research on Knowledge Exchange Efficiency Measurement of Technical Question-Answering Community Based on SBM-Malmquist

Ding Nan  Cao Weizhuo  Xiang Mengmeng

School of Management Science and Information Engineering, Jilin University of Finance and Economics, Changchun  130117

Abstract: [Purpose/Significance] The current research on knowledge exchange in technical Q&A communities is not perfect. This article uses data envelopment analysis method to study the efficiency of knowledge exchange in technical Q&A communities, and finds the differences and changing laws between different sectors to provide references for improving community management and improving the efficiency of knowledge exchange. [Method/Process] Based on the construction of the knowledge exchange efficiency evaluation index system, 15 popular sections of the “OSCHINA” community were used as the research samples, and the static and dynamic efficiency values of the knowledge exchange are calculated and analyzed deeply based on the SBM model and the Malmquist index. [Result/Conclusion] The average knowledge exchange efficiency among the 15 popular sections of the “OSCHINA” community is good, but the gap between the sections is large, and the overall knowledge exchange efficiency is on the rise trend, mainly because the technological progress change index increases 19.50%. The increasing rate indicates that technological revitalization is the main reason for the increase in the efficiency of knowledge exchange in the “OSCHINA” community, but a certain degree of mismanagement has occurred and the utilization of resources is low.

Keywords: technical question-answering community    SBM model    Malmquist index     knowledge exchange efficiency    OSCHINA

作者簡介:丁楠,讲师,博士,硕士生导师;曹玮倬,硕士研究生,通信作者,E-mail: cancer_0001@163.com;相甍甍,讲师,博士,硕士生导师。

收稿日期:2021-10-22        发表日期:2022-03-10        本文责任编辑:刘远颖

猜你喜欢
开源板块交流
如此交流,太暖!
加强交流沟通 相互学习借鉴
板块无常 法有常——板块模型中的临界问题
周樱 两岸交流需要更多“对画”
板块拼拼乐
五毛钱能买多少头牛
A股各板块1月涨跌幅前50名
大家说:开源、人工智能及创新
开源中国开源世界高峰论坛圆桌会议纵论开源与互联网+创新2.0
开源计算机辅助翻译工具研究