开源软件项目发起人个体特征对项目绩效的影响
——基于GitHub 的实证研究

2021-12-04 13:04董振伟张庆芝
科技管理研究 2021年20期
关键词:开源影响力动机

王 玲,董振伟,张庆芝

(1.中国政法大学商学院,北京 100088;2.中国科学院大学公共管理学院,北京 100049)

1 研究背景

开放源代码软件(以下简称“开源软件”)是开放式创新的一种独特形式,来自于全球各地具有不同文化背景、自愿付出不求回报的工程师们自发集体完成软件开发工作,并将源代码向公众免费开放[1]。Linux、Apache、Firefox 等许多在各领域内占据绝对优势的优秀软件都是由这种方式完成开发。

相对于传统商业软件开发模式,开源软件在人力支出降低和创新效率提升方面优势明显,但是开发效率和质量存在不足,原因在于商业软件项目在开发初始阶段就预设了用户,从终端用户角度考核软件最终质量和使用结果,而开源软件项目通常并无预设用户需求,其开发过程是一个持续改进的动态开发过程[2]。在开源软件系统模式创造的海量知识产品中,优秀知识产品的相对比例较低,使用者众多而知识贡献者较少,用户往往仅从开源社区获取开源软件或代码,但是缺乏知识贡献的意愿,从而影响了开源软件项目绩效。因此,在开放治理框架下,如何提高开源软件项目绩效是学界和业界共同关心的议题[3]。

目前关于开源软件绩效影响因素已经有一系列有价值的成果,如陈光沛等[4]梳理了开源社区的相关文献,分别从企业与个体维度提出了“参与动机—参与过程—参与绩效”的关于项目绩效前因的框架,不过,开源软件的实证研究仍存在不足。首先,已有研究虽然意识到了开源软件参与者的重要性,但尚未针对参与者大类中的发起人进行针对性的研究。由于项目发起人在项目开发中往往扮演着所有者和运营者以及“看门人”的角色[5],其个体特征对项目过程与绩效结果的影响值得重点关注;其次,当前研究多聚焦于参与个体的参与动机维度,鲜有全面探讨个体的影响力、价值观以及创新意识等要素对项目绩效的影响;最后,已有研究多依赖于案例或问卷研究,如Chen 等[6]对我国开源软件项目的实证研究,研究结论的外部效度和内部效度有待于进一步结合客观数据进行检验。

为此,本研究聚焦于开源软件项目中发起人的角色,探析项目发起人的动机、能力与意识对于项目绩效的影响。Raymond[7]在开源运动兴起之际就强调了项目发起人对软件开发的影响,认为开源软件项目的创建往往是源于发起人的个人兴趣和需求,发起人必须要有良好的人际关系、交流技能和人格魅力,才能在后续的开发中吸引其他开发者的兴趣并得到他们的帮助。基于全球最大的开源软件代码托管平台GitHub 上的8 053 组项目,本研究遴选其中有效用户并随机收集了333 位项目发起人问卷数据,研究结果揭示并检验了“开源软件项目发起人特征—项目知识共享—项目绩效”的因果路径,为优化开源软件创新流程和结果提供参考依据。

2 理论与研究假设

任伶[8]、Wasko 等[9]均提出知识共享嵌入在个体或群体之间进行知识传递并从中共同产生和创造新知识的动态过程中,开源软件开发过程实际上就是个体之间进行知识共享以实现创新性解决方案的过程。已有研究指出,开源软件绩效高度依赖于社区参与者之间知识共享的程度[10]。本研究进一步从开源软件项目发起人的动机、个人影响力、价值观以及创新意识4 个维度,探析这些微观的个体特征如何影响开源软件开发过程中的知识共享程度、进而影响到开源项目的绩效。

2.1 项目发起人参与动机与项目成员内的知识共享

个体进行知识共享的动机包含内在动机(喜好和乐趣、能力提升、甘愿付出等)和外在动机(职位升迁、物质嘉奖、口碑地位等)[11]。开源软件项目的开发者是一批没有直接项目薪酬而自愿付出的群体,项目参与者的主要动机是追求乐趣,爱好与兴趣等内在动机[12]。与此同时,也有研究发现,开发人员期望通过用户反馈和同行观察提升自身技术能力[13]。在经济性动机维度,参与开源项目开发人员试图通过开源项目证明自己的工作能力和行业认可程度,获得口碑,进而更好地实现职业晋升或职业发展。

开源软件项目的发起人作为主要的开发人员,其参与动机强度对知识共享程度产生重要影响,参与动机越强烈,越会投入时间和精力在开源软件项目开发中,会更倾向于分享高质量的知识以获得认可,更频繁地自我迭代代码和技术,并积极与不同参与者,包括用户之间进行互动和迭代,吸引和推动项目内成员间的知识共享。据此,本研究提出如下假设:

H1:项目发起人参与动机与项目内成员间知识共享水平正相关。

2.2 项目发起人影响力与知识共享

以GitHub 为代表的开源软件项目社交平台,每位参与者都有自己的虚拟空间,可以在上面展现自己的开源工作动态。本研究中的个人影响力,主要指项目发起人在虚拟社区中对与其接触的人产生影响的能力。Grewal 等[14]发现项目参与者的网络嵌入程度越高,越可能通过吸引更适合的开发者参与,达到提升项目绩效的目标;Hahn 等[15]研究了先前合作关系对新项目团队形成的影响,发现开源项目参与者倾向加入与之有过合作联系的项目发起人所领导或参与的团队;Zhou 等[16]发现依附于社会网络的关系型社会资本和结构型社会资本对项目中的知识整合有正向影响;周涛等[17]提出在开源社区情景下,个人影响力通过声誉资本反映会诱发其他社区成员评价认同,吸引更多的用户参与。

影响力高的项目发起人可以通过匹配项目需求、协调开发者工作以及跟进问题解决进度等方式,使开源社区始终保持较高的用户凝聚力;影响力高的参与者由于在整个社交网络中拥有高的存在价值,更容易把信息输送到更广大范围用户,进而获得更多关注者。因此,个人影响力保证了更广泛和高频率的知识获取,提升了开源软件项目知识共享的水平。据此,本研究提出如下假设:

H2:项目发起人个人影响力与项目内成员间知识共享水平正相关。

2.3 项目发起人价值观与知识共享

开源社区的价值观主要包括开放自由、共享合作与极客信念3 个层次。其中,开放自由是指参与者对沟通方式的开放程度;共享合作是指社区内成员之间的分享文化;极客信念是指对信息技术有疯狂偏好并自愿投入精力建设社区的成员,一方面对创新失败抱有宽容理念,另一方面对前沿技术不断追求和学习。在开源社区活动过程中,项目发起人价值观与开源社区主导价值观契合的程度,将直接影响项目内的知识共享水平。

一方面,“开放自由、共享合作、极客信念”的价值观会反映为开源软件发起人的内在行为准则,激发发起人在项目管理过程中开放自己的核心技术知识,更具包容性地进行多元知识的整合,并追求更高的项目绩效实现;另一方面,项目发起人的价值观具有一定传导机制,会塑造项目开发团队内部的群体文化氛围:鼓励提高成员间信息的开放度和自由度有利于提高知识共享的广泛程度[18],鼓励分享的组织文化更有利于项目团队内部进行知识管理与知识共享[19],极客信念会引导项目参与者不断优化迭代有利于实现知识共享的知识的质量,并促进知识的进一步转化及应用[20]。综上,项目发起人的价值观与“开放自由、共享合作、极客信念”契合的程度越高,越有利于促进项目组成员间知识共享[21]。据此,本研究提出如下假设:

H3:项目发起人个人价值观与项目内成员间知识共享水平正相关。

2.4 项目发起人创新意识与知识共享

项目发起人的创新意识主要指其在项目知识的创新潜力挖掘与应用方面认识评估的态度与能力[22]。开源软件项目发起人作为项目主要管理者,具有较大管理权限,决定什么人可以成为贡献者、什么代码能够进入主干代码、是否采用新技术等一系列问题。已有研究表明,组织领导者的创新意识会显著积极影响企业的创新绩效[23]。类似地,开源软件项目发起人对于创新的认知和理解越高,其越能够引导知识的整合与管理的过程,也越能产生高水平的知识共享[24]。

开源软件项目发起人探索新兴技术的迫切程度越高,以及引入高质量代码进入其所负责项目的能力越强,越会激发更多的具有较高技术水平的参与者加入项目开发,成为创新性知识的贡献者[25]。通过有效地引导和激发项目内成员的知识分享过程,项目内整体的知识共享水平得以提高[26]。据此,本研究提出如下假设:

H4:项目发起人个人创新意识与项目内成员间知识共享水平正相关。

2.5 知识共享与项目绩效

开源软件项目没有预设的用户,难以从用户使用评级或经济型利润方面衡量其绩效。徐冰村等[27]指出开源软件项目绩效体现在3 个维度,分别是市场维度、技术维度和社区维度。市场维度从软件项目的用户使用数来衡量,可用GitHub 上的复刻(fork)数量、话题(issues)数量来直观反映;技术维度指项目的质量,可用GitHub上项目中的点赞(star)数量、关注(watch)数量来反映可替换性、代码模块化、可持续性、准确度等特征;社区维度包括项目内成员的活跃性及项目的活跃性,可用更直观的贡献者数量、贡献(commits)数量来直观反映。

知识通常可以分为隐性知识和显性知识两类[28],难于通过语言编码交流的知识归为隐性知识,能够进行语言编码和解释的知识归为显性知识。其中,隐性知识难以记录,只能通过积累或培训方式进行挖掘,内含价值大但是传播难度高。Zahra 等[29]、Maravilhas 等[30]指出,知识在显性和隐性之间的转换蕴含了知识的迁移、重组与新知识的创造。Barao等[31]提出,知识密集型组织中高效的知识和信息的共享与管理是知识密集型组织创新绩效的重要保障。知识共享是知识整合和创新的重要前因,知识广度和深度影响开源程序项目的创新绩效。知识共享正向影响开源项目的市场触达程度、社区活跃程度,并提高技术迭代的效率和质量。据此,本研究提出如下假设:

H5:项目知识共享水平与项目绩效正相关。

从以上论述的开源软件项目发起人的参与动机、个人影响力、个人价值观和创新意识对项目团队内知识共享的直接效应可见,项目发起人的参与动机、个人影响力、个人价值观及创新意识通过知识共享的渠道促进了开源软件项目绩效的提升。据此,本研究进一步提出如下假设:

H6:知识共享在项目发起人影响项目绩效关系中起到中介作用。

研究整体框架如图1 所示。

图1 研究假设与模型

3 研究方法

3.1 样本与数据收集

研究样本来源于全球最大且最有影响力的开源软件代码托管平台GitHub 中的用户数据。GitHub 于2008 年上线,主要服务包括Web 管理页面、Git 代码仓库托管、代码片段分享和在线代码编辑器等方面内容。在GitHub 社区中,用户们可以发布和管理自己开发的项目或者代码,同时可关注其他开发者及其最新动态。GitHub 的功能主要包括关注、点赞、复刻、话题、合并代码请求(pull request,PR)。关注是指社区中用户想要关注某一个人或者某一个项目库而使用的功能,关注之后可以对某一个项目或者人产生的动态进行实时地跟踪,相当于一般社交媒体的关注;点赞相当于收藏功能,用户点赞某一个项目库后就可以在点赞界面找到收藏的项目;复刻是将某一个项目拷贝到自己的库中,也是对原项目建立了一个分支,复刻后可以对该项目进行任何修改;话题是对项目的漏洞或者项目改进等讨论的地方,相当于一个研讨房间;合并代码请求是某一用户对项目进行了修改后,可以向原项目发起请求,将修改合并到原始项目中。

研究数据包括两个来源:一是运用Python 软件直接从GitHub 平台抓取与开源软件项目个人影响力衡量指标相关的数据;二是通过对GitHub 上项目发起人进行问卷调查,补充收集的指标数据。通过编写Python 程序对GitHub 平台上的项目进行抓取,抓取过程主要分为三步:第一步,GitHub Trend List 随机抓取项目数据的基本数据,获得发起人的主页链接,共获得8 053 个项目数据;第二步,根据第一步抓取的用户地址抓取开源软件项目发起人的基本数据;第三步,利用Xpath 分拆抓取的信息获取目标用户属性。经过对8 053 个抓取数据的清洗,剔除无效用户,确认有效项目4 603 个(以下简称“样本项目”),对应项目发起人4 603 位(以下简称“样本发起人”),具体客观数据如表1 所示。

表1 开源软件项目及其发起人的样本数据类别

样本发起人的个人价值观、创新意识、知识共享等数据均通过问卷调查法进行收集。调查问卷涉及调查对象的项目名称、性别、年龄、最高学历、公司规模等22 个问题,各题项设计参考了已有的理论文献,测量变量最终信度的克朗巴哈系数(Cronbach’a)都在0.8 以上。题项测量均采用李克特量表5 分制进行评分(1 代表非常不符,5 代表非常符合)。为了确保测量构念的效度,采用访谈形式对相关专家进行预调研,并邀请部分开源软件发起人进行预测试,根据反馈建议对问卷题项进行了修订。根据样本发起人的公开联系方式发放调研问卷,回收340 份,剔除无效问卷后最终获得有效问卷333 份,有效回收率为7.2%。从333 份有效问卷结果来看,男性占比为95.20%;31~35岁占比最高,达到41.14%以上;本科学历占比为55.26%;员工人数为100 人以下的小微企业占比为52.55%。

3.2 变量测量

(1)项目绩效(xmjx)。根据项目绩效模型,通过主成分分析,将watch、star、fork、commit、贡献者、总提交讨论主题和总PR 数量这7 个指标进行降维,获得项目成功度的综合性量化指标。主成分分析的解释总方差结果显示,最终累积解释总方差达到76.86%,同时各因子成分矩阵系数均大于0.6。

(2)个人影响力(gryxl)。项目发起人影响力主要体现在参与组织数量、拥有代码库的数量、点赞项目数量、有多少关注者、关注了多少人和去年贡献数量6 个指标,通过主成分降维,并经过多次随机抽样验证,最终筛选出参与组织数量、点赞项目数、有多少关注者、去年贡献数量作为最终评判个人影响力的主要指标,并从中提取一个变量作为综合量化指标。主成分分析的解释总方差结果显示,最终累积解释方差比达到66.74%,各因子载荷均大于0.6。

(3)参与动机(cydj)。该变量的测量由6 个题项构成,包括“我出于爱好和兴趣发起并参与到开源软件项目中”“发起并参与开源软件项目有利于提高我的技术水平”等。对参与动机量表进行探索性因子分析,KMO值为0.89,球形检验值低于0.01,表明适合进行探索性因子分析。因子分析最终提取1 个因子,累计解释方差达到63.73%。

(4)个人价值观(grjzg)。该变量的测量由5个题项组成,包括“我关注组织内部的沟通”“我认为团队内的公平是非常重要的”“我认为团队成员必须信任团队成员”“我非常包容失败”“我很愿意承担风险”。对个人价值观量表进行探索性因子分析,KMO 值为0.86,球形检验值低于0.01,表明适合进行探索性因子分析。因子分析最终提取1个因子,累计解释方差达到64.95%。

(5)创新意识(cxys)。该变量的测量由5 个题项组成,包括“我在项目中有创新的想法”“我在项目中实施了创新”“我认为我们会从创新中获益”“我认为创新非常必要,并且会向其他成员推广此想法”等。对参与动机量表进行探索性因子分析,KMO 值为0.89,球形检验值低于0.01,表明适合进行探索性因子分析。因子分析最终提取1 个因子,累计解释方差达到61.64%。

(6)知识共享(zsgx)。该变量的测量由4 个题项组成,主要测量项目的知识分享程度,包括“在我的开源项目中有项目报告”“在我的开源项目中代码记录是非常完善的”“我的开源项目会定期做总结和记录”“我会在我的开源项目内组织经验的分享”。因子分析最终提取1 个因子,累计解释方差达到59.51%。

4 实证检验

4.1 相关性分析

利用Pearson 相关系数r来标识相关性的大小和方向,结果如表2 所示,个人影响力、参与动机、个人价值观、创新意识与知识共享存在显著性的正相关性,其中项目发起人的创新意识与知识共享的相关性最强(r=0.652);个人影响力、参与动机、个人价值观、创新意识与项目绩效显著正相关,其中项目发起人的参与动机与知识共享的相关性最强(r=0.414);知识共享与项目绩效存在显著性的正相关性(r=0.652)。相关性分析初步支持了研究假设。

表2 样本发起人个人特征相关性分析

4.2 假设检验

首先通过层次回归分析对假设进行检验,结果表明参与动机、个人影响力、个人价值观、创新意识均正向显著影响知识共享;将知识共享加入回归模型,降低了个人影响力、参与动机、个人价值观、创新动机对项目绩效贡献的显著性,初步表明知识共享起到了部分中介作用。

为了更好展示因果路径系数,采用Amos 软件进行建模分析,选择χ2/df、IFI、CFI、NFI、NNFI、RMSEA 等指标作为模拟适配性指标,中介效应的模型路径系数如图2 所示。以知识共享作为部分中介的结构方程模型的拟合结果良好,其中χ2/df 为4.62,小于6;RMSEA 值为0.063,小于0.08 的建议阈值;NFI 值为0.904,CFI 的值为0.912,IFI 值为0.912,均大于0.9 的建议阈值。结果显示,项目发起人的个体特征会直接影响开源软件项目绩效。其中,参与动机对项目绩效影响的直接效应为0.26,个人影响力对项目绩效的直接效应是0.13,个人价值观对项目绩效的直接效应为0.12,个人创新意识对项目绩效的直接效应为0.16。参与动机与项目知识共享的路径系数为0.62,假设H1得到了支持;个人影响力与知识共享的路径系数为0.39,假设H2得到了支持;个人价值观与项目知识共享的路径系数为0.42,假设H3得到了支持;个人创新意识与知识共享的路径系数为0.26,假设H4得到了支持;知识共享与项目绩效影响的路径系数是0.56,假设H5得到了支持。综合来看,知识共享在开源软件项目发起人个体特征与项目绩效之间起到部分中介作用,假设H6得到了支持。

图2 样本发起人个体特征对开源软件项目绩效的部分中介效应检验

5 结论与启示

5.1 研究结论

本研究以GitHub 托管平台上的开源软件项目为研究对象,探讨了开源软件项目发起人对项目绩效的影响以及潜在的知识共享机制,结果表明:

(1)发起人的个人特征能够显著影响项目的知识共享程度。通过路径系数的比较,发起人的参与动机对知识共享程度的影响最大,然后依次是发起人的价值观、个人影响力和个人创新意识。这意味着在开源软件开发过程中,发起人的参与动机强度以及个人价值观与开源社区价值观的契合程度比其在影响力和创新意识维度更重要。

(2)发起人的个体特征对于开源社区的项目绩效有显著的正向影响,其中知识共享起到了部分中介作用。一方面与Chen 等[6]和Raymond[7]等已有的开源创新的文献相一致,本研究验证了知识共享在保证开源软件项目开发绩效中的核心作用。因此,在提升开源软件项目绩效的机制设计中,应重点关注设计合理的机制促进知识共享水平的提升;另一方面,知识共享可能并非唯一的作用机制,未来研究也可以进一步探索其他潜在的中介路径。

本研究进一步深化了关于开源软件项目绩效影响因素的研究,不同于以往研究简单区分参与者与用户,针对参与者大类中的项目发起人角色进行了深入探讨,构建了项目发起人的动机、价值观、能力(个人影响力)和意识(价值观与创新意识)对项目绩效影响的整合性框架;同时丰富了知识共享的研究,在开放式创新的情景下,知识共享水平的高低是决定项目绩效的关键,以往研究多关注于个体自身动机对于实际知识分享的影响,而本研究则进一步关注了项目中的关键人,即项目发起人对于知识共享过程的影响,其价值观和创新意识等会通过塑造良性的积极社会互动促进隐性知识和显性知识之间的动态转化,达到项目绩效提升的目的;此外在研究方法上,相比以往单一依赖调查问卷数据的研究,本研究收集了一手问卷数据和二手平台数据,开发和验证了基于客观数据的项目绩效评估,能够更好地捕捉项目发起人的特征通过知识共享机制作用于项目绩效的路径。

5.2 研究启示

本研究基于开源软件项目发起人的个体行为视角,探索了开源软件项目绩效的重要影响因素及其作用机理。研究得到启示如下:

(1)项目发起人对于促进知识共享与提高项目绩效起到重要的影响作用。从发起人的角度讲,首先,发起人出于事业热爱、能力提升、甘愿付出精神会影响并促进项目参与者的分享意愿;其次,发起人要注重扩大自己的个人影响力,提高参与组织的数量,另外增加粉丝数量、关注项目数量以及个人的历史贡献数量;再次,发起人还要积极营造良好的社区文化氛围,增加贡献者之间的沟通与认同,在成员之间公正地进行任务分配,并对失败抱有宽容的态度。对于试图从开源社区平台获得知识的用户来说,在开源软件项目的选择时,可以将项目发起者的特征作为项目质量甄别的参考要素。

(2)知识共享在项目发起人与项目绩效之间起到中介效应。在知识共享方面,项目发起人应注重项目文档的数量与质量,定期进行高质量的经验分享总结,推动提高项目内部的隐性知识与显性知识之间转换更新的频率。开源软件开发过程中的知识管理是一项复杂且富有意义的工作,高效的知识共享与清晰的知识流转过程对于保证项目的最终质量起着至关重要的作用。

本研究存在一些局限性,也是未来研究的方向。首先,开源软件开放是一个不断运动、发展和动态演化的系统,参与者角色可能随时发生转变,本研究未考虑后续参与者与发起者之间的互动如何影响开源项目的绩效,未来可借由纵向案例或者仿真方法来揭示开源创新中个体之间的社会化动态交互所产生的作用。此外,研究数据来源于GitHub 单一的开源社区平台,这种数据收集方式虽然有利于控制未被观测的、在开源社区层次的异质性,但是无法检验开源社区层次的公共治理要素可能对于项目绩效产生的影响,未来研究可以拓展和完善治理机制的权变效应。

猜你喜欢
开源影响力动机
Zimbabwean students chase their dreams by learning Chinese
二语动机自我系统对动机调控策略及动机行为的影响研究
动机比能力重要
五毛钱能买多少头牛
2019开源杰出贡献奖
天才影响力
黄艳:最深远的影响力
大家说:开源、人工智能及创新
开源中国开源世界高峰论坛圆桌会议纵论开源与互联网+创新2.0
动机不纯