方言边界、交流障碍与创新绩效

2021-06-29 09:45洪俊杰杨志浩
南开经济研究 2021年2期
关键词:专利申请边界普通话

洪俊杰 杨志浩

一、引 言

数千年的历史更迭形成中国“南腔北调”“十里不同音”的方言格局。复杂的方言格局在丰富文化多样性的同时,也带来语言交流不通畅的现实问题。为了降低交流壁垒,我国制定了《中华人民共和国国家通用语言文字法》(以下简称《国家通用语言文字法》),并于2001年1月开始施行。在此背景下,普通话在全国的普及率从2000年的约53%上升至2015年的73%左右①资料来源于中华人民共和国教育部官网(http://www.moe.gov.cn)。。然而,普通话的推广无法完全消除方言差异引致的交流障碍,原因正如中国俗语所言:“乡音难改”。心理学关于“词汇获得年龄效应”(Age of acquisition)的研究表明,早期习得的语言相较于晚期习得的语言在触发激活时具有绝对优势(Hernandez和Li,2007),年幼时习得的语言在成年后表现出的优先触发激活优势更为明显(Arnon等,2017)。根据《中国语言文字使用情况调查资料》(中国语言文字使用情况调查领导小组办公室,2006)统计,全国调查范围内“小时候最先会说汉语方言”的人口比例为84.23%,而“最先会说国家通用语言普通话”的人口比例仅为13.47%,学习并使用方言是绝大部分人群在幼年时期的首要选项。幼年时掌握的方言口音、词义及语法规范根植于个体的语言行为,在成年后的语言交流过程中会优先触发激活,创造出具备地方方言特征的“地方普通话”。“地方普通话”在语音、词义和语法等诸多方面偏离标准的普通话,有时会产生严重的交流障碍(陈亚川,1991)。

方言既是语言交流的载体,又是文化传承的表征。对此,大量经济领域的研究文献也基于方言的文化效应视角开展研究。例如,研究文化多样性对市场一体化、市场分割、区域间贸易以及民间金融等的影响(刘毓芸等,2017;丁从明等,2018;张博和范辰辰,2018;高超等,2019),考察方言的文化认同感如何影响公司代理成本和社会信任(戴亦一等,2016;黄玖立和刘畅,2017)等。其中,部分文献基于方言的交流功能开展研究。例如,考察方言流利性对买卖双方信任感的影响(Armstrong和Yee,2001),探索语言障碍如何通过影响团队成员认知和情绪反应,进而影响跨国团队内部信任的构建(Tenzer等,2014)。然而,现有文献鲜有关注方言差异引致的交流障碍如何影响创新绩效。本文基于专利申请主体的详细地址,利用高德地图API开放平台完成对中国全部申请专利所属县级行政单位的精准识别,并基于全国1∶100万基础地理数据库和县级行政单位的汉语方言数据,利用ArcGIS软件完成对汉语方言边界的识别。之后,以方言边界作为交流障碍的识别变量,静态分析交流障碍对创新绩效的影响。为了更好地完成进一步分析,本文采取如下两种方式动态地考察交流障碍对创新的影响:第一,借助创新主体与方言边界之间的地理距离差异,识别创新主体面临的交流障碍程度的变化,检验随着创新主体与方言边界之间地理距离的逐渐增加,方言边界的创新抑制效应是否逐渐减弱。第二,根据2001年我国颁布的《国家通用语言文字法》对民族自治地区和非民族自治地区的机关单位和学校等教育单位使用普通话的差异化规定构造准实验,采用双重差分法考察减少交流障碍是否有助于提高创新水平。

在现有关于方言与创新的相关研究中,徐现祥等(2015)和潘越等(2017)的研究与本研究存在一定的关联。徐现祥等开创性利用地级市内部的次方言数量和方言分化指数测度方言多样性。他们发现,方言多样性会降低城市技术创新,进而抑制经济增长。潘越等采用同样的方法测度方言多样性,并将方言多样性作为文化多样性的代理指标,指出地级市的文化多样性提高了辖区上市公司的专利申请水平。本研究是对前述研究的拓展和再检验。

第一,本研究是在前述研究基础上的进一步拓展。徐现祥等认为方言多样性通过抑制城市技术创新的方式阻碍经济增长,但该研究仅将技术创新作为中介因素简要分析,并未系统论证方言多样性如何抑制技术创新以及应当采取何种方式减小方言多样性对技术创新产生的负面影响。潘越等强调方言的文化效应能够影响创新,但忽视了方言的语言交流功能对创新的影响。本文关于交流障碍与创新绩效的研究有助于从语言环境视角为政府优化创新生态提供经济学支撑。不仅如此,本文还更为全面地考察了方言引致的交流障碍如何影响各类型创新主体的创新水平,以及如何影响经济整体的创新水平。

第二,本研究是对方言如何影响创新这一问题的再检验。如前所述,徐现祥等从地级市层面入手,认为方言多样性抑制了城市技术创新。潘越等从上市公司层面入手,认为方言多样性促进了上市公司的技术创新。基于不同的研究对象和数据样本考察方言对创新的影响时,徐现祥等和潘越等得出相反的研究结论。在此背景下,本文基于县级层面和企业层面的专利申请数据重新考察方言对创新的影响,有助于进一步揭开问题真相。

二、理论分析和研究假说

(一)交流障碍与创新绩效

语言交流是完成知识溢出的关键环节,当存在交流障碍时,知识溢出水平受损。首先,交流障碍削弱知识传播能力,阻碍知识溢出。知识根据是否适用于载体传播可以划分为显性知识和隐性知识。显性知识容易通过音频、视频及文本进行传播;隐性知识难以具体化,具有很强的默会性。对于显性知识而言,交流障碍直接影响显性知识传播的便利程度,进而影响知识溢出效率;对于隐性知识而言,交流障碍阻碍知识拥有者对知识接受者长期潜移默化的影响,不利于隐性知识的传播,降低知识溢出水平。其次,交流障碍影响信任感的构建,不利于知识溢出。交流障碍干扰认知和情绪反应,不利于创新主体之间信任感的构建(Tenzer等,2014)。协作创新活动高度依赖于参与主体的彼此信任程度,缺乏信任的协作关系难以维系,短暂的无信任协作不足以实现有效的信息沟通和知识传递。因此,交流障碍通过抑制信任感的构建,降低知识溢出水平。内生增长理论(Endogenous Growth Theory)构建起知识溢出影响创新绩效的理论背景。该理论强调知识溢出在经济发展中的引擎作用(Lucas,1988;Romer,1990),其内在逻辑为:作为部分个体研发投入的产物,知识在溢出过程中会产生正外部性,提升其他部分个体的创新水平,进而实现整体内生技术进步。在此背景下,大量研究从区域、产业以及企业等层面论证了知识溢出对创新绩效的影响,并且普遍认为知识溢出能够促进创新。知识溢出会发生在不同区域之间,邻近地区的创新活动对本地区的创新绩效存在显著的正向作用(Goncalves和Almeida,2009;Tseng,2009);同一区域的不同产业会在知识溢出作用下提升彼此的创新水平(Firestone,2010);知识溢出还存在于企业之间,成为提高企业技术水平的重要驱动力(Hoppmann,2018)。总而言之,交流障碍降低了知识溢出水平,因而对创新产生抑制作用。

交流障碍对创新的负面影响还体现在信息沟通成本方面,具体可以从财务成本和时间成本两大视角展开分析。其一,财务成本视角。从知识拥有者角度来看,交流障碍迫使其在对外完成有效知识溢出时支付更高的信息释疑成本;从知识接受者视角来看,陌生的外部语言环境提高其信息搜寻成本以及在获取信息后的转译学习成本(Kogut和Singh,1988)。交流障碍引致的信息沟通成本会加重创新主体的财务负担,缩减利润空间,削弱研发投入能力,最终影响创新产出。其二,时间成本视角。对于开展高端技术创新的发明家而言,信息释疑、搜寻和转译产生的时间成本可能比财务成本更为高昂。高端技术通常具有较高的学习壁垒,发明家难以通过委托编译的方式将高端技术交由时间成本相对低廉的科研辅助人员进行信息释疑、搜寻和转译。因此,在交流障碍存在时,开展高端技术创新的发明家通常需要付出相对高昂的时间成本来完成对其他语言的学习和掌握,以便使用其他语言完成对己方技术突破的释疑,或者根据己方研究中面临的瓶颈对外开展信息搜寻和转译。这种高昂时间成本的投入无疑会降低发明家的创新效率。

来自贸易领域的研究是语言交流影响创新的一个例证。在语言交流与国际贸易相关关系的研究中证实,共同语言的存在会降低贸易中的交易成本(Melitz,2008),共同母语会降低规避经济风险时的信息搜索成本(Egger和Lassmann,2015)。贸易成本的降低有助于推动双边企业的贸易活动,而出口学习效应(Learning by exporting)的相关文献进一步搭建起贸易与企业创新之间的桥梁。具备一定生产率优势的企业会选择出口(Melitz,2003),出口企业从海外市场可以获得母国市场所不具备的知识输入(Knowledge inputs),这会提升出口企业的产品创新水平和有利于其专利申请数量的增加(Salomon 和Shaver,2005)。进一步,企业的出口学习行为会对企业技术进口产生积极影响,出口学习和技术进口共同促进企业创新(Wang和Tao,2019)。由此可见,语言交流通过影响企业的国际化行为而影响企业从外部市场获得知识和技术,最终影响企业创新。

(二)方言边界与创新绩效

在识别方言边界之前,本文首先需要完成对汉语方言矢量地图的构建。方言可划分为方言区、方言片和方言小片(徐现祥等,2015),本文使用相对精细的方言小片作为方言边界的识别基础。中国的每个县级行政单位均从属于某一种方言小片,使用ArcGIS软件把县级行政单位所属方言小片的数据与全国1∶100万基础地理数据库中的县级行政区划矢量地图做图层关联,便可得到含有地理坐标信息的汉语方言矢量地图。

图1是方言边界示意图,阴影部分区域D1和空白部分区域D2分别属于两种不同的方言小片,两个区域之间的虚线C即方言边界。A点和B点代表创新主体①本文中的创新主体主要包括县级行政单位和工业企业。,其所属方言小片为D2。创新主体在开展创新活动过程中,会受到其他创新主体知识溢出的正外部性影响。知识溢出由于存在地理局限,会随着地理距离的增加逐渐衰减(Jaffe等,1993;Audretsch和Feldman,1996;Maurseth和Verspagen,2002;Rho和Moon,2014),故本文假设A点和B点能够获得的有效知识溢出区域分别为圆F和圆E。假设圆F和圆E面积相等,对于邻近方言边界的A点而言,其能够获得的有效知识溢出区域(圆F)部分位于与己方使用不同方言的D1中。在跨方言交流存在障碍的基础上,A点将会损失位于D1中的有效知识溢出区域,或者为获得来自D1中的有效知识溢出而付出信息沟通成本。相反,对于远离方言边界的B点而言,其全部有效知识溢出区域(圆E)均位于与己方使用相同方言的D2中,不存在因交流障碍而引致的有效知识溢出损失和信息沟通成本。因此,与远离方言边界的B点相比,邻近方言边界的A点在获得知识溢出效益过程中受到方言边界引致的交流障碍的负面影响,知识溢出水平较低。如前所述,知识溢出与创新之间存在正相关关系(Goncalves和Almeida,2009;Tseng,2009;Hoppmann,2018),信息沟通成本的增加恶化了创新环境、降低了研发投入效率。因此,交流障碍引致的知识溢出损失和信息沟通成本负担加重会降低创新绩效。

图1 方言边界示意图

基于上述分析,本文提出研究假说1。

假说1:方言引致的交流障碍会抑制创新绩效的提高。

如图1所示,若要缓解或者消除方言边界对创新的抑制效应,可以采取两种方式:其一,推动A点向D2方言小片方向移动,增加A点与方言边界C之间的最短垂直距离。随着A点与方言边界C之间最短垂直距离的增加,A点位于D1中的有效知识溢出区域持续缩减,有效知识溢出的损失程度逐渐降低。当A点能够获得的有效知识溢出区域(圆F)完全位于D2时,方言引致的交流障碍不再对A点的创新绩效产生负面影响。其二,通过推行通用语言,消除语言交流过程中对方言的依赖。当方言边界C完全消除时,D1和D2整合为统一的语言市场,交流障碍的创新抑制效应不复存在。基于上述分析,本文提出如下研究假说。

假说2:通过控制创新主体与方言边界的地理距离,能够减少甚至消除交流障碍的创新抑制效应。

假说3:通过推行通用语言和整合语言市场的方式减少交流障碍,有助于提高创新绩效。

三、数据说明与实证策略

(一)数据说明

本文主要使用2010年县级行政单位数据和工业企业数据来研究方言边界引致的交流障碍对创新绩效的影响,使用1995年至2012年的县级行政单位数据考察在普通话立法背景下减少交流障碍对创新绩效的影响。汉语方言数据来自中山大学岭南学院徐现祥团队根据《汉语方言大词典》(许宝华和宫田一郎,1999)和《中国语言地图集》(中国社会科学院和澳大利亚人文科学院,1987)整理得到的基于1986年中国行政区划代码标准下的2615个县级行政单位的汉语方言数据。中国行政区划曾经历过复杂沿革,部分县级行政单位在历史演变中发生过拆分、合并、新设、被取缔等情况。本文根据民政部和中国行政区划网公布的历年行政区划代码表和行政区划沿革公告,将1986年县级行政区划代码与2010年县级行政区划代码匹配。然后,结合汉语方言数据得到基于2010年行政区划代码标准下的2632个①2632个拥有方言小片数据的县级行政单位,约占2010年全国县级行政单位总数的92.15%。其中,位于方言边界的县级行政单位占比为70.25%。剩余7.85%的无法获得方言小片数据的县级行政单位主要来自西藏自治区、内蒙古自治区和海南省,本文在研究中将这部分县级行政单位剔除。含有汉语方言小片信息的县级行政单位数据。县级行政单位的专利申请数据是根据国家知识产权局发布的《中国专利数据库文摘》(以下简称“专利数据库”)整理而来。专利数据库记录了1995年至2012年全国所有科研单位、机关团体、大专院校、工矿企业、个人及其他六类专利申请主体的全部国内专利申请数据,包括专利申请类型、专利申请时间以及专利申请主体的详细地址等关键信息。本文基于专利申请主体的详细地址,利用高德地图API开放平台完成对每一条专利所属县级行政单位的精准识别,分年份在县级层面进行加总,最终得到各年份各县级行政单位专利申请数据。佛教寺庙数据来自哈佛大学地理分析中心(Center for Geographic Analysis)开发的全球地理信息数据库②全球地理信息数据库网址为http://worldmap.harvard.edu。。该数据库收录有中国古代遗址遗迹、自然灾害、社会人口、能源环境以及民族语言等数据,其中包括本文研究所使用的1820年中国佛教寺庙分布矢量图。工业企业数据来自国家统计局发布的中国工业企业数据库,包含规模以上企业详细的财务信息。本文依据企业名称和地址将工业企业数据库与专利数据库合并,得到包含专利申请信息的工业企业数据。各县级行政单位夜间灯光数据取自美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration)发布的全球夜间灯光栅格数据,PM2.5数据来自美国国家航空航天局(National Aeronautics and Space Administration)和哥伦比亚大学联合发布的全球PM2.5栅格数据。县级行政单位的区域面积、河流长度、铁路长度等数据取自中华人民共和国自然资源部提供的全国1∶100万基础地理数据库。人口总数和教育从业人员数量等数据来自2010年第六次全国人口普查分县数据库。“省直管县”数据来自各省份颁布的关于“省直管县”财政管理体制改革的相关文件①例如,2007年甘肃省颁布的《甘肃省实行省直管县财政管理体制改革试点方案》中明确规定,甘肃省榆中县等16个县市自2007年开始实行“省直管”。。

(二)实证策略

本文采用如下基准回归模型考察方言边界对创新绩效的影响:

lnpatenti代表各县级行政单位的创新水平,用各县级行政单位专利申请数量的对数测度。d iaboundaryi是本文的核心解释变量“方言边界”,识别各县级行政单位是否毗邻方言边界。若是则该值取1,否则取0。Xi为县级层面的控制变量,主要包括省界效应、夜间灯光亮度、人口数量、“省直管县”、民族自治县、河流密度、铁路密度、区域面积、省份层面固定效应以及方言区固定效应。省份边界通常是各省政府治理的“盲区”。在分权体制下,地方政府策略性减少省份边界地区的交通基础设施投资(唐为,2019),可能对创新产生抑制效应。因此,本文引入“省界效应”变量,如果某县级行政单位位于省份边界,则该变量取值为1,否则为0。夜间灯光亮度用以控制各县级行政单位经济发展水平,已有研究证实夜间灯光数据是区域经济活动的良好替代指标(Henderson等,2012)。由于人员数量较多的地区更易迸发新思想,因而本文控制了各县的人口数量。各省份实行的“省直管县”改革策略赋予了部分县级行政单位特殊的行政地位,受“省直管”的县级行政单位在财政审批、行政审批等方面绕过地级政府,直接受省级政府管辖。对此,本文在回归模型中引入“省直管县”虚拟变量,如果截至2010年某县级行政单位受到“省直管”,则该变量取值为1,否则为0。考虑到中国长期推行的民族区域自治政策赋予少数民族集聚地区更高的自治权以及少数民族地区使用的语言通常为民族语,少数民族地区可能在对外连通和信息传递方面存在更高障碍,因而本文在回归模型中引入“民族自治县”虚拟变量,如果某县级行政单位属于民族自治县,则该变量取值为1,否则为0。各县级行政单位河流和铁路状况影响其内部的连通和整合程度,进而影响内部创新交流,所以本文控制了河流密度和铁路密度,其中河流密度使用河流长度与县级行政区域面积的比值测度,铁路密度使用铁路长度与县级行政区域面积的比值测度。最后本文在回归中引入了各县级行政单位区域面积,以控制各县级行政单位在地理面积上的差异。εi为随机误差项。

值得注意的是,本文研究的出发点在于毗邻方言边界的地区比远离方言边界的地区存在更高的交流障碍,进而导致创新水平存在差异。例如,对于一个临近方言边界的县级行政单位而言,其一部分邻县与其自身处于不同的方言小片,因而知识溢出会受到方言壁垒阻隔;而对于一个远离方言边界的县级行政单位而言,其邻县皆与其自身处于相同的方言小片,知识溢出相对通畅。应当指出的是,尽管知识溢出具备地理局限性,邻县在知识溢出的过程中非常重要,但并不意味着相距较远的个体之间不会开展创新交流。属于同一方言区或者同一省级行政区的创新主体因语言障碍或者行政制度差异而受到的交流障碍通常较弱,因而创新交流也可能更为频繁。换句话说,如果某县级行政单位所在方言区或者省级行政区规模较大,其通常可能有更多的创新交流对象,也就更具创新优势。对此,本文在回归中控制省份固定效应φp和方言区固定效应θq。本文的主要变量描述性统计如表1所示。

表1 主要变量描述性统计

四、方言边界的创新抑制效应

(一)基准回归结论

本文基准回归结果见表2。

表2 方言边界的创新抑制效应

表2回归结果表明,在不引入控制变量时方言边界变量的系数显著为负,即相较于远离方言边界的县级行政单位,毗邻方言边界的县级行政单位的创新绩效受到抑制。引入控制变量缓解遗漏变量引致的内生性问题后,方言边界变量的系数值有所下降,但依然在1%水平上显著。由此可见,方言边界对创新确实存在抑制效应,本研究假说1成立。在控制变量方面,省界效应(proboundary)、是否属于省直管县(promanage)、河流密度(river)、是否属于民族自治县(minority)以及区域面积对数(lnspace)等变量与创新绩效水平负相关;以夜间灯光亮度对数测度的经济发展水平(lnlight)、人口数量对数(lnpopulation)以及铁路密度(rail)等变量与创新绩效正相关。

(二)稳健性检验

1. 排除偶然性因素干扰

本文使用2010年的县级行政单位截面数据完成基准回归,但各县级行政单位单一年份的专利申请可能受到创新环境变化的影响,导致本文的研究结论受单一年份偶然性因素干扰。因此,本文分别采用2009年至2011年县级行政单位专利申请总量的三年均值和2008年至2012年县级行政单位专利申请总量的五年均值,来替代2010年县级行政单位专利申请总量,重新进行回归,结果见表3第(1)列和第(2)列。

表3 稳健性检验

2. 替换被解释变量测度指标

前文中主要使用各类专利的总量测度创新水平,为了进一步验证本文的研究结论不受创新测度指标差异的干扰,本部分分别选取人均专利申请数量、是否为“全国县市科技进步考核先进县”(是则取值为1,否则为0)、是否为“国家级高新技术开发区坐落地”(是则取值为1,否则为0)重新测度各县创新水平。人均专利申请数量能够有效反映县级行政单位的平均创新水平,全国县市科技进步考核是中华人民共和国科技部针对全国县级行政单位开展的创新进步水平综合检测,国家级高新技术开发区的科技创新代表着高水平的区域科技创新。因此,选取这三大指标作为被解释变量的测度指标具有一定的合理性,回归结果见表3第(3)列至第(5)列。

3. 替换核心解释变量测度指标

本文采用如下方式替换核心解释变量的测度指标。首先,前文研究中利用县级行政单位是否位于方言边界识别交流障碍区,换句话说,利用县级行政单位是否存在与己方使用不同方言小片的邻县作为交流障碍的测度指标。然而,对于不同的县级行政单位而言,其邻县中与己方使用不同方言小片的邻县数量占比不尽相同。例如,安徽省祁门县的五个邻县(休宁县、黟县、东至县、石台县和浮梁县)均与祁门县使用不同的方言小片,所以祁门县的邻县中与己方使用不同方言小片的邻县比例为100%。山西省保德县的四个邻县中,仅有兴县与之使用不同的方言小片,所以保德县的邻县中与己方使用不同方言小片的邻县比例为25%。本部分利用“邻县中与己方使用不同方言小片的邻县数量占比”(div1)替代“方言边界”变量,重新考察方言差异引致的交流障碍对创新绩效的影响,结果见表3第(6)列。其次,考虑到属于同一方言片的不同方言小片之间通常交流难度较低,而属于不同方言片的不同方言小片之间交流难度较高,所以本文利用“邻县中与己方使用不同方言片的邻县数量比例”(div2)作为核心解释变量,再度检验本文研究结论,结果见表3第(7)列。最后,考虑到地级市层面的方言多样性同样能够表征方言差异引致的交流障碍,本文参考徐现祥等和潘越等使用“地级市内部的次方言数量”(div3)和方言分化指数(div4)构造方言多样性指标,并以此替换核心解释变量,再次考察交流障碍对创新绩效的影响,结果见表3第(8)列和第(9)列。

在上述稳健性检验基础上,本文的核心研究结论始终成立,方言引致的交流障碍对创新存在显著抑制效应。

(三)内生性探讨

历史语言学家认为,语言每千年的核心词保有率大概为85%(苏三,2010),即语言的蜕变、分离和异化需要相当长的时间积淀。基于历史语言学家的这一观点,历史上成形的方言边界应当在相当长的时间里保持稳定,本文的研究存在反向因果的可能性不大。考虑到本文使用截面数据开展回归分析,所以遗漏变量偏误导致的内生性问题是本文研究结论面临的主要威胁。对此,本文通过引入其他控制变量和采用工具变量估计两种方式,缓解遗漏变量可能导致的内生性问题。

第一,引入其他控制变量。其一,历史文化水平(culture)。为了充分控制可能的历史文化因素的干扰,本文参考唐为(2019)使用各县级行政单位的全国重点文物保护单位数量来控制历史文化水平,回归结果见表4第(1)列。其二,空气污染状况(PM2.5)。空气污染影响个体健康与情绪状况,显著降低个体的创新活力程度;发明人更倾向于向环境质量优良的城市流动,远离环境污染严重的城市(罗勇根等,2019)。所以,本文使用美国国家航空航天局与哥伦比亚大学联合发布的全球PM2.5分布栅格数据,结合ArcGIS软件获得2010年中国各县级行政单位PM2.5数据,来测度各县级行政单位的空气污染状况,回归结果见表4第(2)列。其三,教育发展水平(edu)。教育发展水平影响地区创新能力,所以本文使用各县级行政单位的教育从业人员数量和人口总量的比值作为各地教育发展水平的代理变量,来控制教育发展水平对本文研究结论的干扰,回归结果见表4第(3)列。其四,是否位于地级市边界(cityboundary)。本文在基准回归中已经控制省份边界效应,减少了行政区划边界对本文研究的干扰。为了进一步控制行政区划边界的影响,本文引入“是否位于地级市边界”虚拟变量。如果县级行政单位位于地级市边界,则该变量取值为1,否则为0,回归结果见表4第(4)列。其五,创新水平的空间相关性。本文使用空间自回归模型考察创新水平的空间相关性影响①空间加权矩阵根据各县是否在地理上接壤来构建,如果两县相邻,空间加权矩阵中对应元素赋值为1,否则赋值为0;空间自回归模型的估计方法采用极大似然估计。,控制变量包括本文基准回归中使用的所有控制变量,以及进一步引入的历史文化水平、空气污染状况、教育发展水平、是否位于地级市边界等变量,回归结果见表4的第(5)列。在控制以上干扰因素后,方言边界依然显著抑制创新绩效。

表4 内生性讨论:增加其他控制变量

第二,采用工具变量估计。尽管前文已经从政治、经济、人文、交通、地理、环境以及教育等诸多方面对影响创新的其他因素进行控制,但仍然难以穷尽所有的遗漏变量,因而本文采用1820年中国各县佛教寺庙的数量(temple)作为“方言边界”变量的工具变量对本文核心结论做进一步检验。如此选择工具变量的原因在于:第一,历史上,佛教传教活动在中国开展的时间早且影响大。佛教传教高度依赖于人员流动和语音互译,因而佛教传教活动越活跃的地区,其形成共同语言的可能性越大。具体而言:早在西汉哀帝元年(公元前2年),佛经《浮屠经》便开始在中国宫廷供奉。西晋时期(公元265年至316年),中国境内的佛寺已经达到约180所,3700余名僧尼从事佛教传播活动(林宝卿,2000),僧尼人口约占西晋时期总人口的万分之二点五。长期以来,佛教传教使用的梵语对汉语音韵和词汇的构建产生深远影响(林宝卿,2000),佛教僧尼在不同地区的传教活动搭建起不同地区之间语音互通的桥梁。此外,佛教的传播高度依赖于“梵汉对音”,即梵语与汉语的口音、口语互译。这其中便出现大量梵语与汉语方言的对音,比如,佛典在汉语方言“吴音区”便结合“吴音”特点进行对音与释义(储泰松,2014)。梵语与各种方言之间的对音推动佛教传教地区语音语义趋同。由此可见,历史上长期存在的佛教传教活动对方言区的形成存在不容忽视的影响。考虑到佛教寺庙是佛家僧尼传教的集中地,因此各县佛教寺庙数量工具变量与方言边界内生解释变量存在相关关系,工具变量相关性(Instrumental relevance)条件得到满足。第二,时间正序发展且不可逆的自然规律决定了现如今的经济活动不会影响历史事件。因此,1820年佛教寺庙的建设并不受本文研究时点2010年的各项因素干扰,工具变量外生性(Instrumental exogeneity)条件得到满足。工具变量估计结果见表5的第(1)列和第(2)列。其中,第(2)列的两阶段最小二乘估计第一阶段回归结果表明,历史上的佛教传教活动显著弱化了方言的边界效应,即历史上传教越活跃的地区,使用同一方言的可能性越大;第(1)列的两阶段最小二乘估计第二阶段回归结果显示,“方言边界”变量估计系数符号及显著性与基准回归一致,系数绝对值略有上升,即方言边界确实降低了毗邻县的创新绩效。同时,工具变量“佛教寺庙”的F统计量为14.823,高于弱工具变量检验的临界值10(Staiger和Stock,1997),因此不存在弱工具变量问题。

表5 工具变量估计

(四)异质性分析

1. 专利申请主体异质性

专利申请主体包含科研单位、机关团体、大专院校、工矿企业、个人及其他六类。《国家通用语言文字法》对六类创新主体使用普通话的要求程度存在差异:要求机关团体及学校等教育科研单位以普通话为日常用语用字,要求企业在名称设置时必须采用国家通用语言文字,而对于公民个体则仅仅强调其具有学习和使用国家通用语言的权利,且具有使用和发展本民族语言文字的自由。法律对不同创新主体使用国家通用语言文字的差异化要求,导致普通话在不同创新群体中推广和使用程度存在差异,进而导致不同群体开展创新交流时受到方言引致的交流障碍的影响程度不同。本文将科研单位、机关团体及大专院校定义为“院校机关”,将工矿企业单独列示,将个人和其他统一归入“个人主体”,进而以之考察方言的创新抑制效应对不同的创新主体是否存在差异化影响,回归结果见表6的第(1)列至第(3)列。该回归结果表明,院校机关的创新绩效受到方言边界的抑制作用最小,工矿企业次之,而个人和其他主体受其影响最大。因此,普通话普及程度越高的创新群体,受到方言边界的创新抑制效应越小。

2. 专利申请类型异质性

专利类型包括发明专利、实用新型专利和外观设计专利。相较于外观设计专利而言,发明专利和实用新型专利的研发门槛更高,研发周期更长,因而对语言的使用和依赖程度也更高。这可能会导致方言边界对不同类型的专利申请产生差异化的影响。对此,本文分别考察了方言边界对县级行政单位的发明专利、实用新型专利和外观设计专利申请状况的影响,回归结果见表6的第(4)列至第(6)列。其回归结果表明,方言边界对发明专利和实用新型专利申请的抑制效应相对较大,对外观设计专利的抑制效应较小。因此,对语言的使用和依赖程度越大的创新活动,受到方言边界的创新抑制效应越大。

表6 异质性分析

五、交流障碍影响创新的动态分析

如前所述,方言引致的交流障碍会降低创新绩效。按此逻辑,减少或者消除交流障碍有助于提升创新绩效。然而,方言作为历史长期演化的产物不会在短期内发生较大程度的变动(苏三,2010),因而难以考察方言边界的变动对创新绩效的影响。幸运的是,尽管方言边界难以变动,但可以借助创新主体与方言边界之间地理距离的差异识别创新主体受到交流障碍抑制的程度,以此检验减少交流障碍能否提升创新绩效。不仅如此,推行国家通用语言是破除交流障碍的有效手段。2001年颁布的《国家通用语言文字法》确立了普通话作为“国家通用语言”的法律地位,要求机关单位和学校等教育单位使用普通话作为基本用语(全国人民代表大会,2000)。同时,该法规定少数民族自治地区的机关单位和学校等教育单位在运行过程中有权使用民族语言代替普通话。法律对普通话使用和推广的差异化规定,使得民族自治地区的机关单位和学校等教育单位受到的普通话立法冲击明显弱于非民族自治地区,因而为本文借助双重差分法考察减少交流障碍如何影响创新绩效提供了一个准实验。

(一)地理距离与创新绩效

本文使用规模以上工业企业微观数据考察地理距离变化对创新绩效的影响。考虑到2010年工业企业数据库存在大量的企业关键财务信息缺失,本文使用国家统计局发布的2009年中国工业企业数据与专利数据库匹配后得到新的数据集,以之检验方言边界抑制创新的作用距离。其具体操作如下:首先,根据工业企业数据库中的企业详细地址,利用高德地图API开放平台识别各个企业的经纬度坐标。其次,利用ArcGIS软件和汉语方言矢量地图识别方言边界某一最短垂直距离范围内的企业。本文以10公里为级数,分别识别企业至方言边界的最短垂直距离为0公里~10公里、10公里~20公里、20公里~30公里、30公里~40公里、40公里~50公里以及50公里以外的企业。最后,在控制企业层面因素和企业所在地区层面因素前提下,检验增加与方言边界之间的地理距离以减少企业面临的交流障碍之后企业创新绩效的变化情况。企业层面的控制变量包括企业规模、资产负债率、是否出口、增值税利润比以及企业所在行业,县层面的控制变量与前文回归一致。

表7回归结果表明,方言边界显著抑制企业创新,且随着企业与方言边界之间距离增加,方言边界变量系数绝对值递减,即方言边界对企业的创新抑制效应递减,本文的研究假说2成立。以最能代表企业创新水平的发明专利为例,当距离方言边界超过20公里之后,方言边界对企业创新的抑制效应消失;当距离方言边界超过40公里之后,方言边界对企业创新绩效的抑制效应不再显著。

表7 边界效应抑制创新的作用距离

(二)普通话立法与创新绩效

如前所述,《国家通用语言文字法》要求机关单位和学校等教育单位以普通话作为工作语言,也规定民族自治地区的机关单位和学校等教育单位有权使用民族语言代替普通话①《国家通用语言文字法》第一章第八条规定:“少数民族语言文字的使用依据宪法、民族区域自治法及其他法律的有关规定”。同时《民族区域自治法》第三章第二十一条规定:“民族自治地方的自治机关在执行职务的时候,依照本民族自治地方自治条例的规定,使用当地通用的一种或者几种语言文字;同时使用几种通用的语言文字执行职务的,可以以实行区域自治的民族的语言文字为主”,其第三十七条规定:“招收少数民族学生为主的学校(班级)和其他教育机构,有条件的应当采用少数民族文字的课本,并用少数民族语言讲课”。《教育法》第一章第十二条规定:“民族自治地方以少数民族学生为主的学校及其他教育机构,从实际出发,使用国家通用语言文字和本民族或者当地民族通用的语言文字实施双语教育”。。普通话立法可以视作对语言交流环境的外生冲击,受到立法冲击强度较大的非民族自治地区的机关单位和学校等教育单位被强制要求使用普通话作为工作语言,而受到立法冲击强度较小的民族自治地区的机关单位和学校等教育单位有权使用民族语言而非普通话作为工作语言。本文以民族自治县为对照组,以与对照组样本接壤的非民族自治县为实验组,使用1995年至2012年各县的机关单位和学校等教育单位的专利申请数据,考察减少交流障碍如何影响创新绩效①选择1995年至2012年数据时段开展研究的原因在于,国家知识产权局发布的《中国专利数据库文摘》数据截止年份为2012年,所以选择2012年作为研究的截止年份。考虑到开展双重差分法的平行趋势检验必须保证事件冲击之前留有足够的年份考察实验组和对照组在创新方面的发展趋势,本文的事件冲击年份为2001年,故选择该年份之前6年的1995年作为研究的初始年份,便于完成相关检验。最终,本文得到120个实验组样本和383个对照组样本连续18年的数据,构成平衡面板数据开展分析。各县的机关单位和学校等教育单位的专利申请数据来自国家知识产权局发布的《中国专利数据库文摘》,本文将《中国专利数据库文摘》中的机关团体、科研单位和大专院校等专利申请主体定义为机关单位和学校等教育单位。。这种实验组和对照组的选择方式有如下优势:第一,《国家通用语言文字法》颁布年份为2001年,同年中国加入世界贸易组织。加入世界贸易组织主要对中国企业(尤其是外贸企业)造成冲击。因此,选择各县的机关单位和学校等教育单位的专利申请数据测度创新水平可以规避“入世冲击”对本文研究结论的干扰。第二,知识溢出具有地理局限性,地理上邻近的创新主体之间的有效创新交流相对更高,因而地理上接壤的县级行政单位的创新水平在普通话立法前更可能保持相同的发展趋势,双重差分法需要满足的平行趋势假定更容易满足。第三,地理邻近的县级行政单位在政治、经济、文化等方面的特征更为接近,影响创新的其他因素在一定程度上得以控制。

本文的双重差分模型构建如下:

lnpatentit代表各县的机关单位和学校等教育单位的专利申请数量的对数。Treati用以识别各县是否受到普通话立法冲击,如果是则取值为1,否则为0;P ostt用以识别普通话立法冲击年份,2001年之前取值为1,2001年及之后取值为0。Xit为控制变量,主要控制县级行政单位的经济状况和环境状况。经济状况用夜间灯光亮度测度,环境状况用PM2.5排放量测度。υi和ηt分别为县固定效应和年份固定效应,用以控制不随时间变动的县级行政单位特征和时间趋势。εit为随机扰动项。其回归结果见表8。表8第(1)列回归结果表明,普通话立法显著提高创新绩效,本文的研究假说3成立。表8第(2)列至第(4)列的回归结果表明,分别使用发明专利申请量(对数)、实用新型专利申请量(对数)和外观设计专利申请量(对数)替代专利申请总量(对数),前述结论仍然成立。

表8 普通话立法与创新绩效

图2展示了普通话立法促进创新的动态效果。其动态效果表明,在2001年《国家通用语言文字法》生效之前,系数值ωk的数值大小基本保持稳定;置信区间全部穿越零点,系数值ωk趋近于零且不显著。这表明实验组与对照组的创新水平在2001年之前并无显著差异,双重差分模型必须满足的平行趋势假定成立。2001年《国家通用语言文字法》生效之后,直至2004年实验组和对照组之间依然没有表现出显著差异,政策的时滞效应明显。2005年起,普通话立法政策效应开始显现,实验组的创新水平相较于对照组显著提高。特别需要注意的是,2005年至2009年期间实验组和对照组的创新水平差异呈现扩大趋势。这表明,普通话立法对创新的促进效应具有多期性。从2010年开始,实验组和对照组之间创新水平差异的扩大趋势有所收敛。这表明,普通话立法对创新的促进效应强度随着时间推移逐渐衰弱。

图2 普通话立法促进创新的长期动态效果

六、结论与启示

本文通过静态分析和动态分析两种方法系统考察了交流障碍对创新绩效的影响。静态分析方面,利用2010年县级层面的专利申请数据,使用方言边界识别交流障碍,探讨了交流障碍的创新抑制效应。动态分析方面,利用2010年企业层面的专利申请数据以及1995年至2012年县级层面的专利申请数据,使用创新主体和方言边界之间地理距离的差异以及普通话立法冲击识别交流障碍的动态变化,分析了减少交流障碍如何影响创新绩效。本文的研究可以得出如下结论,方言引致的交流障碍显著抑制了创新。在排除偶然性因素干扰以及替换核心解释变量和被解释变量测度指标的情况下,这一结论仍然成立。为了消除内生性问题,本文引入大量的控制变量,从政治、经济、人文、交通、地理、环境以及教育等诸多方面对影响创新的其他因素进行控制。不仅如此,采用工具变量估计再次检验本文的核心研究结论,结论保持稳健。本文的异质性分析表明,普通话普及程度越高的创新群体,受到方言边界的创新抑制效应越小;对语言交流依赖越大的创新活动,受到方言边界的创新抑制效应越大。本文的动态分析表明,随着创新主体与方言边界地理距离的增大,方言引致的交流障碍对创新的抑制效应递减;通过推广普通话减少了交流障碍,能够显著提升创新绩效。

本文的研究结论具有如下启示。随着中国经济步入新常态,加快发展方式转型和实现创新驱动发展迫在眉睫。在此背景下,我们应将优化创新生态、培育创新动能列为工作的重中之重。本文认为,在现阶段的中国,方言引致的语言交流障碍依然普遍存在,并对创新产生明显抑制作用。因此,政府在优化创新生态过程中应当关注国内的语言交流环境,加大语言交流障碍的破除力度。大力推广和普及国家通用语言普通话,着力解决普通话普及过程中涌现的“地方普通话”问题,推动国内语言统一。企业是推动创新发展的排头兵,作为微观主体的企业在“选址”和“迁址”的过程中应充分考虑外部语言交流环境对自身创新的影响,合理控制企业地址与方言边界之间的地理距离,最大程度降低语言交流障碍对自身创新发展的阻碍程度。

猜你喜欢
专利申请边界普通话
从一件无效宣告请求案谈专利申请过程中的几点启示和建议
守住你的边界
有边界和无边界
OF MALLS AND MUSEUMS
我是中国娃爱讲普通话
2018年河南省各省辖市及直管县(市)专利申请量统计表(1月)
2017年河南省各省辖市及直管县(市)专利申请量统计表(12月)
韩国AI内容专利申请数5年激增10倍
人蚁边界防护网
17