MD&A语言特征与公司未来财务业绩

2019-09-10 07:22王泽霞潘梦雪郜鼎
财会月刊·下半月 2019年1期
关键词:文本挖掘语言特征

王泽霞 潘梦雪 郜鼎

【摘要】首先提出四项MD&A语言特征测度指标即专业性、真诚性、前瞻性深度以及情感性来衡量MD&A语言质量,然后选取2013~2015年我国169家创业板制造业上市公司MD&A数据为样本,实证检验四项指标与公司未来财务业绩的相关性。结果表明,MD&A专业性、真诚性、前瞻性深度与情感性均与公司未来财务业绩正相关。进一步构建MD&A语言质量综合指标z探究语言整体有效性在预测公司未来财务业绩方面的作用,结果表明管理层综合运用语言表述特征水平越高,预测公司未来业绩能力越强。这为投资者分析上市公司业绩质量、探索语言背后管理层微妙的心理提供了新视角和新工具。

【关键词】MD&A;语言特征;未来财务业绩;文本挖掘

【中图分类号】F270 【文献标识码】A 【文章编号】1004-0994(2019)02-0078-10

一、引言

“管理层讨论与分析”(Management’s Discus-sion&Analysis,MD&A)是上市公司财务报告“董事会报告”的重要组成部分,其蕴含着丰富的企业发展前景、核心竞争力、经营风险等非财务信息的表述,可以向市场和投资者传递企业未来发展状况的预判以及管理层不同的态度、情感和预期。近年来,上市公司对于扩展信息披露方式、丰富信息披露形式的要求越来越高,MD&A语言用词多样、表述方式丰富,逐渐成为上市公司与投资者之间有效沟通的桥梁,引起了各方的高度关注:2003年SEC出台MD&A信息披露规范;2005年IASB发布《管理层评论》征求意见稿;2005年ASB将披露“经营与财务评述”(Operating and Financial Review,OFR)的相关信息写入公司法;同年德国会计委员会发布第15号会计准则《管理层报告》,对年报中管理层应当发表的内容进行了规定;我国于2002年正式引入MD&A制度,并于2015年对其进行大幅度的修订,着重突出MD&A的“管理层视角”以及前瞻性信息的披露,并强调了MD&A语言特征。越来越多的学者也开始关注MD&A语言特征信息在预测公司未来财务业绩方面的作用。

本文以2013~2015年我国创业板制造业169家上市公司作为研究样本,使用Python语言编写代码自动抓取MD&A信息的专业性、真诚性、前瞻性深度和情感性四大语言特征,并选取样本公司未来财务业绩实证检验MD&A的上述语言特征相关性。结果发现,MD&A语言的专业性、真诚性、前瞻性深度与情感性均与公司T+1年的财务业绩显著正相关,这说明MD&A语言特征對公司未来发展情况具有很好的预测作用。

本文可能的研究贡献主要有以下几点:第一,进一步拓宽了MD&A语言特征的内涵,将研究领域从MD&A信息的充分性和有用性扩展到MD&A语言的专业性、真诚性、前瞻性深度和情感性;第二,将多种语言特征进行系统性综合以探究MD&A语言质量,一改以往国内学者单一性语言特征研究方法;第三,利用文本信息抽取技术自动识别MD&A语言特征,克服了传统的人工内容识别法所存在的各种缺陷。

二、文献综述

(一)MD&A语言特征研究文献综述

国内外有关MD&A语言特征的研究成果颇丰,大致可以概括为充分性、有用性、前瞻性、可读性和情感性五个方面。

1.MD&A语言的充分性。MD&A语言的充分性是语言特征的重要表现形式,关于它的研究起步较早。早在1993年,Hooks、Moon就基于MD&A中披露信息的数据数量构建了一个详细的信息披露体系;Clarkson、Kao和Richardson,Beattie、Mclnnes和Feamley均在MD&A语言充分性研究上有所建树。国内学者则对MD&A语言充分性进行了量化并对多个影响指标进行了探讨,如股利政策、高管薪酬、公司总资产、行业竞争、独立董事人数、是否海外上市等会提高MD&A语言质量,而股权集中度和上市年限会降低MD&A语言质量。韩金红、姜锡明验证了MD&A信息对公司盈利能力有预测作用。

2.MD&A语言的有用性。MD&A富含数据信息与语言信息,使得其能够提供大量增量信息帮助投资者进行决策,并且能够帮助未来公司扭亏为盈。实证研究结果表明,MD&A语言质量越高、信息越透明,公司股价越会在市场上做出相应反应,投资者越能有效利用MD&A所传递的信息。Behn、Kaplan和Krumwiede还发现MD&A中公司未来的融资计划、公司未来的资本运营支出计划、管理层对于提升公司核心竞争力做出的战略规划等非财务信息有助于审计师对公司的持续经营能力做出判断。

3.MD&A语言的前瞻性。MD&A前瞻性信息的重要性不言而喻,如战略关键信息是企业保持核心竞争力的关键一环。Cole、Jones研究发现MD&A语言的前瞻性具有增量信息,且其有用性超过历史信息,但是大部分公司在披露前瞻性信息时均存在选择性倾向,偏向“报喜不报忧”,这种信息的有意“编辑”给市场和投资者造成了一定的假象。而我国MD&A制度还相对不成熟,上市公司MD&A前瞻性信息披露不够充分、质量不高,公司进行自愿性披露的意愿较低。

4.MD&A语言的可读性。国外针对MD&A语言可读性的研究起步较早且经验相对丰富,前期衡量可读性的模型或方法大致可以分为以下几类:Flesch指数、Fox公式、衡量文本或是单词长度。其他学者诸如Xiao还从MD&A文本专业性、MD&A语言表达清晰程度等方面来衡量其可读性。国内研究主要是在国外研究经验的基础上对我国上市公司财报中的语言信息进行了验证,如阎达五和孙蔓莉、陈林俊利用Flesch模型验证了国内公司MD&A信息的可读性越来越差;李清以篇长、平均句长、会计术语密度为衡量指标,实证检验了MD&A信息的可读性与公司业绩、公司治理等基本面之间的关系。但是研究中文文本可读性时并不能一味借鉴国外的研究手段,而应该积极完善中文可读性指标的构建。

5.MD&A语言的情感性。MD&A语言表达丰富,能够传递情感和态度信息,针对情感性的研究是近年来国内外学者研究的重点。实证研究表明管理层披露情感词汇的数量、频率能够为投资者提供增量信息。国内学者谢德仁、林乐实证检验发现,管理层语言的情感性可以对公司的业绩进行预测,市场也会做出显著的反应;包燕娜Ds]研究发现,管理层会利用MD&A语言的情感性影响投资者对信息的解读;龙成研究发现,MD&A使用的消极情感越多,公司在未来发生财务困境的可能性就越大。

(二)MD&A语言特征识别方法文献综述

通过运用各种识别手段挖掘语言内在信息含量,进而对定性语言信息定量化是MD&A语言特征相关研究的一大关键。国际上对MD&A语言信息的挖掘从20世纪八九十年代迄今已经有近30年的历史,关于文本数据挖掘与文本语言分析的研究相对较为成熟。早期研究方法主要是人工内容识别法,随着大数据、神经网络等计算机技术的发展,利用字典法和机器学习对语言特征进行分析逐渐成为主流。Li基于字典法的原理,结合计算机语言创建了迷雾指数(Fog Index),用于评估公司年度报告语言信息的可读性;Loughran和Mcdonald通过编撰会计专业类字典来研究MD&A语言信息的专业性。Humpherys、Campbell等将无监督机器学习方法应用于衡量MD&A语言的晦涩程度,即运用句子长度、单词长度及对标点符号使用频率这三个指标来分析样本公司的MD&A信息。而国内研究将计算机技术应用于MD&A语言质量识别起步较晚,且大多数研究均以字典法为基础。

三、研究假设

(一)MD&A语言的专业性与公司未来财务业绩

MD&A中大量文本信息的存在使得其成为管理层向投资者传递信息时可利用的“调节器”。Rutherford认为企业管理层为了将业绩较好的信息传递给市场和投资者,从而降低信息不对称给投资者带来的疑惑,会尽可能使用专业词语对公司的财务业绩进行描述,以提高MD&A语言的专业性。这一做法带来两方面的好处:一是尽量避免使用模糊不清的词语而使得MD&A信息的可读性降低,由此改善MD&A信息的阅读难度;二是向市场和投资者传递管理层对于公司未来经营向好的自信心。据此本文提出以下假设:

H1:MD&A语言的专业性与公司未来财务业绩正相关。

(二)MD&A语言的真诚性与公司未来财务业绩

交往行为理论表明真诚性是语言有效的一个必备条件。王希杰提出的“潜显理论”认为,表达者为了提高语言的真诚性,往往会使用显语言来传递信息,从而留下“自我主张”的痕迹。管理层在表达自身为公司经营所做的贡献时,会同时使用显语言和潜语言,以避免信息不对称带来的信息失真。当管理层预计企业未来财务业绩向好时,会在MD&A语言中大量使用主张词语,由此来提高语言的真诚性,同时暗示了公司未来发展的稳定性以及管理层的自信度;当管理层预计未来财务业绩向差时,便没有信心向市场和投资者传递真诚稳定的信息,公司未来的发展也蕴含着大量的不确定性。据此本文提出以下假设:

H2:MD&A语言的真诚性与公司未来财务业绩正相关。

(三)MD&A语言的前瞻性深度与公司未来财务业绩

潜显理论表明,潜性语言的显性化是满足信息有效传递需求的必然产物,而语言内部的自我调节功能则是潜性语言显性化的重要途径。MD&A蕴含着公司未来展望、发展战略等大量前瞻性信息,专业性较强,故需要依据语言自身固有的规律进行潜性表达显性化、提高语言的前瞻性深度,从而提升投资者对管理层的认同感,增强信息传递的有效性。当预计企业未来财务业绩向好时,管理层在表述前瞻性信息时更倾向于潜性语言显性化;当预计企业未来财务业绩向差时,则相反。据此本文提出以下假设:

H3:MD&A语言的前瞻性深度与公司未来财务业绩正相关。

(四)MD&A语言的情感性与公司未来财务业绩

印象管理理论认为,如果财务报告能使利益相关者对公司产生积极良好的正面印象,那么这种正面印象将为公司带来直接的经济优势。信息传递的广泛性与影响度会使得企业印象管理效用最大化。MD&A信息披露作为管理层向市场和投资者传递公开信息的方式,是公司与各方利益相关者沟通的主要渠道。积极的MD&A语言情感会向社会公众传递企业良好的财务形象、信用形象与社会责任形象。因此,当预计企业未来财务业绩向好时,管理层会较多地赋予MD&A语言情感性,并且更多地使用积极情感进行印象管理,与利益相关者进行积极的信息沟通;当预计企业未来财务业绩向差时,消极情感则有所加重。据此本文提出以下假设:

H4:MD&A语言的情感性与公司未來财务业绩正相关。

H4a:MD&A语言的消极情感与公司未来财务业绩负相关。

H4b:MD&A语言的积极情感与公司未来财务业绩正相关。

四、研究设计

(一)样本选择与数据来源

本文选取2013~2015年创业板制造业上市公司的MD&A数据为研究样本,原因如下:①我国创业板上市公司大多成长性较好,并重视对公司经营情况、无形资产情况、未来发展战略以及可能面临的风险等因素的分析,因此创业板公司信息披露的特征与未来财务业绩之间的关系更加明显;②《公开发行证券的公司信息披露内容与格式准则第30号——创业板上市公司年度报告的内容与格式》(2012年修订)是目前证监会对于MD&A信息披露最为详尽的规定,并且主要针对创业板公司年度报告的信息披露,因此创业板对上市公司信息披露的要求较为严格和全面;③结合制造业企业经营情况的一贯性,排除行业的影响,选定创业板的制造业企业作为研究对象。本文研究的是MD&A语言特征与公司未来财务业绩的关系,在时间上自变量与因变量的取值之间应当间隔1(或2)个报告期,故选取样本公司2014~2016年年度报告的数据为因变量。

本文对样本公司进行了以下调整:①剔除ST公司;②剔除当年IPO的公司;③剔除数据存在缺失或异常的公司。最终得到507个样本观测值。本文使用的数据来源于国泰安CSMAR数据库及巨潮资讯网。为减弱异常值对研究结果的影响,所有连续变量做了1%上下的winsorize处理。

(二)变量选取与定义

1.被解释变量。借鉴以往的研究,本文同时选取ROE(净资产回报率)和ROA(总资产收益率)作为衡量公司财务业绩的指标,ROE体现了公司整体权益的盈利情况,ROA则体现了公司整体资产的盈利情况。

2.解释变量。

(1)专业性(X)。上市公司年报通过大量运用财务会计专业术语可以使MD&A信息更加准确和清晰,避免使用模糊不清的词语和修饰降低MD&A信息的可读性,由此提高信息传递的效率。因此本文选取上市公司年报MD&A中财务专业术语的出现频率来衡量其专业性程度。

(2)真诚性(X)。Urmson J.O.提出,显性表述是通过运用语言表达方式将自身的观点、信念和态度传达出来。在积极传递信息的过程中,言语者为了体现自身的真诚性和信息的真实性,会大量使用“自我主张”的词汇。因此本文选取MD&A信息中“自我主张”词汇的出现频率来衡量其真诚性。

(3)前瞻性深度(X)。前瞻性信息的深度可以衡量信息的披露质量,也可以反映信息披露的内涵。本文选取MD&A前瞻性信息中程度副词出现的频率来衡量其前瞻性深度。

(4)情感性(X)。参照谢德仁和林乐、Tet-lock、Li等的研究,选取MD&A中情感词汇的出现频率来衡量报表的情感性。

进一步分析,当管理层预计未来财务业绩向好时,会大量使用积极词汇来树立公司的正面形象;而当公司预计未来财务业绩向差时,消极词汇的使用则可能会有所增加。

3.控制变量。

本文借鉴蒋艳辉、冯楚建的研究,选取以下控制变量:速动比率(Quick);销售净利率(Ros);总资产周转率(Turn);总资产变化百分比(ΔAsset);净利润变化百分比(Alncome);公司规模(Size)。

详细变量名称、定义如表1所示。

(三)MD&A语言特征的识别方法

目前学者们对MD&A语言特征的识别主要采用以下方法:①字典法;②基于各种算法的机器学习方法。正如Li指出的,字典法是基于预设的字典和统计规则,将待分析文本中的词汇映射到各个文本集合当中,并经过统计特征词实现特征值量化。在目前针对语言特征的大量研究中,字典法属于文本挖掘中较为成熟的技术,可以克服人工内容识别法中的效率低下、主观性较强等缺陷。本文采用字典法,具体处理流程如下:

1.构建字典。针对本文研究的四项MD&A语言特征构建财务专业术语词典、“自我主张”词典、程度副词词典、情感性词典:①以我国2014年最新修订的企业会计准则为基础,人工构建财务专业术语词典;②“自我主张”词典、程度副词词典和情感性词典的构建均以大连理工大学信息检索研究室所“中文情感词汇本体库”为基础。

2.文本预处理。首先,将169家样本公司2013~2015年年度报告中的MD&A部分进行人工截取,并存为txt格式的文档。其次,将上文所构建的财务专业术语词典、“自我主张”词典、程度副词词典和情感性词典内置于Python代码包中,并使用Python开放源Jieba(“结巴”)中文分词器进行文本自动分词。在此过程中使用函数标识文本逗号和句号,实现对句子的划分。

3.特征值識别。本文采用字典法对文本信息进行抽取,识别出可能表达169家样本公司2013~2015年财务报告中MD&A信息的语言特征,并使用GBK对文本进行编码,然后进行词频自动统计,生成Excel文档。

(四)模型设计

本文借鉴李慧云和张林、蒋艳辉和冯楚建等的文献建立了以下研究模型:

五、实证检验与分析

(一)描述性统计

表2为主要变量的描述性统计结果。由表2可知,专业性(X)均值为5.92,最大值为6.8814,最小值为4.1109,说明样本公司MD&A信息披露的专业性普遍较高,但是各公司在财务会计专业词汇的使用程度方面存在较大差异。真诚性(X)均值为5.3459,最大值为6.2383,最小值为3.8918,说明研究期内样本公司在披露MD&A信息时较多地使用了“自我主张”的词汇,极力向市场塑造一个真诚、真挚的形象,以提高信息的可信度。前瞻性深度(X)均值为5.1676,最大值为5.9428,最小值为4.3944,与前两个指标相比,样本公司信息的显性化程度明显较低。情感性(X)均值为6.6239,最大值为7.2605,最小值为5.8142,其最大值和最小值较前三个变量来说均偏大,且两者之间的差距较小,说明研究期内样本公司在披露MD&A信息时均较多地使用了情感词汇,管理层在进行信息传递时包含了大量的情感色彩。其中:消极情感(X)的最大值和最小值在几个变量当中是最小的,这说明样本公司在披露MD&A信息时可能有意避免使用消极词汇,一定程度上为上市公司进行印象管理提供了证据;积极情感(X)最大值为7.2226,最小值为5.6454,均值为6.5495,说明样本公司大量地使用积极情绪传递MD&A信息,也从侧面印证了上市公司普遍积极树立良好形象,存在印象管理行为。语言质量综合指标(Z)最大值为2.638,最小值为-2.7659,说明各公司MD&A语言质量差异较大。

(三)进一步分析

前文是从MD&A语言的各个子特征出发,检验MD&A语言特征与公司未来财务业绩的关系。现实当中语言特征并不是孤立存在的,管理层往往综合运用各种语言特征并将其融合为一体来传达信息给使用者,因此需要深入研究MD&A语言整体质量与公司未来财务业绩的相关性。

1.主成分分析。本文抽取关键因子进行主成分分析,并进一步构建“MD&A语言质量综合指标Z”,衡量MD&A语言质量的高低。因子分析的优点是新建立的因子包含了原变量的大部分信息,同样可以参与原研究模型进行实证检验,并且变量数也可以大幅减少。现阶段主要的因子分析方法包括主成分分析、聚类分析、判别分析等,本文主要使用主成分分析法。

(1)KMO和Bartlett检验。为了检验原始变量是否适合进行因子分析,首先进行KMO和Bartlett检验。本文使用SPSS 22.0进行上述检验,检验结果见表5。

结果显示:①KMO检验值为0.522,介于0~1之间;②Bartlett检验值为P=0,当p<0.05 RP越小时越适合做主成分分析。因此上述指标适合做主成分分析。

(2)解释的总分方差。表6为主成分提取结果,本文选取第一个主成分因子,其对原始变量的方差贡献率为40.20%。

(3)成分得分矩阵。成分得分矩阵主要提供筛选出来的主成分因子与原始变量之间的关系,它列出了主成分与各个原始指标之间的系数关系。通过主成分分析处理,结合成分得分矩阵(见表7)得到新因子,记为F:

(4)MD&A语言质量综合指标。基于上文主成分分析的结果,本文构建了MD&A语言质量综合指标Z,以上文主成分因子的方差贡献率为权重,其计算公式为:Z=0.4020×F。并再次构建模型(2)来验证MD&A语言质量与公司未来财务业绩之间的关系。

表8列示了MD&A语言质量综合指标Z与公司未来财务业绩的回归结果。由表8可以看出,MD&A语言质量与公司未来财务业绩在1%的水平上显著正相关。上市公司管理层在利用MD&A进行信息传递时综合运用各种语言特征,将语言传递视为统一的整体,从而进一步展示公司的态度、价值和观点。管理层在MD&A信息中综合运用各种语言特征的水平越高,越能提升企业的信息披露质量,从而对财务报告做出有益的补充,为投资者决策提供更高质量的信息。

(四)稳健性检验

为了验证上文检验结果的稳健性,本文进行了以下稳健性检验:针对X~X,选取2013年和2014年样本公司的年度报告MD&A信息作为研究对象,即169×2共338个研究样本,并对被解释变量——未来财务业绩选择滞后两期进行回归检验,即利用样本公司2015年和2016年的财务业绩指标进行回归检验。稳健性检验模型如下:

检验结果表明,MD&A语言质量与公司未来财务业绩在1%的水平上显著正相关,与前述结论相比并无实质性变化。

六、研究结论与对策建议

(一)研究结论

本文以2013~2015年我国创业板制造业上市公司为研究样本,对MD&A语言特征与公司未来财务业绩之间的关系进行了考察,并得出如下结论:第一,当公司预期未来财务业绩向好时,管理层会倾向于提高信息披露的专业程度,在MD&A信息中运用更多的显性语言来向市场和投资者传递真诚性信号;第二,MD&A语言的前瞻性深度体现了管理层对于公司未来发展的预期,可以在一定程度上为投资者提供预测信息;第三,管理层在MD&A信息中融合了丰富的情感色彩,可以向市场和投资者有效传达管理层的态度、感情和观点;第四,相较于单一的MD&A语言特征,综合、系统的语言特征更能强化MD&A语言质量,从而提升语言信息传递的效果和效率,全面系统地向市场和投资者传递与公司未来发展状态相关的价值信息。

(二)对策建议

针对以上结论,本文的对策建议如下:

1.制定语言特征披露规则,健全上市公司信息披露制度。上市公司MD&A信息所拥有的语言特征直接关系到信息披露的效率、水平和质量。MD&A语言特征不仅体现着管理层对于公司未来发展情况的预期,也体现了管理层的心理动机。MD&A在为投资者决策提供增量信息的同时也蕴涵着丰富的价值内容。然而,当前我国上市公司信息披露大多“报喜不报忧”,存在强烈的印象管理行为,从而影响了信息传递效果,削减了语言的有用性。增加信息披露语言特征的相关规定,可以引导上市公司向市场和投资者提供更有价值的高质量信息,是健全信息披露制度的重要环节。

2.引入第三方监管机构,完善上市公司信息披露监管体系。会计师事务所、评级机构、媒体等外部监督机构对于强化上市公司信息披露质量起着举足轻重的作用。然而当前独立第三方机构对上市公司年度报告语言质量的分析少之又少,发表意见者寥寥无几。在大数据技术与文本挖掘技术迅猛发展的当下,包括会计师事务所以及评级机构在内的第三方机构,可以逐步将上市公司MD&A语言信息纳入其监督范畴,将计算机语言与审计、评级相结合,对上市公司信息披露质量进行分析、发表意见,同时设计相应的制度规范、鼓励跨学科融合,将文本挖掘等计算机技术应用于对上市公司信息披露水平的评估,促使上市公司不断提高信息披露水平。

3.综合运用语言表述特征,强化信息披露质量。MD&A作为上市公司信息披露的主要载体,具有丰富多样的表达方式和语言特征,向市场和投资者传达着管理层对于公司未来经营状况的预期、对未来风险的把握以及对未来发展战略的安排。因此,上市公司应当依据自身的发展状况,综合运用多种语言表述特征,提高信息传递效率、强化信息传递效果,从而使得MD&A信息披露真正服务于企业自身生产经营、服务于我国资本市场建设、服务于广大中小投资者。与此同时,还需要从制度上不断完善、从思想上不断强化、从奖惩机制上不断健全来增强公司股东、管理层的信息披露责任感,提高上市公司管理层MD&A信息的披露水平。

4.完善投资者教育机制,提高信息质量识别水平。投资者作为资本市场中的信息需求方,有效利用信息才能搭建信息供求双方的平衡木。然而现实中我国中小投资者对信息的识别与处理能力较差,难以捕获MD&A的增量信息。因此,投资者需要不断提升自身对于MD&A信息的阅读能力、质量分析能力和鉴别能力:一方面需要政府和媒体通过报纸、电视、微博、微信等各类信息传播途径,将分析语言质量的知识和方法进行广泛宣传,介绍语言所蕴含的深层次的价值;另一方面,投资者在关注企业的历史发展信息以及财务信息的同时,更应当重点关注企业对未来发展预判的语言信息,由此才能不斷提高自身的投资水平、切实维护自身的利益。

猜你喜欢
文本挖掘语言特征
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
《哈克贝利?芬历险记》中黑人英语的语言特征
物流英语的语言特征及翻译
茶艺英语的中国英语研究
文本数据挖掘在电子商务网站个性化推荐中的应用
从《远程教育》35年载文看远程教育研究趋势
解构口语化新闻的语言特征
慧眼识璞玉,妙手炼浑金
文本观点挖掘和情感分析的研究