2023年2月1日,注册制改革正式扩展至主板,至此中国资本市场进入了全面注册制时代。与核准制相比,注册制最重要的变化在于以信息披露为核心,强调信息的真实性、准确性和完整性,以保证投资者能够合理判断证券价值。而在信息作用于股价这一过程中,市场中的分析师扮演着重要的信息中介角色,其利用行业专长对公司特质信息进行挖掘,向投资者提供盈余预测和投资建议,促进股价变化及时反映公司价值变动。已有研究表明,信息披露质量是影响分析师预测准确性的重要因素,公司信息披露质量越高,信息获取成本越低,分析师预测的准确性越高[1-2]。由此可见,分析师盈余预测是否准确,主要取决于其掌握的信息数量和质量,故而年报所披露的信息对分析师盈余预测至关重要。
随着计算机自然语言处理技术的发展,年报中的文本信息逐渐为人们所关注。相比于标准化的定量数据,文本信息的表达形式更加多样,向信息使用者传递了许多公司特质信息。已有文献主要从可读性、语调等文本特征进行研究,表明增量信息的获取、解读和使用是提高分析师盈余预测准确性的关键[3-4]。但除了语调和可读性外,管理层讨论与分析(MD&A)文本披露与以前年度的差异,即本文所说的纵向文本相似度,也是反映信息披露质量的重要特征。近年来,监管机构对信息披露的要求不断提高,年报文本的长度随之增加。Dyer et al.[5]发现,年报文本长度的中位数从1996年的2.3万个单词增加到2013年的近5万个单词,年报信息的冗余化、样板化特征明显。鲁乔杉等[6]基于中国上市公司样本研究发现,公司MD&A信息披露始终在时间序列上呈现出高度重复的惯性特征。较高的纵向文本相似度使信息披露的有用性和价值相关性备受争议,已有关于MD&A纵向文本相似度的经济后果研究主要关注了资本市场反应、上市公司融资成本和各类风险等[7-9],较少关注对分析师行为的影响。而分析师作为连接上市公司和投资者的信息中介,能够通过信息和声誉机制对资本市场的信息效率产生重要影响。因此,探究MD&A纵向文本相似度是否以及如何影响分析师盈余预测准确性,对规范上市公司信息披露、提高资本市场信息效率、全面落实注册制改革具有重要的理论和现实意义。
本文的研究贡献包括以下两个方面。(1)丰富了分析师盈余预测准确性的影响因素研究。既往研究在文本特征层面主要关注了可读性和语调特征,本文则聚焦于文本的纵向相似度特征,证明了“提供增量信息”是MD&A文本信息发挥作用的具体路径,打开了MD&A文本信息影响分析师盈余预测的“黑箱”。(2)拓展了年报文本相似度的经济后果研究。不同于已有文献重点关注资本市场反应和上市公司行为等层面,本文聚焦于分析师这一外部信息使用者,为分析MD&A纵向文本相似度如何影响分析师盈余预测和资本市场效率等问题提供了新的经验证据。
文本相似度主要指文本之间的差异程度,根据比较标准的不同划分为横向相似度和纵向相似度。其中,横向相似度是指企业所披露的文本信息与市场中其他企业或者同行业其他企业披露的文本信息之间的差异程度;纵向相似度是指企业所披露的文本信息与企业以前年度所披露的同类信息之间在文本内容及特征上的差异程度。本文主要关注纵向文本相似度,即上市公司本年度MD&A文本信息披露与上一年度的差异,差异越大代表文本所包含的公司特质信息越多。
关于年报纵向文本相似度的经济后果,已有文献主要从市场反应和公司行为两个层面展开研究。
一方面,关于市场反应。Brown &Tucker[7]基于美国公司1997—2006年的年报分析发现,尽管MD&A文本的长度不断增加,但MD&A的变化幅度却在降低,且市场反应与MD&A文本变动幅度正相关,由此表明MD&A文本信息的有用性在不断下降。赵子夜等[10]进一步对披露主体进行分类,提出年报文本纵向样板化的经济后果呈现相机抉择性。当公司财务风险较高时,信息效应占优,样板化的报告会引发负面的市场评价;而当公司财务风险较低时,风险效应占优,样板化的报告则带来正面的市场评价。
另一方面,关于公司行为。蒋艳辉、冯楚建[11]以创业板上市公司为样本,运用Fama-French四因子模型证明了MD&A文本相似度与股权资本成本之间存在正相关关系,说明文本信息含量的降低导致了公司融资成本的上升。不仅如此,MD&A纵向文本相似度还会影响上市公司的市场、信用和违规风险。宋昕倍等[12]研究发现,较高的MD&A文本相似度通过减少公司增量信息的传递,提高了公司的股价同步性和股价崩盘风险,且较差的内外部信息环境质量加剧了这一影响。李成刚等[9]构建上市公司信用风险预警模型时也发现,相较于文本可读性,文本相似度包含的文本特征信息更能反映公司未来发生信用风险的概率。钱爱民、朱大鹏[8]从上市公司违规处罚的视角进行研究,发现上市公司MD&A披露内容相似度越高,非MD&A披露内容相似度越低,当期越有可能被监管机构调查并处罚,因为监管机构更重视MD&A披露内容的信息含量和非MD&A披露内容的稳定性。以上研究均表明:纵向相似度特征是反映公司披露文本信息含量的重要指标,其对外部信息使用者的作用大小受上市公司信息环境差异的影响。
作为财务数据的重要补充,MD&A文本提供了管理层对公司经营业绩的历史回顾和未来预期信息,对分析师了解公司经营和财务状况、预计未来风险具有重要作用。随着计算机技术的快速发展,学界对MD&A信息的量化方法逐渐从人工阅读与识别转向对文本大数据的挖掘与分析[13]。关于MD&A文本对分析师行为的影响研究,已有文献主要从文本特征和文本内容这两方面展开。
一方面,关于文本特征,既有研究主要关注了文本的可读性和语调特征。当文本可读性较弱时,分析师阅读和处理文本信息的难度和成本增加,分析师预测更依赖于管理层预期,导致盈余预测分歧度增加、准确度降低[3]。此外,MD&A文本语调可以传递管理层对公司未来业绩看法的增量信息,提高盈余预测准确性[4]。但是,为开展盈余管理、内幕交易等活动,管理层也可能故意操纵文本语调,大量有偏信息将误导分析师判断,降低盈余预测准确性[14]。
另一方面,关于文本内容,相关文献主要关注了风险信息、研发信息等特定内容对分析师盈余预测的影响。王雄元等[15]发现,年报中风险信息的披露频率越高,分析师盈余预测准确度越高。何捷、陆正飞[16]针对供应链风险的研究发现,年报对公司未来供应链风险的披露吸引了更多分析师关注,公司风险披露能够降低分析师预测的乐观偏差,提高盈余预测准确度。李岩琼、姚颐[17]利用文本分析技术从年报中提取研发信息,证明在提高信息透明度的路径下,公司研发信息的披露显著降低了分析师盈余预测偏差及分歧度。总之,分析师能够利用行业专长更好地解读MD&A文本中的增量信息,提高盈余预测准确性。
MD&A文本信息的披露质量是影响分析师盈余预测准确性的重要因素,已有文献主要从可读性、语调等文本特征进行研究,表明增量信息的获取、解读和使用是提高分析师盈余预测准确性的关键,为理解MD&A文本信息如何影响分析师预测行为提供了有益启示。但除语调和可读性外,文本相似度也是反映文本信息披露质量的重要特征。现有关于MD&A文本相似度经济后果的研究主要关注资本市场反应、公司融资成本和各类风险等,较少关注对分析师行为的影响。因此,本文探究MD&A纵向文本相似度对分析师盈余预测的影响,从外部信息使用者的视角拓展MD&A文本相似度的经济后果研究。
MD&A披露的内容主要包括管理层对公司上一会计期间经营业绩的解释和分析,以及对下一会计期间经营业绩的展望和预测,具体涉及公司面临的宏观和行业环境、经营成果、财务状况、未来发展战略等方面,是上市公司年报文本信息披露的核心。纵向文本相似度用于衡量同一上市公司前后两年MD&A文本披露的变化程度,相似度高的原因可能包括:一是公司存在文本惯性披露,信息披露质量较差,MD&A传递的增量信息有限[12];二是公司发展战略相对稳定,经营状况平稳,公司基本面在当期没有发生较大改变。针对以上两种可能,本文分别提出“增量信息”假说和“战略稳定”假说,深入探索MD&A纵向文本相似度如何影响分析师对信息的获取与解读,进而影响盈余预测准确性。
已有研究表明,MD&A文本信息披露质量是影响分析师盈余预测的重要因素,高质量的文本信息能够缓解信息不对称,帮助信息使用者提高对公司未来业绩的预测效率[3-4]。关于年报文本信息的披露质量,已有研究所持观点可大致分为两类:一类从“信息供给”动机出发,认为传统财务数据无法准确反映公司价值,管理层会倾向通过增加文本信息披露,以形成对定量信息的解释与补充,降低公司内外部的信息不对称;另一类从“信息模糊”动机出发,认为在某些情况下管理层会出于自利动机,策略性地操纵文本信息披露,以降低负面消息反映到公司股价中的速度和程度,提高公司内外部的信息不对称。当MD&A纵向文本相似度较高时,文本传递的增量信息有限,会降低分析师盈余预测准确性。
从信息供给方来看,MD&A纵向文本相似度较高,一方面可能说明管理层进行增量信息披露的意愿不足。此时,文本披露流于形式,内容中存在大量与历史披露类似的信息,管理层不愿向外部信息使用者及时传达当期公司经营业务和所处内外部环境的关键增量信息,分析师所能依赖的公开信息不足,盈余预测准确性随之降低。MD&A纵向文本相似度较高,另一方面也可能反映了管理层进行增量信息披露的能力欠缺。此时,公司信息披露环境较差,内部无法开展有效的信息传递,导致管理层无法全面了解公司经营状况,也就无法对公司未来发展方向进行有效分析。如此,公司特质信息不能及时传递给外部信息使用者,加剧了分析师与公司之间的信息不对称,降低了分析师盈余预测准确性。
从信息需求方来看,分析师开展盈余预测主要依据两类信息——公开信息和私有信息。公开信息是指上市公司公开披露的,以及分析师通过解读上市公司所在行业情况所获得的信息;私有信息是指分析师利用自身专业能力,采用实地调研或访谈等形式挖掘的信息。Barron et al.[18]的研究表明,当上市公司信息披露质量较高时,分析师更依赖于公开信息,盈余预测分歧较小。相反,若上市公司信息披露质量较低时,分析师则更依赖于私有信息,盈余预测分歧较大。MD&A所披露的文本信息正是管理层回顾过去、展望未来的公开信息,高质量的文本信息披露有助于分析师预测公司未来的存货变化、风险走向和发展潜力,提高盈余模型中参数估计的准确度。因此,MD&A纵向文本相似度在一定程度上反映了上市公司信息披露的质量,纵向文本相似度高,意味着文本可能只是对历史披露进行简单的复制粘贴,涉及公司当期的特质信息较少,从而增加了分析师从中获取盈余预测所需增量信息的难度。基于“增量信息”假说的理论分析,本文提出以下假说。
H1a:上市公司MD&A纵向文本相似度越高,分析师盈余预测准确性越低。
公司战略是管理层基于公司内外部环境的现实状况和未来变化所制定的长远规划,战略制定的合理性将直接关系到公司能否在激烈的竞争环境中保持核心竞争力,实现可持续发展。因此,战略选择是影响公司经营业绩的重要因素。选择激进战略的公司更倾向于开发新产品、开拓新市场,自然面临着更大的不确定性和经营风险,导致公司盈余波动增加、盈余管理动机提升[19]。曲晓辉等[20]的研究表明,公司盈余的波动性、不可预测性,以及盈余管理行为均会加大分析师判断和评估公司经营活动和绩效的难度,降低盈余预测准确性。何玉润、徐云[21]则直接考察了公司战略对分析师盈余预测的影响,发现公司战略差异度增加了公司的业绩波动,使得分析师难以根据以往经验对公司业绩进行准确预测。
MD&A纵向文本相似度高可能意味着公司当期或未来期间的经营状况与以往相比没有重大变化,即公司发展战略和经营状态处在一个相对稳定的阶段,没有新增的重大投资项目,没有可行的兼并收购计划,没有产品研发的突破性进展等。在这种情况下,公司的盈余波动小、可预测性强,分析师掌握公司基本面信息的难度和成本降低,盈余预测准确性随之升高。不仅如此,当公司发展战略较为稳定时,文本的重复性披露还可以增强投资者对其他非重复文本信息的理解。也就是说,MD&A文本与历史披露之间相似度总体上普遍较高,而差异性的内容正好清楚地反映了公司发生实质性变动的经营事项。因此,分析师能够更好地聚焦此类异质性信息,更高效地获取、关注和理解上市公司经营情况和未来风险的变动,从而提升其盈余预测的准确性。基于“战略稳定”假说的理论分析,本文提出以下竞争性假说。
H1b:上市公司MD&A纵向文本相似度越高,分析师盈余预测准确性越高。
本文以中国沪深两市A股上市公司为研究对象。2012年,证监会对MD&A披露内容和格式规范进行了全面修订,并首次提出了“表述平实,清晰易懂,力戒空洞、模板化”的具体要求,此后上市公司MD&A披露才相对规范化,因而本文选取2012—2021年作为研究样本区间。同时,由于分析师进行盈余预测的依据为上一年年报,因此本文选取的分析师预测数据期间为2013—2022年。本文按照如下原则对样本进行了筛选:(1)删除金融类上市公司;(2)删除样本期内被ST、*ST公司;(3)删除当年上市的公司;(4)删除数据缺失的公司。最终得到18 595个公司—年度观测值。为控制极端值的影响,本文对连续变量进行了1%和99%分位点的缩尾处理。其中,上市公司年报信息来自巨潮资讯网,MD&A纵向文本相似度数据通过对上市公司年报进行文本提取和分析得到,分析师盈余预测和其他公司财务数据均来自CSMAR数据库。
1. 被解释变量
被解释变量为分析师盈余预测准确性(Accuracy)。借鉴徐经长等[22]的做法,本文采用公式(1)计算分析师盈余预测准确性(Accuracy),该值越大,分析师盈余预测准确性越高。其中,FEPS为分析师对上市公司每股盈余的预测值,MEPS为上市公司每股盈余的真实值,Price为上市公司的年初开盘价,i为公司,t为年份。
(1)
2. 解释变量
解释变量为MD&A纵向文本相似度(Sim)。借鉴钱爱民、朱大鹏[8]的做法,基于各家上市公司公开披露的年报,本文利用文本分析法构建MD&A纵向文本相似度(Sim),具体步骤如下。(1)提取MD&A文本。从巨潮资讯网批量下载中国A股上市公司2012—2021年的年报,按照年报中“管理层讨论与分析”章节标识提取文本段落。(2)对MD&A文本进行清洗和分词。利用“jieba”分词开源工具,对MD&A文本进行分词,并剔除标点符号、数字和一些常见停用词等。(3)将每篇文档表示为词向量。由于每个词对于文档的重要程度不同,本文在文档层面对于词向量进行TF-IDF加权。(4)利用文档的向量表示,测度纵向文本相似度。本文采用词向量间的余弦函数作为MD&A纵向文本相似度(Sim)的度量方式,该值越大,文本相似度越高。
3. 控制变量
参照王雄元等[15]的做法,本文选取的控制变量包括公司规模(Size)、净资产收益率(ROE)、营业收入增长率(Growth)、有形资产(PPE)、公司年龄(Age)、产权性质(SOE)、第一大股东持股比例(BIG)、独立董事占比(Director)、“四大”审计(Auditor)、机构投资者持股比例(Inshold)和分析师跟踪(AnalystNum)。变量的定义和说明见表1。
表1 变量定义
变量类型变量名称变量符号变量说明被解释变量分析师盈余预测准确性Accuracy分析师每股盈余预测值均值与实际值差的绝对值除以年初开盘价的相反数解释变量MD&A纵向文本相似度Sim本年MD&A与上年MD&A文本向量的余弦相似度公司规模Size总资产取自然对数净资产收益率ROE净利润除以净资产营业收入增长率Growth本年度与上年度营业收入之差除以上年度营业收入有形资产PPE固定资产的自然对数公司年龄Age公司成立年限加1取自然对数控制变量产权性质SOE国有企业取值为1,否则为0第一大股东持股比例BIG第一大股东持股数除以总股数独立董事占比Director独立董事数量除以董事总数“四大”审计Auditor公司年报为国际“四大”会计师事务所审计取值为1,否则为0机构投资者持股比例Inshold机构投资者持股数除以总股数分析师跟踪AnalystNum分析师跟踪人数加1取自然对数
本文构建模型(2)对MD&A纵向文本相似度和分析师盈余预测准确性之间的关系进行实证检验。其中,Controls为控制变量,ε为残差项。同时,为控制不随时间变化的因素和不可观测的遗漏变量,本文进一步加入了年份(Year)和公司(Firm)固定效应。本文主要关注系数β1的结果,如果β1显著小于0,则表明上市公司MD&A纵向文本相似度降低了分析师盈余预测准确性,则H1a得证;如果β1显著大于0,则表明上市公司MD&A纵向文本相似度提高了分析师盈余预测准确性,则H1b得证。
Accuracyi,t+1=β0+β1Simi,t+A′Controlsi,t +
∑Year+∑Firm+εi,t
(2)
表2报告了变量的描述性统计结果,从中可以看出:分析师盈余预测准确性(Accuracy)的均值为-0.037,标准差为0.050,说明分析师盈余预测的准确性在不同公司间存在差异;MD&A纵向文本相似度(Sim)的均值为0.726,标准差为0.132,样本整体波动较大,说明中国上市公司MD&A纵向文本相似度普遍较高,且各公司之间的差异也较为明显。
表2 变量的描述性统计结果
变量均值标准差最小值中位数最大值Accuracy-0.0370.050-0.373-0.0200.000Sim0.7260.1320.3160.7430.966Size22.4991.29820.17522.30326.695ROE0.0770.103-0.9830.0800.352Growth0.2812.399-13.3040.15615.234PPE20.5091.68716.17120.40325.298Age2.7840.4690.6152.8903.555SOE0.3460.476001BIG0.4650.1650.0910.4650.868Director0.3830.0710.2500.3640.600Auditor0.0720.258001Inshold0.4550.2510.0040.4840.918AnalystNum1.7941.1530.0001.7924.942
表3报告了上市公司MD&A纵向文本相似度对分析师盈余预测准确性影响的回归结果,回归系数的标准误在公司层面进行了Cluster调整。列(1)是未加入控制变量的回归结果,MD&A纵向文本相似度(Sim)在1%的水平下显著且系数为负;列(2)是加入控制变量后的回归结果,Sim依然在1%的水平下显著且系数为负。本文进一步计算列(2)回归结果的经济显著性:MD&A纵向文本相似度每增加1%,分析师盈余预测准确性会降低4%。由此说明,上市公司MD&A纵向文本相似度与分析师盈余预测准确性负相关,H1a得证,即“增量信息”假说成立。可能的原因在于,上市公司惯性披露导致MD&A纵向文本相似度普遍偏高,文本内容中存在大量与历史披露类似的信息,MD&A传递的增量信息有限,分析师所能依据的信息不够充分,盈余预测准确性因此降低。
表3 文本相似度影响分析师盈余预测准确性的基准回归结果
(1)(2)Sim-0.012∗∗∗-0.011∗∗∗(-2.79)(-3.07)Size-0.024∗∗∗(-12.97)ROE0.150∗∗∗(16.55)Growth0.000∗∗(2.39)PPE0.003∗∗(2.06)Age-0.002(-0.82)SOE-0.010∗∗(-2.03)BIG-0.003(-0.56)Director-0.001(-0.10)Auditor0.003(0.75)Inshold0.055∗∗∗(9.85)AnalystNum0.003∗∗∗(4.88)Year & Firm FE是是常数项-0.038∗∗∗0.396∗∗∗(-14.12)(10.99)观测值1859518595调整后R20.0820.168
注:***、**和*分别表示在1%、5%和10%的水平下显著;括号内为T值。
1.工具变量法
对于可能存在的内生性问题,模型(2)中已通过控制公司个体固定效应在一定程度上解决了遗漏变量导致的内生性问题。此外,本文还借鉴曾庆生等[4]的做法,采用工具变量法进一步缓解解释变量和被解释变量互为因果导致的内生性问题。具体做法为:选取同行业同年度其他上市公司MD&A纵向文本相似度的均值(Sim_m)和MD&A纵向文本相似度的滞后项(Sim_l)作为工具变量,并采用两阶段最小二乘法进行回归。理论上,同行业上市公司和本公司下一年度的MD&A文本披露在一定程度上和本公司本年度的MD&A文本披露正相关,但不会影响下一年度的分析师盈余预测,因此工具变量满足相关性和外生性的要求。Wald 检验中的 F 值大于临界值10,Hansen J检验的p值无法拒绝原假设,表明工具变量不存在弱工具变量和过度识别问题。表4的列(1)和列(2)分别报告了两阶段最小二乘法的回归结果。列(2)显示,在采用工具变量法缓解内生性问题后,MD&A纵向文本相似度(Sim)仍然在5%的水平下显著且系数为负,所得结论与基准回归结论一致。
表4 工具变量法和Heckman两阶段法检验结果
工具变量法Heckman两阶段法SimAccuracySim_dummyAccuracy(1)(2)(3)(4)Sim_l0.089∗∗∗(8.22)Sim_m0.261∗∗∗(5.29)Sim-0.089∗∗-0.011∗∗∗(-2.03)(-3.06)IMR0.054(0.75)控制变量是是是是Year & Firm FE是是是是常数项0.422∗∗∗0.492∗∗∗-0.1930.344∗∗∗(4.36)(9.38)(-0.51)(4.50)观测值13367133671859518595调整后R20.1610.0970.204伪R20.012Wald F值89.468∗∗∗Hansen J p值0.162
注:***、**和*分别表示在1%、5%和10%的水平下显著;括号内为T值。
2. Heckman两阶段法
为缓解样本自选择导致的内生性问题,本文借鉴宋昕倍等[12]的做法,采用Heckman两阶段法进行回归。在第一阶段,按照“行业—年度”均值构造MD&A纵向文本相似度的虚拟变量(Sim_dummy),当上市公司该年度MD&A纵向文本相似度的值高于行业均值时取值为1,否则为0。在第二阶段,将第一阶段得到的逆米尔斯比率(IMR)代入模型(2)中进行回归,表4的列(3)和列(4)分别报告了Heckman两阶段模型的回归结果。列(4)显示,MD&A纵向文本相似度(Sim)在1%的水平下显著且系数为负,所得结论与基准回归结论保持一致。
1.更换被解释变量
关于分析师盈余预测准确性的度量,本文借鉴王玉涛、王彦超[2]的做法,进一步采用公式(3)重新计算分析师盈余预测准确性(Accuracy_1),将其作为被解释变量的替代指标,并代入模型(2)进行回归,结果如表5的列(1)所示。可以看出,MD&A纵向文本相似度(Sim)仍在5%的水平下显著且系数为负,说明在更换了被解释变量的度量方式后,基准回归结果不变。
(3)
表5 稳健性检验结果
Accuracy_1AccuracyAccuracyAccuracyAccuracy(1)(2)(3)(4)(5)Sim-0.469∗∗-0.012∗∗∗-0.011∗∗∗(-2.27)(-3.14)(-2.63)Sim_lda-0.012∗∗∗(-2.68)Sim_adj-0.013∗∗∗(-3.37)Sim_hori-0.012∗(-1.74)控制变量是是是是是Year & Firm FE是是是是是常数项7.098∗∗∗0.399∗∗∗0.389∗∗∗0.397∗∗∗0.430∗∗∗(3.98)(11.01)(10.83)(11.04)(11.33)观测值1859518595185951859517108调整后R20.1060.2040.2040.2040.212
注:***、**和*分别表示在1%、5%和10%的水平下显著;括号内为T值。
2.更换解释变量
本文改变文本相似度的测度方法,采用LDA模型对MD&A纵向文本相似度(Sim_lda)进行重新构造。表5的列(2)报告了LDA模型下的回归结果,结果显示MD&A纵向文本相似度(Sim_lda)在1%的水平下显著且系数为负。此外,考虑到上市公司所处行业对文本披露特征的影响,本文进一步采用经“行业—年度”中位数调整后的纵向文本相似度(Sim_adj),将其代入模型(2)进行回归。表5的列(3)结果表明,MD&A纵向文本相似度(Sim_adj)仍在1%的水平下显著且系数为负,说明更换了解释变量的度量方式后,所得结论与基准回归结论保持一致。
3.控制MD&A横向文本相似度
Hanley &Hoberg[23]的研究表明,较低的横向相似度能够向投资者传递更多反映企业个体特征的信息,降低外部投资者的信息不对称,提高投资者盈余预测准确性。为排除MD&A文本披露中横向相似度对分析师盈余预测准确性的影响,本文在模型(2)的基础上进一步加入MD&A横向相似度(Sim_hori)这一控制变量,回归结果如表5的列(4)所示。可以看出,MD&A纵向文本相似度(Sim)仍在1%的水平下显著且系数为负,说明在控制其他影响分析师预测准确性的变量后,所得结论与基准回归结论保持一致。
4.更换样本区间
2012年,证监会对MD&A文本披露的内容和格式进行了全面修订,因此该年度MD&A的披露方式与上一年度相比发生较大改变,纵向文本相似度也相对偏低。为排除此部分样本对回归结果的影响,表5的列(5)报告了剔除2012年度观测值后的回归结果,MD&A纵向文本相似度(Sim)仍在1%的水平下显著且系数为负,说明在更换了样本区间后,所得结论与基准回归结论保持一致。
以上研究表明,上市公司MD&A纵向文本相似度与分析师盈余预测准确性负相关,说明纵向文本相似度主要通过增强上市公司增量信息的传递作用于分析师盈余预测行为。因此,上市公司所处的内外部环境信息质量不同,MD&A纵向文本相似度对分析师盈余预测准确性的影响程度也存在差异。其中,公司规模、公司类型是影响公司信息披露制度的基础性因素,媒体关注度和市场化程度是影响上市公司信息披露意愿的重要外部因素。因此,本文将进一步探索在不同的公司规模、公司类型、媒体关注度和市场化程度下,MD&A纵向文本相似度对分析师盈余预测准确性的异质性作用。当上市公司信息不对称程度更高时,MD&A文本增量信息所能发挥的作用也更大,进而佐证了“提供增量信息”是MD&A文本信息披露影响分析师盈余预测准确性的具体路径。
1.基于公司规模的异质性分析
通常而言,相比于大公司,小公司信息披露制度的完善程度相对较低,信息透明度不足,外部信息使用者获取公司内部信息的难度和成本更高。对分析师而言,他们通常会同时跟踪多家上市公司,很难掌握所关注对象的所有信息,在“成本—收益”的权衡下,往往会将更多的精力放在跟踪大公司上。因此,受到分析师“有限关注”的影响,小公司的信息不对称问题更加突出,年报文本信息含量的边际作用更重要。当MD&A纵向文本相似度越高时,分析师无法及时对小公司的经营业绩和未来发展状况做出准确判断,盈余预测准确性的下降幅度会越大。
为检验这一预设,本文按照“行业—年度”中位数将样本分为大规模公司和小规模公司,并分别对两组样本进行回归。表6的列(1)和列(2)报告了公司规模的异质性检验结果:小规模公司MD&A纵向文本相似度(Sim)在1%的水平下显著且系数为负,大规模公司MD&A纵向文本相似度(Sim)不显著,两组的组间差异系数显著。由此说明,上市公司MD&A纵向文本相似度对分析师盈余预测准确性的影响显著存在于小规模公司中。
表6 内部信息环境异质性分析回归结果
公司规模公司类型小大非高科技高科技(1)(2)(3)(4)Sim-0.015∗∗∗-0.004-0.006-0.014∗∗∗(-2.91)(-0.78)(-1.10)(-2.87)控制变量是是是是Year & Firm FE是是是是常数项0.522∗∗∗0.401∗∗∗0.490∗∗∗0.360∗∗∗(9.22)(6.66)(7.73)(8.17)观测值93479248771510880调整后R20.2560.1470.2350.171Chowtest p值0.000∗∗∗0.011∗∗
注:***、**和*分别表示在1%、5%和10%的水平下显著;括号内为T值。
2.基于公司类型的异质性分析
与非高科技公司不同,高科技公司拥有大量的无形资产。作为影响公司成长的重要因素,无形资产是外部信息使用者判断公司未来业绩的关键因素之一。但无形资产的价值通常很难在财务报告中充分展现出来,导致财务报告的价值相关性降低,公司内外部之间的信息不对称增强[17],外部信息使用者通常需要具备专业的产业知识以更好地了解公司发展的现实情况和未来潜力。在进行盈余预测时,分析师只有通过公开的文本信息补充掌握公司无形资产的基本情况,才能有效预估公司未来业绩走向,深入分析公司潜在价值。因此,对高科技公司而言,文本信息中所包含的增量信息对缓解信息不对称问题更加重要。当MD&A纵向文本相似度越高时,意味着文本信息中反映当期经营情况的增量信息越少,分析师预测业绩所能依据的公司基本面信息越少,盈余预测偏差会相对越大。
为检验这一预设,本文借鉴彭红星、毛新述[24]对高科技公司的认定标准,将样本划分为非高科技公司和高科技公司分别进行回归。表6的列(3)和列(4)报告了公司是否为高科技公司的异质性检验结果:非高科技公司的MD&A纵向文本相似度(Sim)不显著,高科技公司的MD&A纵向文本相似度(Sim)在1%的水平下显著且系数为负,两组的组间差异系数显著。由此说明,上市公司MD&A纵向文本相似度对分析师盈余预测准确性的影响显著存在于高科技公司中。
3.基于媒体关注度的异质性分析
年报信息和媒体信息都是分析师获取公开信息的重要来源。周开国等[25]的研究表明,当市场中的媒体信息增多时,分析师可收集的与上市公司价值相关的信息数量增多,分析师盈余预测偏差随之降低。同时,大量的媒体报道可以有效降低信息的倾向性和分歧度,增加信息的准确性。分析师为维护声誉通常会追随媒体观点,避免发布与事实相左的报告。由此可见,媒体信息是年报信息的重要补充,二者共同构成分析师盈余预测的信息基础。媒体关注度较低,说明分析师从媒体渠道获得的信息有限,年报信息对分析师预测产生的影响相对更大。当MD&A纵向文本相似度越高时,年报文本信息所传递的公司特质信息不足,分析师盈余预测产生的偏差可能越高。
为检验这一预设,本文借鉴逯东、宋昕倍[26]的做法,采用上市公司年度媒体报道数加1取自然对数衡量媒体关注度,按照“行业—年度”中位数将样本分为两组分别进行回归。表7的列(1)和列(2)报告了媒体关注度的异质性检验结果:媒体关注度低的公司MD&A纵向文本相似度(Sim)在5%的水平下显著且系数为负,媒体关注度高的公司MD&A纵向文本相似度(Sim)不显著,两组的组间差异系数显著。由此说明,上市公司MD&A纵向文本相似度对分析师盈余预测准确性的影响显著存在于媒体关注度低的公司中。
表7 外部信息环境异质性分析回归结果
媒体关注度市场化程度低高低高(1)(2)(3)(4)Sim-0.011∗∗-0.009-0.015∗∗∗-0.009∗(-2.13)(-1.60)(-2.68)(-1.83)控制变量是是是是Year & Firm FE是是是是常数项0.380∗∗∗0.413∗∗∗0.299∗∗∗0.454∗∗∗(7.59)(7.53)(4.90)(9.51)观测值93029293858410011调整后R20.2280.1650.2270.171Chowtest p值0.086∗0.052∗
注:***、**和*分别表示在1%、5%和10%的水平下显著;括号内为T值。
4.基于市场化程度的异质性分析
市场化程度是影响信息披露质量的外部因素之一。一方面,市场化程度高意味着产品和要素市场较为健全,政府干预程度较低,公司的信息披露质量对其所需资源的获取影响更大;另一方面,地区市场化程度越高,法律制度越完善,低质量的信息披露将面临更大的处罚风险。因此,在市场化程度较低的地区,上市公司信息披露质量相对较差,MD&A文本信息中所包含的增量信息对缓解信息不对称问题更加重要。MD&A纵向文本相似度越高,意味着文本信息中所包含的增量信息越少,分析师预测业绩所能依据的公司特质信息有限,盈余预测准确性更低。
为检验这一预设,本文采用王小鲁等[27]编制的各省份市场化指数作为市场化程度的度量指标,按照年度中位数将样本分为两组分别进行回归。表7的列(3)和列(4)报告了公司所在省份市场化程度的异质性检验结果:公司所在省份市场化程度低,MD&A纵向文本相似度(Sim)在1%的水平下显著且系数为负;公司所在省份市场化程度高,MD&A纵向文本相似度(Sim)在10%的水平下显著且系数为负。两组的组间差异系数显著。由此说明,公司位于市场化程度低的省份时,其MD&A纵向文本相似度对分析师盈余预测准确性的影响更大。
分析师的盈余预测行为实质上是其不断获取外部信息、更新自我认知的过程。预测作为一项面向未来的活动,通常具有较高的不确定性,分析师主要通过推断未来与过去的相似程度来判断未来的业绩走向,而推断的重要依据之一就是上市公司公开披露的文本信息。较高的MD&A纵向文本相似度会对分析师盈余预测行为产生影响。一方面,加剧分析师的乐观认知偏差。根据行为金融理论,分析师虽然具有丰富的投资经验和专业知识,但仍会受到有限理性的限制,和普通投资者一样存在认知偏差,对坏消息反应不足,对好消息反应过度,进而产生系统性的乐观偏差[28]。MD&A纵向文本相似度较高时,上市公司公开信息披露中的增量信息有限,经营风险等不确定因素未能得到充分反映,从而提高了分析师对公司未来发展的信心,促使其发布乐观的盈余预测,导致正向预测偏差。另一方面,MD&A纵向文本相似程度高还意味着公司存在策略性披露的可能性。根据文本披露的“信息模糊”动机,不论是出于维护公司形象,还是谋取个人私利考虑,管理层都有可能通过使用与过去相似的表达,使信息披露流于形式,从而达到隐藏公司负面消息、延迟负面消息反映到公司股价中的目的。而这些行为会在很大程度上影响分析师的认知与判断,导致较高的正向预测偏差。因此,本文认为相比于负向预测偏差,MD&A纵向文本相似度高对分析师预测的正向偏差的影响更大。
本文进一步将研究样本分为正向预测偏差和负向预测偏差分别进行回归。表8的列(1)报告了正向预测偏差样本组的回归结果,MD&A纵向文本相似度(Sim)在1%的水平下显著且系数为负;表8的列(2)报告了负向预测偏差样本组的回归结果,MD&A纵向文本相似度(Sim)不显著。两组的组间差异显著。由此表明,相对于负向预测偏差,上市公司MD&A纵向文本相似度显著影响了分析师正向预测偏差。
表8 进一步分析回归结果
AccuracySYNSYN正向偏差负向偏差全样本准确性低准确性高(1)(2)(3)(4)(5)Sim-0.011∗∗∗0.0070.059∗∗∗0.074∗∗∗0.033(-2.73)(1.01)(4.38)(3.68)(1.61)控制变量是是是是是Year & Firm FE是是是是是常数项0.427∗∗∗-0.018-0.576∗∗∗-0.461∗∗∗-0.533∗∗∗(10.26)(-0.31)(-5.50)(-2.97)(-3.20)观测值16162243318595858410011调整后R20.2330.1360.3260.3000.350Chowtest p值0.046∗∗0.006∗∗∗
注:***、**和*分别表示在1%、5%和10%的水平下显著;括号内为T值。
分析师在资本市场中具有信息使用者和提供者的双重身份,能够利用行业专长解读公司信息并向投资者提供投资建议,通过推动交易使公司特质信息更加迅速而有效地融入股价。因此,分析师盈余预测行为的变化会进一步影响整个资本市场的运作效率。本文进一步考察MD&A纵向文本相似度提高导致分析师盈余预测准确性下降会对资本市场信息效率产生何种影响,以期更全面地认识MD&A文本特征所导致的经济后果。
本文选择股价同步性(SYN)作为衡量资本市场信息效率的指标,它反映了个股价格波动与市场价格波动的相关性,即公司特质信息融入股票价格的程度。具体测算采用综合市场流通市值平均法,利用模型(4)估计个股的R2,以此度量股价同步性。其中,ri,t为上市公司i第t周综合市场考虑现金红利再投资的收益率;rm,t为所有A股上市公司第t周通过流通市值加权的平均收益率;rI,t为行业I第t周的收益率。
ri,t=β0+β1rm,t+β2rI,t+εi,t
(4)
为检验MD&A纵向文本相似度高导致分析师盈余预测准确性下降的经济后果,本文借鉴刘贯春等[29]的做法,构建模型(5)直接检验MD&A纵向文本相似度对股价同步性的影响,其中SYN为上市公司的股价同步性。
SYNi,t+1=γ0+γ1Simi,t+B′Controlsi,t+
∑Year+∑Firm+εi,t
(5)
表8的列(3)结果显示,MD&A纵向文本相似度(Sim)在1%的水平下显著且系数为正,说明纵向文本相似度的提高提升了上市公司的股价同步性。为证实MD&A纵向文本相似度通过降低分析师盈余预测准确性提高了股价同步性,本文以“分析师盈余预测准确性”指标的“年度—行业”中位数作为分组标准,将所有公司划分为两个子样本进行分组估计。表8的列(4)为分析师预测准确性低的样本的回归结果,MD&A纵向文本相似度(Sim)在1%的水平下显著且系数为正;表8的列(5)为分析师预测准确性高的样本的回归结果,MD&A纵向文本相似度(Sim)不显著。两组的组间差异系数在1%的水平下显著。由此说明,较高的MD&A纵向文本相似度降低了分析师盈余预测准确性,进而提高了股价同步性,降低了资本市场的信息效率。
本文采用文本分析法,构造了衡量上市公司MD&A纵向文本相似度的指标,并以2012—2021年中国沪深两市A股上市公司为研究对象,探究了MD&A纵向文本相似度对分析师盈余预测准确性的影响。研究发现,MD&A纵向文本相似度越高,分析师盈余预测准确性越低,证实了“增量信息”假说。异质性分析表明,这种影响显著存在于规模小、高科技、媒体关注度低的公司中,并且公司位于市场化程度低的省份时受此影响更大。由此可见,当上市公司信息不对称程度更高时,MD&A文本增量信息所能发挥的作用也更大,进而佐证了“提供增量信息”是 MD&A 文本信息披露影响分析师盈余预测的具体路径。进一步研究发现,MD&A纵向文本相似度越高,分析师盈余预测的正向偏差越大,说明MD&A文本增量信息有限会在很大程度上影响分析师的认知与判断,导致较高的正向预测偏差。此外,分析师盈余预测准确性的下降会进一步降低资本市场的信息效率,表明分析师盈余预测行为的变化将进一步影响整个资本市场的运作效率。在全面实行注册制的时代背景下,相关政策已强化并落实了上市公司信息披露的法定责任,本文的研究结论对完善上市公司信息披露制度、改善市场信息环境具有重要启示。
基于以上研究结论,本文提出如下政策建议。首先,上市公司要重视MD&A文本信息披露的经济后果,意识到文本信息对分析师等外部信息使用者了解公司经营状况、缓解信息不对称的重要作用。通过避免披露内容的样板化,向外部传递更多增量信息,改善公司的内外部环境,提高信息披露的有用性和价值相关性。其次,分析师在进行盈余预测时,需更加关注年报中披露的文本增量信息,提高对文本信息的解读能力。通过建立文本数据集、选择最优特征子集、利用机器学习算法构建模型等文本处理步骤,深入分析文本内容,挖掘出更多增量信息,并同从其他渠道收集的信息相互佐证。在此基础上,利用支持向量机、神经网络等常用的预测模型对公司未来发展状况和股价走势进行科学理性预测。最后,监管部门要逐步加强对上市公司文本信息披露的监管,规范和强化文本信息披露要求,使文本内容披露更加合法合规。一方面,可以通过信息技术和文本分析技术等制定出一套更加标准化的信息披露机制,细化年报文本披露内容与格式。如,针对风险信息,可利用文本大数据和机器学习算法建立更加科学合理的分类,降低重复性,以引导上市公司提炼冗长信息,精简文本篇幅,理顺行文逻辑。另一方面,可以通过文本挖掘技术对所披露信息进行分类,总结欺诈性披露的文本特征,更好地识别违规披露行为。同时,从法律法规层面明确文本信息披露主体的责任,加大违规披露的惩罚力度,以减少MD&A信息披露中与上年内容重复率过高、样板化严重的现象,缓解信息不对称,提高股票市场的运行效率。
[1]BYARD D, SHAW K W. Corporate disclosure quality and properties of analysts’ information environment[J]. Journal of Accounting, Auditing &Finance, 2003, 18(3): 355-378.
[2]王玉涛, 王彦超. 业绩预告信息对分析师预测行为有影响吗[J]. 金融研究, 2012(6):193-206.
[3]FILZEN J J, PETERSON K. Financial statement complexity and meeting analysts’ expectations[J]. Contemporary Accounting Research, 2015, 32(4): 1560-1594.
[4]曾庆生, 周波, 张程, 等. 年报语调与内部人交易:“表里如一”还是“口是心非”?[J]. 管理世界, 2018(9):143-160.
[5]DYER T, LANG M, STICE-LAWRENCE L. The evolution of 10-K textual disclosure: evidence from Latent Dirichlet Allocation[J]. Journal of Accounting and Economics, 2017, 64(2/3): 221-245.
[6]鲁乔杉, 李秉祥, 张涛, 等. 独立董事关系网络与MD&A文本信息惯性披露——基于程度中心度和结构洞视角[J]. 会计研究, 2022(9):39-51.
[7]BROWN S V, TUCKER J W. Large-sample evidence on firms’ year-over-year MD&A modifications[J]. Journal of Accounting Research, 2011, 49(2): 309-346.
[8]钱爱民, 朱大鹏. 财务报告文本相似度与违规处罚——基于文本分析的经验证据[J]. 会计研究, 2020(9):44-58.
[9]李成刚, 贾鸿业, 赵光辉, 等. 基于信息披露文本的上市公司信用风险预警——来自中文年报管理层讨论与分析的经验证据[J]. 中国管理科学, 2023(2):18-29.
[10]赵子夜, 杨庆, 杨楠. 言多必失?管理层报告的样板化及其经济后果[J]. 管理科学学报, 2019(3):53-70.
[11]蒋艳辉, 冯楚建. MD&A语言特征,管理层预期与未来财务业绩——来自中国创业板上市公司的经验证据[J]. 中国软科学, 2014(11):115-130.
[12]宋昕倍, 陈莹, 逯东, 等. 信息环境、上市公司增量信息披露与资本市场定价效率——基于MD&A文本相似度的研究[J/OL]. 南开管理评论:1-26[2023-05-02].http://kns.cnki.net/kcms/detail/12.1288.f.20221114.1455.002.html.
[13]GOLDSTEIN I, SPATT C S, YE M. Big data in finance[J]. Review of Financial Studies, 2021, 34(7): 3213-3225.
[14]王华杰, 王克敏. 应计操纵与年报文本信息语气操纵研究[J]. 会计研究, 2018(4):45-51.
[15]王雄元, 李岩琼, 肖忞. 年报风险信息披露有助于提高分析师预测准确度吗?[J]. 会计研究, 2017(10): 37-43.
[16]何捷, 陆正飞. 定性的未来供应链风险披露与分析师关注行为研究[J]. 会计研究, 2020(6):36-48.
[17]李岩琼, 姚颐. 研发文本信息:真的多说无益吗?——基于分析师预测的文本分析[J]. 会计研究, 2020(2):26-42.
[18]BARRON O E, BYARD D, YU Y. Earnings announcement disclosures and changes in analysts’ information[J]. Contemporary Accounting Research, 2017, 34(1): 343-373.
[19]孙健, 王百强, 曹丰, 等. 公司战略影响盈余管理吗?[J]. 管理世界, 2016(3):160-169.
[20]曲晓辉, 卢煜, 汪健. 商誉减值与分析师盈余预测——基于盈余管理的视角[J]. 山西财经大学学报, 2016(4):101-113.
[21]何玉润, 徐云. 企业战略差异度会影响分析师盈利预测的准确性吗?[J]. 北京工商大学学报(社会科学版), 2017(2):58-66.
[22]徐经长, 柯劲婧, 何乐伟. 新收入准则能否提高会计信息质量?——基于分析师预测视角的研究[J]. 会计研究, 2022(9):3-20.
[23]HANLEY K W, HOBERG G. The information content of IPO prospectuses[J]. Review of Financial Studies, 2010, 23(7): 2821-2864.
[24]彭红星, 毛新述. 政府创新补贴、公司高管背景与研发投入——来自我国高科技行业的经验证据[J]. 财贸经济, 2017(3):147-161.
[25]周开国, 应千伟, 陈晓娴. 媒体关注度、分析师关注度与盈余预测准确度[J]. 金融研究, 2014(2):139-152.
[26]逯东, 宋昕倍. 媒体报道、上市公司年报可读性与融资约束[J]. 管理科学学报, 2021(12):45-61.
[27]王小鲁, 胡李鹏, 樊纲. 中国分省份市场化指数报告(2021)[M]. 北京: 社会科学文献出版社, 2021.
[28]EASTERWOOD J C, NUTT S R. Inefficiency in analysts’ earnings forecasts: systematic misreaction or systematic optimism?[J]. Journal of Finance, 1999, 54(5): 1777-1797.
[29]刘贯春, 叶永卫, 陈肖雄, 等. 固定资产折旧、税收筹划与异常投资[J]. 经济研究, 2023(4):23-40.