201505 - page 9
第
30
卷
摇
第
5
期
汤谷良
,
栾志乾
:
非财务信息披露
、
管控能力和企业业绩
方法
,
因为利用正面情绪和负面情绪词典这种模
式并不适用于中文语义环境
,
中文句法中表达的
情绪往往是隐性的
,
以上市公司年报中的管理层
讨论文本为例
,
一种常见的现象就是在公司在顺
境时往往大肆强调企业核心能力
、
品牌价值
、
市场
份额等因素
,
而在逆境时往往大篇幅渲染外部环
境如何不利
,
整个行业面临如何的挑战等等
,
这些
内容难以单纯从词性中进行区分
。
为了解决这个
问题
,
本文采用监督式机器学习的方式
,
通过计算
机的人工智能对大量的管理层讨论文本信息进行
编码
。
监督式机器学习的目标是为了所要从事的
分析预测工作训练出精确的分类标签分类器
,
然
后将训练好的分类器运用于后续内容的分类上
,
这种方法主要适用于计算机算法自己难以判别并
主动分类的环境下
,
其主要的算法主要包括近邻
距离
(KNN)、
支持向量机
(SVM)
等
。
本文使用监
督式机器学习的主要的流程如下
:
在
R
上通过程
序读入管理层讨论文本存入字符向量
,
对该向量
用
jiebaR
包进行中文分词生成新的字符向量
,
将
该分词过的向量用
tm
包初始化为向量语料库对
象
Corpus,
然后去除连接词和词频出现较低的词
(Sparse Terms),
将剩下的核心词汇进行合并
,
并
用空格作为连接符赋值到新的字符向量完成预处
理工作
。
通过程序循环完成所有文本的预处理工
作
,
随机选择
200
家
/
年度公司预处理过的字符向
量
,
人工采用专家打分的方式对这些字符向量进
行编码
,
为了进行三角验证
,
这
200
家
/
年度公司
的观测也结合管理层讨论文本原文进行三角验
证
,
如果出现分歧
,
以原文表达出来的情态为准
。
然后通过
RTextTools
包利用其中前
100
家公司编
码后的数据进行监督式机器学习
,
对相应的随机
森林
、
支持向量机等算法进行训练
,
然后用另外
100
家编码过的公司进行学习效果检验
,
完成训
练后利用完成学习的算法对剩余公司数据进行统
一的分类编码
。
企业社会责任重视度
(
变量代码
csr
_
con
):
企
业社会责任报告是利益相关者理论相关诉求的核
心产物
,
这里面牵扯的内容与公司未来的战略和
运营通常并不直接相关
,
其主要作用是检验公司
是否关注其利益相关者
。
基于中国
100
强企业社
会责任发展状况的研究提出了四位一体的企业社
会责任理论构
,
即责任管理
、
环境责任
、
市场责任
、
社会责任这四大方面
。
本文依照该理论框架进行
企业社会责任报告的编码
。
本文把该理论的四个
方面量化为
4
个关键词进行匹配
,
即
:
责任管理的
关键词使用
“
员工
冶,
环境责任的关键词使用
“
环
境
冶,
市场责任关键词使用
“
客户
冶
和
“
供应商
冶,
社
会责任关键词使用
“
公益
冶,
结合企业社会责任制
度的两个核心关键字
“
制度
冶
和
“
理念
冶
共
7
个关
键字进行筛选
,
处理方法同上述管理层讨论文本
类似
,
该部分内容的处理过程的不同在于在完成
分词并去除稀疏词汇的字符向量生成后
,
利用这
四个关键词进行匹配
,
如果匹配
4
个以上则视为
该公司关注利益相关者
,
并将其编码为
1,
反之如
果匹配
2
个以下
,
或者甚至没有披露企业社会责
任报告
,
则视为其对利益相关者关注不足
,
并将其
编码为
0。
公司正式控制力
(
变量代码
ctrl
_
cap
):
公司的
正式控制系统与
Simons
管理控制系统
4
个杠杆
维度理论里的边界控制比较类似
,
是指用正式的
流程
、
制度和方式方法来确保合规性以及什么不
能做
。
正式控制制度是不可或缺的
,
它能将公司
国外的成功经验模式化形成积累
,
也有助于防范
公司的运营风险
。
而大型企业集团的正式控制往
往是通过特定的组织构架和信息系统作为载体实
施的
。
企业的财务公司能实现对企业最重要的现
金资源进行统一综合管理
,
一方面降低了企业子
公司的违规操作风险
,
另一方面系统地量化了每
一个子公司的资金使用效率和资金成本
(
袁琳
,
2003)
[15]
,
有助于综合的分析和评价每个业务的
前景和生命周期
,
从而作出更加科学的管理决策
。
而无论预算管理采取哪种模式
,
都是为了改进企
业的管理和运行方式
,
进而提升企业的竞争能力
(
王斌
、
高晨
, 2003)
[16]
。
管理信息系统使得企业
内部的信息传递的准确性更加精确
,
时效性都更
加迅速
,
同时也为起到了让管理人员快速决策支
持的功用
(
杨周南
, 2004)
[17]
。
综合这些原因
,
本
文选取是否设有财务公司
、
是否有预算管理
、
是否
有管理信息系统
、
是否有
ERP
等生产管理信息系
统来构建综合的指标来反映企业的正式控制能
力
。
另外
,
本文对于企业所披露的内部控制报告
重点是阐述企业的内控流程
、
内控工作方法
、
取得
的成果和存在的问题
。
以
2007
年上海证券交易
所上市公司为样本的研究发现
,
自愿披露企业内
·9·
I...,IV,V,1,2,3,4,5,6,7,8
10,11,12,13,14,15,16,17,18,19,...127