Benford定律审计分析方法及应用思考

2016-09-14 07:29王光伟邬华琼苏莉民重庆市长寿区人民医院重庆400重庆市垫江县中医院重庆40800重庆市人民医院重庆40000
中国管理信息化 2016年17期
关键词:分析方法定律收费

王光伟,邬华琼,苏莉民(.重庆市长寿区人民医院,重庆 400;.重庆市垫江县中医院,重庆 40800;.重庆市人民医院,重庆 40000)

Benford定律审计分析方法及应用思考

王光伟1,邬华琼2,苏莉民3
(1.重庆市长寿区人民医院,重庆 401220;2.重庆市垫江县中医院,重庆 408300;3.重庆市人民医院,重庆400020)

计算机辅助审计的数据分析技术主要是依据数据分析模型进行,本文重点对数值分析方法中的Benford定律,以SQL数据库技术和Excel函数运用介绍了计算机辅助审计的数据分析技术模型,并以某医院2015年业务收入数据首位数字分布情况及与Benford定律分布进行了对比分析,最后对Benford定律审计分析方法的运用进行分析讨论。

计算机辅助审计;数据分析;审计技术模型;方法运用

0 引言

计算机辅助审计的数据分析技术(CAATs)主要是依据数据分析模型进行,面向数据的计算机辅助审计技术有一种叫数值分析法,是根据被审计数据中某字段数据值的分布情况、出现频率等对该字段进行分析,从而发现审计线索的一种数据处理方法。常用的数值分析方法主要有重号分析、断号分析、Benford法则分析。

1 Benford定律原理

Benford定律是指一个没有人为规则限制生成的一组数据数列,数列的首位数字n之和遵循lg(1+1/n)的规律,数字1出现的频率为lg(1+1/1)的绝对数30.103%,数字2出现的频率为lg(1+1/2)的绝对数17.609%,等等。因此,根据班福(Benford)定律“人们处理较小数字开头的数值的频率较大”建立审计分析模型。如门诊收入、住院收入、记账凭证金额等利用SQL或

2 技术方法

根据审计人员掌握计算机辅助审计技能的不同情况,笔者采用SQL查询语句或Excel数据分析工具,摸索了计算机辅助审计常用的数值分析方法技术模型,增强审计准确性,提高了审计工作效率。

2.1SQL查询首位数字出现的频率

主要以substing函数生成收入数据的首位数字,按首位数字分组后,用聚合函数count求各数字之和,即可收入数据首位数字1-9每个数字出现的频率。

2.2Excel运用COUNTA()函数功能

在Excel环境下,left()取出收入数据首位数字,用条件求和函数COUNTIF()求各数字之和,最后求出首位数字1-9每个数字出现的频率。

3 实际验证

按照班福定律推测,医院收入数据符合班福定律的条件要求,因此其首位数字分布也应该符合这个规律。表1列出了某医院2015年门诊收费明细、住院收费明细和住院预交款明细数据首位数字的分布情况,三个数据系列总体上与班福定律相似,低数字出现频率高于高数字。门诊收费明细、住院收费明细和住院预交款明细数据首位数字分布与班福定律分布的相关系数分别为0.698、0.889、0.982,虽然住院预交款明细数据的相关系数高达0.982,但其首位数字分布与班福定律分布存在明显差距。

表1 门诊住院收费明细数据班福定律数字分析表

明细收费数据的首位数字分布与班福定律分布差异较大,因为明细费用数据受到较多的人为规则的限制,特别是住院预交款数据,那么,以病人为对象对明细收费数据汇总后的首位数字分布是否更好?

表2为按病人汇总的收费数据首位数字分布情况。第一行为未剔除挂号费的门诊病人汇总收费数据,第二行为剔除只有挂号费没有检查费药品费后的门诊病人汇总收费数据,第三行为出院病人住院费用数据,三个数据系列首位数字分布与班福定律分布非常近似,特别是剔除只有挂号费后的门诊病人费用汇总数据首位数字分布的相关系数达到0.999 1,几乎与班福定律分布折线图重合。出院病人费用首位数字分布与班福定律分布略有差异,折线图下降趋势比班福定律分布折线略为平缓。

表2 门诊住院收费数据按病人汇总班福定律数字分析表

4 讨论

班福定律被誉为第一数字定律,要求数据系列必须是描述同一主体的同一现象,并且没有人为规则的限制,不能设定最大值和最小值。

医院明细收费数据库中存在大量金额为负数的记录,即退费记录,使用明细收费数据进行首位数字分布分析时,应将负数记录与相应的正数记录抵销,才能得出正确的首位数字分布情况。

对该医院2015年住院收费明细进行审计分析时,发现11 月18日有一笔明细数据金额为9 152 580元,数量为61 017.2次,项目名称为骨折手法整复术,同时存在一笔负数冲抵记录。经详细调查发现,属于记费人员录入病人费用数量时,误录为收费编码“6102702”,虽然属于偶然操作误差,并及时给予了更正,但说明信息系统设计存在缺陷,没有进行总金额录入控制,已给HIS软件公司提出整改意见。

对班福定律审计分析法,以上述医院实际业务数据进行的测试说明,医院收入数据的首位数字分布总体上符合较小数字的大于较大数字的可能性大的规律,出现的差异可能是具体的业务规则影响了首位数字分布特点。对医院收入数据的首位数字分布与班福定律分布存在的差异要作客观具体的评价,有差异并不代表必然存在差错或舞弊,要全面分析准确理解。

主要参考文献

[1]陈伟,张金诚,QIU Ro-Bin.计算机辅助审计技术(CAATs)研究综述[J].计算机科学,2007(10):290-294.

[2]应里孟.数据式审计常用的数据分析方法[J].中国农业会计,2011 (9):14-15.

[3]狄为,施鹏仙.基于Benford定律的会计舞弊发现研究[J].会计之友,2010(9):73-75.

[4]王光伟,邬华琼,苏利民,等.计算机辅助审计常用的数据分析模型[J].中国管理信息化,2016(5):42-43.

10.3969/j.issn.1673-0194.2016.17.019

F239

A

1673-0194(2016)17-0046-03

2016-05-06

中国卫生经济学会2015中标课题(CHEA1516080702)。Excel查询数字出现的频率,其查询结果会发现,如果有人为的故意则破坏了这个定律,审计人员必须以此为线索作深入调查,以获取证据。

猜你喜欢
分析方法定律收费
基于EMD的MEMS陀螺仪随机漂移分析方法
行政法上之不利类推禁止*——以一起登记收费案为例
一种角接触球轴承静特性分析方法
中国设立PSSA的可行性及其分析方法
倒霉定律
论高速公路收费服务水平的提高和收费服务设施的完善
Python与Spark集群在收费数据分析中的应用
耐人寻味的定律
核安全设备疲劳分析方法与步骤
“微信收费”背后的创新之困