数据挖掘技术在税务稽查中的应用探究

2021-11-26 14:45朱苑婷
魅力中国 2021年26期
关键词:稽查数据挖掘税务

朱苑婷

(广州建筑工程监理有限公司,广东 广州 510000)

近年来,数据挖掘技术的发展速度日渐加快,同时,其应用领域也越来越广泛。为了推动税务稽查信息化和智能化进程,我国税务机关在税务稽查中也运用了数据挖掘技术,这对税务工作者更好地制定稽查计划有着重要帮助,同时,也在一定程度上提升了税务稽查案件的针对性。在传统的税务稽查工作中,税务稽查系统作用有限,无法对税务稽查数据信息进行充分、有效地利用。而应用数据挖掘技术可以从多个方面和维度地综合分析纳税户数据信息,以此筛选稽查对象,经过评估得出相对应的税务稽查处理方式。因此,研究数据挖掘技术在税务稽查的应用,对提升税务稽查工作质量及效率也将带来一定助力。

一、数据挖掘技术的行业准则及技术方法

(一)数据挖掘技术的行业准则

数据挖掘技术最初被应用于商业领域,随后逐步在通讯、医疗服务等领域得到逐步应用,但从行业准则来看,不同领域应用数据挖掘技术的行业准则并不相同,尚未形成统一化的标准。一些专家学者尝试对数据挖掘技术的行业准则进行了深入探索,逐步研究出适用范围较大的数据挖掘技术行业准则。该准则不仅在商业领域可以应用,还适用于国家税务机关,现在已经形成了统一的行业准则。

数据挖掘的行业准则包含六个阶段:第一阶段,业务理解,是指准确定位组织的目的;第二阶段,数据选择,按照最开始的数据对其重要性作出初步的判定,选择有概率富含有价值信息的数据集;第三阶段,数据准备,将最初的数据转变成可利用的模式;第四阶段,数据挖掘,以探索为主要形式,符合实际情况的一种及多种数据的算法;第五阶段,评估,指的是评估各种算法模型后,辨别出适合的模型种类和数据算法;第六阶段,实施,通过模型输出结果,运用可视化技术,制定决策供决策者作为数据参考。

(二)数据挖掘的技术方法

数据挖掘包含多种技术方法,这里以聚类分析和Web 挖掘技术为例,对数据挖掘技术方法进行探讨。

1.聚类分析。

聚类分析方法主要是根据差异性来处理数据信息的,在分类分析的过程中,其建立的模型需要有已知的元素,而聚类分析则是对未知的数据信息加以分类,可以达到自动分类数据的效果。聚类分析方式包含了机器学习方法、神经网络方法还有统计方法。在统计方法方面,聚类分析是以几何距离为基础的,是较为全面的聚类分析。但是需要给定全面完备的数据,无法增加其他的动态信息。在机器学习方面,不再是以几何距离为基础,而是以研究对象的距离来衡量,性质是概念描述。

2.Web 挖掘技术。

Web 挖掘技术可以从Web 数据信息库中查找知识和所需要的数据。在完善有针对性系统服务的过程中,一般来说人们会利用Web 内容挖掘分析网页内容。Web 挖掘技术可以分为:一是以代理为基础的方法,二是数据库方法。Web 挖掘技术可以对研究对象采取直接处理的方式,所以效果更为准确可靠。

二、数据挖掘技术在税务稽查中的应用路径

税务稽查工作在开展过程中涉及多个流程,数据挖掘技术应用于税务稽查中时,需要与税务稽查工作流程充分融合,这里从选案、实施、审理三个环节进行分析,探讨数据挖掘技术在其中的具体应用。

(一)选案环节

1.建立选案指标。

税务稽查选案需要选择和确定评价指标,在此过程中,可以利用结构模型来缕清众多税务稽查纳税户数据之间的关系,结构模型可以表示数据信息之间的关联,从而分析出选案指标的合理性。要想深入了解税务稽查纳税户数据间的相关性,还可以采用演算矩阵的形式。结构模型和演算矩阵都属于几何模型,除此之外,在税务稽查选案中还可以运用到粗糙集理论。粗糙集理论的核心就是将数据简化,利用粗糙集理论这种方式,可以简化纳税户的信息,让选案系统更加清晰明了。

2.细分纳税群体。

与传统的税务稽查系统相比,数据挖掘技术的应用,对提升税务稽查系统处理数据能力较为有益。其具备以下优势,例如,可以快速查阅账本、信息化高效处理数据、准确筛查涉税遗漏点,还可以以不同类型和不同领域的分析模型去归纳总结纳税户的涉税疑点。数据挖掘技术可以将对于有疑点纳税户的处理意见进行整理,然后推送给税务稽查部门,精简了工作步骤。通常而言,细分辖区内纳税户的方式有两种:对纳税户进行分类或者聚类。

分类的方式,指的是人为提前按照纳税户的指标制定分类标准,然后再归类整合。如今,纳税人的分类有两种:存在疑问的和不存在疑问的。这时候有很多数据挖掘算法可以被运用,比如决策树归纳法、神经网络模型等。有学者在研究数据挖掘技术在税务稽查中的应用时,根据神经网络模型,将纳税户归为两种类别:分别是诚信纳税户和非诚信纳税户。采用了十九个财务属性,建立了三层的结构体系。因为对于解决非线性问题而言,神经网络模型具有突出的优点,与统计分析的方法相比,它的判定效果要好很多。(然后再过渡到本篇文章如何应用数据挖掘技术细分纳税群体)

分类的方式是将已知的数据按照分类标准进行归类整合,聚类有别于分类,聚类需要划分的研究对象是不确定的。聚类纯粹是按照数据的变化来取一个相似值。应用聚类分析时,纳税户群组之间的差异要小,这样就能观察到每个组别的相关特征,进而分析出纳税户的纳税状况。聚类的方式是指系统辨别纳税户的指标,让组内的纳税户产生相似性,组间纳税户产生不同性,自然生成聚类判别准则,根据这个标准归类各个纳税户。将各行业及各税种进行整合,再进行聚类分析,能够分别归纳整理具有不同疑点的纳税户信息,明确每种类别的基本特点和情况,在制定稽查计划时就有了相对应的决策理论基础,加强稽查工作的准确性。

离纳税户组群远的数据可以看作是孤立点,聚类分析时需要着重注意孤立点,挖掘孤立点有时会带来意想不到的效果。聚类分析可以放大孤立点的影响,而孤立点和纳税户的异常税务行为可能存在一定的联系。即使是相同的数据,在聚类分析时也能采用不同的算法,从而得出纳税户数据信息的潜在联系和规律。

3.分析异常纳税户。

针对税务稽查积累的海量历史数据,可利用数据挖掘技术对其进行筛选。在利用数据挖掘技术剔除完不相关的数据之后,还需要发现和分析异常数据,然后进行相关的评估和审核工作,这时我们就需要应用到离群点。离群点是数据挖掘技术的核心问题之一,离群点不属于任何分组,如果一个数据被识别划分成离群点,那么该研究对象就可以被看作是异常。在税务稽查工作中也是如此,利用数据挖掘技术中的离群点可以快速甄别纳税户出现的异常信息。在聚类方法里,离群点就是那些无法归类、散落在外的研究数据信息,数据挖掘技术中的离群点里也许包含着关键信息。税务稽查部门在进行稽查选案时,需要首先从数据信息库中调取不同规模、不同行业、不同地区的纳税户信息,然后再将利用数据挖掘技术调取纳税额异常的纳税户信息,将这些纳税户作为重点稽查对象。

4.“画像”提取选案。

在大多数时候,税务稽查部门需要得到如“该企业是否被选定为稽查对象”等直接明了的选案准则,税务稽查部门可以用企业“画像”等辅助技术来加以筛选。以数据挖掘技术为基础,分析和应用税务的外部系统和内部系统,总结企业的经营活动、贡献价值、成长风险、诚信合规等多维度的成像,对企业的大致情况、经营模式、业务来往、纳税情况等方面加以查看和探索,这就是数据挖掘技术的企业“画像”,方便税务稽查部门在发现涉税异常或有风险时提取选案。

比如,在企业开发票这一成像的分析中,可以对开票这一动作进行监管并“画像”,那么就可以监管并识别企业虚开发票的行为。比如,税务稽查部门在调查企业的关系结构时,可能需要在多个系统进行相关查询,还要屡次更改查询要素,而且还容易将重要信息遗漏。但是利用数据挖掘技术为企业“画像”就可以避免这个困扰,在系统内可以以图谱的形式显示企业的往来关系,可以进一步深挖,将投资人、法人等关联信息挖掘出来,提高稽查选案工作的效率。

(二)实施环节

在实施环节,需要按照发现的问题的不同,来对纳税户进行针对性定性。在定性的过程中,根据违法违章类型的不同,处罚方式也有所不同。可以按照违法的税款金额大小和《税收征管法》来处罚纳税户。一般来说,税务稽查部门是按照自身的经验,或者根据对应的法律文件来对最终的处罚作出决策,这样一来比较麻烦,二来由于是经验占了主导地位,容易把税务人员的主观性带入进去,而造成客观的不足。而利用数据挖掘技术可以有效解决处罚问题,这种方法是:将《税收征管法》中的内容进行归纳整合,转换成规则库,将规则进行不断推理和匹配,最终总结出一个如何处罚的定性结果。

(三)审理环节

以案件为基础的推理是用访问案例库中相同类型案例的方式,进一步分析然后解决现阶段问题的一种稽查方式,对以前的案例结果重复利用,按照最终结果审核、修正处理决定,改变了以往从头开始推导的方式,这样可以有效提升税务稽查审理环节的工作效率。

以案件为基础的推理过程是:当发现一个新的疑点时,数据挖掘系统按照最显著的特点,然后在原始案例数据库里查找,直到找出与已知问题最接近的待选数据信息,再重复利用待选数据信息的解决方案。如果税务稽查人员不满意待选数据信息,可以修改待选数据信息,直到适应所检索的新案例数据信息,最后将改正后的案例数据变成新的案例数据收藏在数据库中,如果今后遇到相似的问题可以方便查找。基于案件的推理过程以以往的案例数据为知识源泉,在知识获取方面比较自然和直接,而且有一定的学习作用,本质是类似的案例互相推理比较,也符合人类现有的思维和逻辑。之前的案例都可以为今后的税务稽查工作提供范本,利用数据挖掘技术可以找到相似的案例数据,对于新案例有一定的借鉴作用。

三、结语

数据挖掘技术在税务稽查中的应用,可以实现更为深入的分析涉税数据及信息,为税务稽查带来有价值的、重要的知识或者信息,有助于提升税务稽查的信息化和智能化水平。与此同时,数据挖掘为税务稽查带来了新的思路和工作模式,在税务稽查的选案环节、实施环节和审理环节都有着广泛的用途,在今后也会在税务稽查中发挥更为重要的作用,为税务稽查工作注入新的活力。

猜你喜欢
稽查数据挖掘税务
改进支持向量机在特征数据挖掘中的智能应用
个人独资企业对外投资的税务与会计处理
企业内部控制与税务风险防范思考
论投资性房地产的会计核算及税务处理
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
深化税务稽查体制机制改革的若干思考
营销在线稽查精益化管理模式研究
优化税务稽查职能定位的思考
浅析云南省非税收入稽查机制