2019年 第 21 期
总第 865 期
财会月刊(上)
财金纵横
大数据下基于改进K-means聚类算法的税收风险识别

作  者
夏 会(博士),程 平(博士生导师),张 砾

摘  要

目前的税收风险管控模型通常是基于税务人员的先验知识构建的,在海量数据环境下模型的实用性、可扩展性和精确性都有较大的局限。为解决这一问题,提出改进的K-means聚类算法。该方法是无监督学习模型,可以在无先验知识的前提下构建指标,快速且精确地对实例进行聚类,将出现明显异常的小类识别为异常,判定其存在税收风险。基于该模型对房地产类企业股权转让中的税收风险进行分析和评估,发现税收风险等级高的企业及其风险疑点,验证了本方法的有效性。

【关键词】税收风险;K-means聚类算法;大数据;股权转让

【中图分类号】F812.42

【文章编号】1004-0994(2019)21-0143-4