2009年 第 08 期
总第 504 期
财会月刊(中)
审计与CPA
基于审计数据质量控制的数据挖掘应用

作  者
陈爱林 黄淑燕

作者单位
九江学院 江西九江 332005

摘  要

      【摘要】逻辑结构与信息本身相分离的特性,使得电子审计数据在真实性、完整性、一致性和有效性等方面难以满足审计工作对数据质量的要求。而利用分类、聚类、关联规则等数据挖掘技术可以控制和提升审计数据质量,提高电子审计效率。
  【关键词】数据质量控制   数据挖掘   关联规则   聚类

      一、应用数据挖掘技术可以提升审计数据质量
  数据挖掘,也称为数据库中的知识发现,它可以从大量冗余的、不完全的、模糊的和随机的数据中提取尽可能多的、事先不为人知的但又是潜在有用的隐藏信息和知识。数据挖掘是一种特定的数据分析过程,它通过对数据进行统计、分析、综合和推理,以发现更多的知识和信息,既可以对已有的事实进行评估,又可以对未来的活动进行预测,从而为做出正确的判断提供基础。
  数据质量具体表现在数据的真实性、完整性、一致性和有效性等几个方面。电子审计数据是以电子形式存在的可为审计使用的知识和信息。这种以电子形式存在的数据,由于逻辑结构与信息本身相分离,使得其在许多方面都有别于传统的审计数据,如数据来源更加难以确定、信息的变化更加难以把握等。从数据质量方面来考量,电子审计数据的无形性和易篡改性的确给审计工作带来了一些特定的风险。运用一定的技术来控制和提升审计数据质量变得异常迫切,数据挖掘技术的应用恰好可以满足这一要求。