首页 期刊简介 最新目录 过往期刊 在线投稿 欢迎订阅 访客留言 联系我们
新版网站改版了,欢迎提出建议。
访客留言
邮箱:
留言:
  
联系我们

合作经济与科技杂志社

地址:石家庄市建设南大街21号

邮编:050011

电话:0311-86049879
友情链接
·中国知网 ·万方数据
·北京超星 ·重庆维普
经济/产业

信息类别

首页/本刊文章/第344期/财会/审计/正文

发布时间

2008/4/30

作者

□文/高 谦

浏览次数

1531 次

数据挖掘分类技术在财务管理中的应用
  一、数据挖掘及分类技术的含义
  数据挖掘是从大量的数据中挖掘出隐含的、未知的、用户可能感兴趣的和对决策有潜在价值的知识和规则。这些规则包含了数据库中一组对象之间的特定关系,揭示出一些有用的信息,可以为经营决策、市场策划和金融预测等方面提供依据。而数据分类是基于数据挖掘的一种有监督的分类学习方法,其目的是从一组已知类别的数据中发现分类模型,以预测新数据的未知类别。
  二、数据分类技术比较及数据挖掘的步骤
  (一)数据分类技术的主要方法。基于数据挖掘的分类技术的主要方法有决策树、神经网络、遗传算法、粗糙集、贝叶斯分类、K-近邻、支持向量机、回归分析以及多策略分类等。
  1、决策树。决策树分类法的优点是分类的准确率高,学习速度比较快,能够表示成容易理解的分类规则和能够使用数据库的SQL语句来实现;其缺点是很难基于多个变量的组合发现规则,不同决策树分支之间的分裂不平滑,而且当类别较多时,分类的准确度明显下降。
  2、神经网络。神经网络分类法的优点在于其分类精度高,能发现非线性的模式,不需预先对试验样本的统计分布做假设而且具有良好的鲁棒性、自组织自适应性、可并行处理、分布存储和高度容错性。其缺点首先是模型的构造是黑箱操作,网络的学习和决策过程难以理解;其次是结果难以表示成简单的分类规则;再次是样本数据要求是数值类型,分类型数据要做离散化处理,最后是结果与网络的拓扑结构和初始的权系数有关。
  3、遗传算法。遗传算法分类法的优点是其具有群体搜索、隐含的并行处理、通用性和鲁棒性及概率转移准则。而其缺点在于学习速度比较慢、结果与编码方式、遗传算子和运行参数密切相关和基因编码和目标函数的选择比较复杂。
  4、粗糙集。粗糙集分类法的优点是不需要预先知道额外信息算法简单和易于操作。其缺点是由于其基于集合论,难以直接处理连续的属性;还有当属性值的个数较多时,规则表示复杂;再就是其产生的规则需要合并处理。
  5、贝叶斯。贝叶斯分类法的优点是可以处理不完整和带有噪声的数据,解决数据间的不一致问题,而且其用图形方法描述数据间的相互关系,语义清晰,可理解性强,另外还具有不确定性的知识表达形式、丰富的概率表达能力、综合先验知识的增量学习特性等优点。其缺点是对于简单贝叶斯分类假设属性是相互独立的。
  6、K-近邻。K-近邻分类法的优点是简单、应用范围广,可以通过SQL语句实现,且模型不需要预先构造。其缺点是需要大量的训练数据,并且搜索邻居样本的计算量大,会占用大量的内存;还有就是距离函数的确定比较困难和分类的结果与参数有关。
  7、支持向量机。支持向量机分类法的优点是适合小样本的数据,可给出学习结果的推广能力的界,能有效地处理非线性分类和非线性回归,还有就是其计算量与样本向量的维数几乎无关;其缺点是当解决多类别的分类问题时比较困难,另外核函数的选择和参数的确定也比较复杂。
  8、回归分析。回归分析分类法的优点是其有数据理论为依据;其缺点是其需要确定模型参数,数据分布不一定符合预先的假设,另外不能处理离散性数据,模型也难以用简单的形式描述。
  9、多策略分类。多策略分类法优点是其包括两种以上的分类方法,而其大多具有图形界面,使用方便;其缺点是要由用户选择具体的分类方法,并需要进行多次测试。
  (二)数据挖掘的基本步骤。SEMMA方法是目前最受欢迎的一种数据挖掘方法,其描述的数据挖掘的大致过程包括取样、探索、修改、模型和评价。
  1、数据取样。在进行数据挖掘之前,首先要根据数据挖掘的目标选定相关的数据库。通过创建一个或多个数据表进行抽样。所抽取的样本数据量既要大到足以包含有实际意义的信息,同时又不至于大到无法处理。
  2、数据探索。数据探索就是对数据进行深入调查的过程,通过对数据进行深入探察以发现隐藏在数据中预期的或未被预期的关系和异常,从而获取对事物的理解和概念。
  3、数据调整。在上述两个步骤的基础上对数据进行增删、修改,使之更明确、有效。
  4、建模。使用人工神经网络、回归分析、决策树、时间序列分析等分析工具来建立模型,从数据中发现那些能够对预测结果进行可靠预测的模型。
  5、评价。就是对从数据挖掘过程中发现的信息的实用性和可靠性进行评估。
  三、数据挖掘及分类技术在财务管理中的应用
  (一)成本分析。管理者坚信对成本的精确计算和对资源的充分利用可以有效地改善企业的业绩,但其复杂的操作使得很多管理者望而却步。利用数据挖掘中的回归分析、分类分析等方法能帮助管理者确定成本动因,更加准确计算成本。同时,也可以通过分析成本与价值之间的关系,确定采用其最佳策略的成本,持续改进和优化企业价值链。
  (二)预测分析。管理者在很多情况下需要对未来进行预测,而预测是建立在大量的历史数据和适当的模型基础上的。数据挖掘自动在大型数据库中寻找预测性信息,利用趋势分析、时间序列分析等方法,建立对如销售、成本、资金等的预测模型,科学准确地预测企业各项指标,作为决策的依据。例如,对市场调查数据的分析可以帮助预测销售、根据历史资料建立销售预测模型等。
  (三)投资决策分析。投资决策分析本身就是一个非常复杂的过程,往往要借助一些工具和模型。数据挖掘技术提供了有效的工具。从公司的财务报告、宏观经济环境以及行业基本状况等大量的数据资料中挖掘出与决策相关的实质性的信息,保证投资决策的正确性和有效性。如,利用时间序列分析模型预测股票价格进行投资;用联机分析处理技术分析公司的信用等级,以预防投资风险等。
  (四)市场分析。选择适当的产品组合以实现最大利益是管理者体现代理人价值的过程,这些利益可以是短期利润,也可以是长期市场占有率,还可以是构建长期客户群及其综合体。为了达到这些目标,管理者不仅仅需要价格和成本数据,有时还需要知道替代品的情况,以及在某一市场段位上它们与原产品竞争的状况。另外,企业也需要了解一个产品是如何刺激另一些产品的销量的,等等。例如,非盈利性产品本身是没有利润可言的,但如果它带来了可观的客户流量,并刺激了高利润产品的销售,那么这种产品就非常有利可图,就应该包括在产品清单中。这些信息可通过关联分析等技术来得到。
  (五)财务风险分析。管理者可以利用数据挖掘工具来评价企业的财务风险,建立企业财务危机预警模型,进行破产预测。破产预测或称财务危机预警模型能够帮助管理者及时了解企业的财务风险,提前采取风险防范措施,避免破产。另外,破产预测模型还能帮助分析破产原因,对企业管理者意义重大。在20世纪三十年代,Smith和Winakor率先进行了破产预测的尝试。随后到了20世纪六十年代,Altman利用多维判别式分析方法提出的Z-score破产预测模型取得了很大的成功,预测准确率高达90%以上。此后,数据挖掘技术包括多维判别式分析、逻辑回归分析、遗传算法、神经网络以及决策树等方法在企业破产预测中得到了广泛应用。
  四、数据挖掘及分类技术在财务管理中应用的意义
  数据挖掘技术在财务管理中的最主要作用是预防和控制财务风险。管理者可利用数据挖掘技术建立企业财务风险预警模型,因为企业财务风险的发生并非一蹴而就,而是一个积累的、渐进的过程,通过建立财务风险预警模型,可以随时监控企业财务状况,防范财务危机的发生。另外,也可以利用数据挖掘技术,对企业筹资和投资过程中的行为进行监控,防止恶意的商业欺诈行为,维护企业利益。尤其是在金融企业,通过数据挖掘,可以解决银行业面临的如信用卡的恶意透支及可疑的信用卡交易等欺诈行为,等等。现在在欧美国家中,大多数大中型银行已经普遍采用了数据挖掘技术。■
 
版权所有:合作经济与科技杂志社 备案号:冀ICP备12020543号
您是本站第 32372169 位访客