数据挖掘在江苏省中小企业融资途径选择中的应用
若水分享
1147
摘要:本文以江苏省中小企业为研究对象,调查其成功融资的融资途径,样本涉及江苏省的南京、常州、南通、连云港、盐城、淮安等多个城市的中小企业。在对大量调查数据进行分析处理的基础上,运用数据挖掘中的Apriori算法,找出不同融资途径间的关联规则,从而为政府部门以及中小企业的相关决策提供支持。
关键词:企业融资 关联分析 Apriori算法
1 背景介绍
在我国,中小企业是国民经济最活跃的主体,被称为中国经济的生力军。在江苏省,中小企业的重要性则更为突出。江苏省中小企业在拉动GDP,推动社会经济发展,促进就业等繁忙都作出了巨大的贡献。然而,中小企业在发展过程中却面临着各种困难,在面临人民币升值,金融危机等一系列问题下的中小企业生存更是艰辛。其中首要的瓶颈便是融资问题。在我国,按照现有的有关贷款通则以及相关规定,对中小企业的贷款问题限制的比较严格。本文选取了37个成功融资的中小企业,采用数据挖掘中的Apriori算法,对这些中小企业融资途径进行关联分析,找到合适的融资途径组合。
2 关联规则及Apriori算法
2.1 关联规则
关联规则挖掘用于寻找给定数据集中数据项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系,根据所挖掘的关联关系,可以从一个数据对象的信息来推断另一个数据对象的信息。关联规则的挖掘通过规则的支持度和置信度进行度量,这两种度量反映了所发现规则的有用性和确定性。
定义1:设D是事务集,A,B为项集,且有规则A=>B。如果D中,包含A·B事务所占比例为s%,称A=>B有支持度s。
定义2:设D是事务集,A,B为项集,且有规则A=>B。如果D中,c%的事务包含A的同时也包含B,则称A=>B有置信度c。
定义3:设D是事务集,A,B为项集,若A=>B满足置信度c和支持度s,则称A=>B为关联规则。
定义4:对关联规则A=>B,若同时满足最小支持度阀值和最小置信度阀值,则称其为强规则。
关联规则挖掘的过程分为两个步骤。第一步,发现所有的大项目集,即支持度大于给定最小支持度阀值的项集;第二步,从大的项集中产生关联规则。
2.2 Apriori算法
对于Ck中的任一项集c,若c得任一k-1子集在Lk-1中不存在,则将c从Ck中删除。算法的下一步是对数据库进行检索,得到Ck中的项集的支持度,与最小支持度进行比较,从而得到Lk。它由Ck中的一部分项集组成,条件是它们的支持度不小于最小支持度。
3 Apriori算法在中小企业融资途径选择中的应用
由于证券市场门槛高,创业投资体制不健全,公司债发行的准入障碍,中小企业难以通过资本市场公开筹集资金,因此造成了中小企业融资渠道过于狭窄的现状。一般说来,中小企业融资有以下几种方式:①银行贷款;②信用社贷款;③担保机构贷款:④内部职工集资;⑤民间借款;⑥拖欠贷款;⑦亲朋借款;⑧租赁
本文以江苏省中小企业为研究对象开展调查,样本涉及江苏省的南京、常州、南通、连云港、盐城、淮安等多个城市的中小企业。在对大量调查数据进行分析处理后,选择37个成功融资的中小企业作为原始事务集,并将融资渠道分为8种,作为8种项集
首先扫描数据库,识别所有单个项(1-项集)和它们的支持度,建立候选1-项集C1
假定最小支持度(min_sup)s=10%(至少在3个事务中),选择1-项集的支持度大于或等于(min_sup)s的项,建立频繁1-项集,并记作L1
假定最小支持度为至少在2个事务中,选择2-项集的支持度大于或等于(min_sup)s的项,建立频繁2-项集,并记作L2
重复以上过程,建立候选3-项集C3和频繁3-项集L3
这时,由于C4为空集,停止Apriori算法。频繁项集为L=L1∪L2∪L3。
若企业融资的途径多于一种,则通过以上频繁项集可以推导出强规则,即最佳融资途径组合。
考虑频繁3-项集{1,2,3},由于这三种途径频繁地一起使用,我们可以从这个3-项集推导出一些规则。
首先,得到非空真子集:{1},{2},{3},{1,2},{1,3},{2,3}。
然后,对于每个子集,形成如下规则,并计算置信度:
R1∶{1}→{2,3}, 2/26=1/13
R2∶{2}→{1,3}, 2/11
R3∶{3}→{1,2}, 2/4=1/2
R4∶{1,2}→{3}, 2/7
R5∶{1,3}→{2}, 2/3
R6∶{2,3}→{1}, 2/3
令min_conf为50%,选取R3、R5、R6为强规则。
用相同的方法计算频繁2-项集,还可以得到以下四个强规则:
4 挖掘结果分析
从Apriori算法计算后得到的挖掘结果显示以下规则:
规则一:江苏省中小企业在融资时若只选择一种融资方式,则向银行贷款或者向信用社贷款是最有可能成功的融资途径。
规则二:如果中小企业选择两种融资途径,则有七种融资组合具有较高的成功率,即{银行贷款,信用社贷款},{银行贷款,担保机构贷款},{银行贷款,内部职工集资},{银行贷款,拖欠贷款},{银行贷款,亲朋借款},{信用社贷款,担保机构贷款},{民间借款,亲朋借款}。
规则三:如果中小企业选择两种以上的融资途径来保证借贷的成功率,则只有一种融资组合具有较高的成功率,即{银行贷款,信用社贷款,担保机构贷款}。
规则四:如果中小企业希望通过信用社贷款,则同时再向银行借款,成功的可能性比仅仅选择信用社贷款更大。如果希望通过担保机构借到资金,则同时再向银行或信用社进行借贷,这样的成功几率更高。
规则五:对于成功借贷的中小企业来说,民间借款和向亲朋借款通常是同时进行的。即如果企业已经选择了民间借款这种途径,则再向亲朋借款的可能性非常大。同样的,如果企业选择了向亲朋借款,则很有可能会寻找其他的民间借款途径。
规则六:企业如果希望仅仅通过担保机构贷款,而不选择其他的途径,这样的风险是相当大的。如果同时再向银行以及信用社进行借款,将会大大降低风险,提高借贷的成功率。
通过对关联规则的分析,可以清楚地看到,如果中小企业希望成功地从社会融资,融资途径的选择非常重要。通过对八种不同的融资途径的分析,发现像银行贷款成功的可能性最高。但是,由于贷款交易和监控成本高等原因,银行不愿对中小企业放贷。同时,中小企业因资信等级低,缺乏抵押资产,融资成本高等原因,难以得到银行资金支持。因此,中小企业必须考虑两种及两种以上的融资途径。从Apriori算法计算后得到的挖掘结果显示,{银行贷款,信用社贷款},{银行贷款,担保机构贷款},{银行贷款,内部职工集资},{银行贷款,拖欠贷款},{银行贷款,亲朋借款},{信用社贷款,担保机构贷款},{民间借款,亲朋借款}以及{银行贷款,信用社贷款,担保机构贷款}是常见的融资途径组合。其中,{信用社贷款,担保机构贷款},{银行贷款,信用社贷款}成功的可能性最高。并且,仅仅通过担保机构贷款得成功率很低,但如果与向银行和信用社贷款相结合,将会大大提高成功率。
由于中小企业的融资渠道过于集中于商业银行,获得资金来源的渠道过于单一,所以通过本文数据挖掘的结论,一些中小企业可以改变原有的融资方式,寻找其他的途径。
在中小企业融资途径中应用数据挖掘具有决策指导意义,它可以分析企业的融资趋势,挖掘潜在途径,提高企业融资的成功率。
参考文献:
[1]焦李成,刘芳等.智能数据挖掘与知识发现.西安电子科技大学出版社,2006:431~433.
[2]K.P.Soman Diwakar V.Ajay. 数据挖掘基础教程.北京:机械工业出版社,2009:120~127.
[3]朱德利1SQL Server 2005 数据挖掘与商业智能完全解决方案[M].北京:电子工业出版社,2007:367~3681.
关键词:企业融资 关联分析 Apriori算法
1 背景介绍
在我国,中小企业是国民经济最活跃的主体,被称为中国经济的生力军。在江苏省,中小企业的重要性则更为突出。江苏省中小企业在拉动GDP,推动社会经济发展,促进就业等繁忙都作出了巨大的贡献。然而,中小企业在发展过程中却面临着各种困难,在面临人民币升值,金融危机等一系列问题下的中小企业生存更是艰辛。其中首要的瓶颈便是融资问题。在我国,按照现有的有关贷款通则以及相关规定,对中小企业的贷款问题限制的比较严格。本文选取了37个成功融资的中小企业,采用数据挖掘中的Apriori算法,对这些中小企业融资途径进行关联分析,找到合适的融资途径组合。
2 关联规则及Apriori算法
2.1 关联规则
关联规则挖掘用于寻找给定数据集中数据项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系,根据所挖掘的关联关系,可以从一个数据对象的信息来推断另一个数据对象的信息。关联规则的挖掘通过规则的支持度和置信度进行度量,这两种度量反映了所发现规则的有用性和确定性。
定义1:设D是事务集,A,B为项集,且有规则A=>B。如果D中,包含A·B事务所占比例为s%,称A=>B有支持度s。
定义2:设D是事务集,A,B为项集,且有规则A=>B。如果D中,c%的事务包含A的同时也包含B,则称A=>B有置信度c。
定义3:设D是事务集,A,B为项集,若A=>B满足置信度c和支持度s,则称A=>B为关联规则。
定义4:对关联规则A=>B,若同时满足最小支持度阀值和最小置信度阀值,则称其为强规则。
关联规则挖掘的过程分为两个步骤。第一步,发现所有的大项目集,即支持度大于给定最小支持度阀值的项集;第二步,从大的项集中产生关联规则。
2.2 Apriori算法
对于Ck中的任一项集c,若c得任一k-1子集在Lk-1中不存在,则将c从Ck中删除。算法的下一步是对数据库进行检索,得到Ck中的项集的支持度,与最小支持度进行比较,从而得到Lk。它由Ck中的一部分项集组成,条件是它们的支持度不小于最小支持度。
3 Apriori算法在中小企业融资途径选择中的应用
由于证券市场门槛高,创业投资体制不健全,公司债发行的准入障碍,中小企业难以通过资本市场公开筹集资金,因此造成了中小企业融资渠道过于狭窄的现状。一般说来,中小企业融资有以下几种方式:①银行贷款;②信用社贷款;③担保机构贷款:④内部职工集资;⑤民间借款;⑥拖欠贷款;⑦亲朋借款;⑧租赁
本文以江苏省中小企业为研究对象开展调查,样本涉及江苏省的南京、常州、南通、连云港、盐城、淮安等多个城市的中小企业。在对大量调查数据进行分析处理后,选择37个成功融资的中小企业作为原始事务集,并将融资渠道分为8种,作为8种项集
首先扫描数据库,识别所有单个项(1-项集)和它们的支持度,建立候选1-项集C1
假定最小支持度(min_sup)s=10%(至少在3个事务中),选择1-项集的支持度大于或等于(min_sup)s的项,建立频繁1-项集,并记作L1
假定最小支持度为至少在2个事务中,选择2-项集的支持度大于或等于(min_sup)s的项,建立频繁2-项集,并记作L2
重复以上过程,建立候选3-项集C3和频繁3-项集L3
这时,由于C4为空集,停止Apriori算法。频繁项集为L=L1∪L2∪L3。
若企业融资的途径多于一种,则通过以上频繁项集可以推导出强规则,即最佳融资途径组合。
考虑频繁3-项集{1,2,3},由于这三种途径频繁地一起使用,我们可以从这个3-项集推导出一些规则。
首先,得到非空真子集:{1},{2},{3},{1,2},{1,3},{2,3}。
然后,对于每个子集,形成如下规则,并计算置信度:
R1∶{1}→{2,3}, 2/26=1/13
R2∶{2}→{1,3}, 2/11
R3∶{3}→{1,2}, 2/4=1/2
R4∶{1,2}→{3}, 2/7
R5∶{1,3}→{2}, 2/3
R6∶{2,3}→{1}, 2/3
令min_conf为50%,选取R3、R5、R6为强规则。
用相同的方法计算频繁2-项集,还可以得到以下四个强规则:
4 挖掘结果分析
从Apriori算法计算后得到的挖掘结果显示以下规则:
规则一:江苏省中小企业在融资时若只选择一种融资方式,则向银行贷款或者向信用社贷款是最有可能成功的融资途径。
规则二:如果中小企业选择两种融资途径,则有七种融资组合具有较高的成功率,即{银行贷款,信用社贷款},{银行贷款,担保机构贷款},{银行贷款,内部职工集资},{银行贷款,拖欠贷款},{银行贷款,亲朋借款},{信用社贷款,担保机构贷款},{民间借款,亲朋借款}。
规则三:如果中小企业选择两种以上的融资途径来保证借贷的成功率,则只有一种融资组合具有较高的成功率,即{银行贷款,信用社贷款,担保机构贷款}。
规则四:如果中小企业希望通过信用社贷款,则同时再向银行借款,成功的可能性比仅仅选择信用社贷款更大。如果希望通过担保机构借到资金,则同时再向银行或信用社进行借贷,这样的成功几率更高。
规则五:对于成功借贷的中小企业来说,民间借款和向亲朋借款通常是同时进行的。即如果企业已经选择了民间借款这种途径,则再向亲朋借款的可能性非常大。同样的,如果企业选择了向亲朋借款,则很有可能会寻找其他的民间借款途径。
规则六:企业如果希望仅仅通过担保机构贷款,而不选择其他的途径,这样的风险是相当大的。如果同时再向银行以及信用社进行借款,将会大大降低风险,提高借贷的成功率。
通过对关联规则的分析,可以清楚地看到,如果中小企业希望成功地从社会融资,融资途径的选择非常重要。通过对八种不同的融资途径的分析,发现像银行贷款成功的可能性最高。但是,由于贷款交易和监控成本高等原因,银行不愿对中小企业放贷。同时,中小企业因资信等级低,缺乏抵押资产,融资成本高等原因,难以得到银行资金支持。因此,中小企业必须考虑两种及两种以上的融资途径。从Apriori算法计算后得到的挖掘结果显示,{银行贷款,信用社贷款},{银行贷款,担保机构贷款},{银行贷款,内部职工集资},{银行贷款,拖欠贷款},{银行贷款,亲朋借款},{信用社贷款,担保机构贷款},{民间借款,亲朋借款}以及{银行贷款,信用社贷款,担保机构贷款}是常见的融资途径组合。其中,{信用社贷款,担保机构贷款},{银行贷款,信用社贷款}成功的可能性最高。并且,仅仅通过担保机构贷款得成功率很低,但如果与向银行和信用社贷款相结合,将会大大提高成功率。
由于中小企业的融资渠道过于集中于商业银行,获得资金来源的渠道过于单一,所以通过本文数据挖掘的结论,一些中小企业可以改变原有的融资方式,寻找其他的途径。
在中小企业融资途径中应用数据挖掘具有决策指导意义,它可以分析企业的融资趋势,挖掘潜在途径,提高企业融资的成功率。
参考文献:
[1]焦李成,刘芳等.智能数据挖掘与知识发现.西安电子科技大学出版社,2006:431~433.
[2]K.P.Soman Diwakar V.Ajay. 数据挖掘基础教程.北京:机械工业出版社,2009:120~127.
[3]朱德利1SQL Server 2005 数据挖掘与商业智能完全解决方案[M].北京:电子工业出版社,2007:367~3681.