- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
基于大数据的供应商信用评估方法
?
?
许浩宇
摘要:在现今的企业生产经营中,为了更好的降低自身的生产采购成本,就需要建立起合理、规范的供应商管理制度,所以对供应商开展信用评估起到了一定的意义。本文基于大数据环境背景下,建立起供应商信用评估使用方法,先确定出信用评估相关指标,并论述指标构建使用的方法,再使用及机器学习算法建立起信用评价模式,最后根据对供应商评价的结果给出相应的处理措施。
关键词:大数据;供应商;信用评估方法
对于企业自身的发展来讲,与供应商之间建立起长期、稳定的关系,对于企业生产产品的质量、成本等多方面起到影响。为了有效的解决该问题的存在,需要根据企业自身的实际情况制定出合理的供应商管理制度,现今供应商质量存在着良莠不齐的现象,需要企业定期的对供应商开展评价与考核,以此确保供应商的等级,并根据供应商的等级具有针对性的筛选,以此提升产品供货质量。
一、评估指标的选取
在现今物联网与大数据发展的环境下,对于企业的信用评估需要考虑所有的综合因素,并结合使用现今往网下认证与网上评估,才能构建起企业信用评估体系。
我们可以将企业信用评估体系划分为静态体系与动态体系,静态指标主要指的是企业的实体信息,其中包含了注册信息、注册年限以及信用等级等多个方面。
动态指标通常情况下是用在实际交易或者是线下交易过程中,从卖方的角度来看,动态指标主要集中在以下方面,产品情况中指的是产品质量、支付价格等,支付方便度、运输质量、沟通态度以及交易次数等。
二、指标构建方法
本文的论述中主要基于数据考虑的基础之上,使用线性与非线性等方法,最终给出了相关的指标构建方法。
首先,数据获取,在现今互聯网大数据的时代发展背景下,能够用来使用的数据量是非常多的,并且可以在网络上自由的获取信息,通过使用网络爬虫程序,可以更好、更轻松的获取到获取到目标程序。但是网络上获取到的数据呈现出明显的多样化、非结构性特征,且获取到的数据有着噪声大、缺失值多等诶单,这也就导致对数据开展的处理工作变得非常复杂。为了能够解决实际存在的问题,就要基于广度优先遍历的策略基础之上,促进工作的程序结构化与模块化的实现。在已有明确的评估指标情况之下,可以保障多所有数据获取过程的自动化,尽可能的减少工作开展中出现的人工干预情况,以此来保障所有数据的一致性。
如上述步骤中所提到的,可以将爬虫算法划分为如下的几个阶段:
对供应商的选择——根据算法的使用可以将供应商的主页网址与相关信息的网页作为程序的入口,并且进行入栈;
对核心网页的解析——通过解析算法的使用可以爬取到相应的网页,以此保障所获取到的网页链接信息的有效性,并且对其中抽取的网页信息数据进行验证;
对数据的清洗——在数据使用过程中,针对于缺失的数据值进行填充时,需要删除掉一些不必要的数据,以此保障对数据化结构的调整;
数据集成——主要从结构化的数据中获取并计算出相应的评估指标方法;
数据存储——将相应的指标数据有效的存储到相应的数据库中。
其次,数据标准化处理。在创建出具体的指标数据之前,需要对一些原始的数据标准化展开处理,以此保障相关数据之间的构成可以形成同趋化。本文主要使用的是z-score标准化方法实现了对数据的处理,主要使用的公式如下:
在本公式中n代表的是样本个数,x1则表示的是样本属性取值,x指的是样本中的属性均值,xstd则表示的是样本属性的标准差。
三、信用评价模型
对于信用的评估通常情况下采用的是评分卡的方式,但是在该方式的使用过程中有着非常多的人工影响因素,对于结果的判定往往需要结合专家的经验。随着近些年我国机器学习技术的不断发展,促使机器建模方法的应用,强化了评估方法的开展。在对该方法使用的过程中,所有的评价结果都是依赖数据资料,不会受到分析人员的影响。综上所述,在本文中使用的是Boosting算法实现对用户信用等级分类的计算。
(1)Xgboost算法
对于及其学习方法来讲,Boosting算法的使用,实现了弱分类转化为强分类的方法,可以有效的达到分类的目的。Boosting算法在使用过程中最具代表性的就是GBDT,但是使用Xgboost算法,实现了对GBDT算法的改进以及提升,最大效率的提升在环境发展下算法的执行效率,可以将其描述为
在本公式中i=1,2……n表示的都是特征数据;其中F表示的是弱分类器的集合,可以使用fK进行表示。
(2)评价标准
在现今大数据发展背景之下,针对于企业信用评价体系的特征,可以使用Xgboost模型,实现对每个企业用户征信等级的分析,同时建立起有效的信用评估等级,并且使用优、良、中、差进行分析表示。
四、供应商评价结果与相关措施
优所代表的是优秀的供货商,也就是企业在长期发展中可以优先考虑的供货商,将其列为长期供货商;良与中级可以将其视为正常的供应商,根据供应
文档评论(0)