资源预览内容
第1页 / 共26页
第2页 / 共26页
第3页 / 共26页
第4页 / 共26页
第5页 / 共26页
第6页 / 共26页
第7页 / 共26页
第8页 / 共26页
第9页 / 共26页
第10页 / 共26页
第11页 / 共26页
第12页 / 共26页
第13页 / 共26页
第14页 / 共26页
第15页 / 共26页
第16页 / 共26页
第17页 / 共26页
第18页 / 共26页
第19页 / 共26页
第20页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
Click to edit,Master,title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,#,1/13/2020,Teradata Confidential,美商天睿信息系统(北京),有限公司,2013,年,3,月,熵,值法原理,及应用实践,美商天睿信息系统(北京)有限公司熵值法原理及应用实践,培训目标,理解熵值法的原理,1.,学会,使用熵值赋权,2.,领悟熵值应用实践,3.,培训目标理解熵值法的原理1.学会使用熵值赋权2.领悟熵值应用,熵值法原理及应用实践,2,熵值法如何计算权重?,3,怎样合理应用熵值法?,熵,值法,是做什么用的?,1,熵值法原理及应用实践2 熵值法如何计算权重?3 怎样合理应用,日常工作中常常需要计算指标权重,专家,打分,法,(,德尔菲法,),层次分析法,(,AHP,),主成份,分析,法,因子,分析,法,多元,回归赋权法,线性回归,逻辑回归,熵值法,请大家想一想,你知道的几种指标赋权方法?,日常工作中常常需要计算指标权重专家打分法(德尔菲法)主成份分,赋权算法分类,对于权重的,确定,目前,已提出各种不同的,方法,,可以,分为:,往往依靠专家,打分和定性分析,精确性不够,主观性太强,一般采用,数理统计,方法和技术,过于依赖数据,缺乏业务指导,很多方法不能,反映指标对目标的影响方向,主观赋权,客观赋权,二者结合,使用最有效,赋权算法分类对于权重的确定,目前已提出各种不同的方法,可以分,“熵”是一种客观的赋权方法,“熵”原本是物理中热力学概念,后来发展为信息论的熵值法理论,,在,指标赋权,方面,的应用比较,广泛,。,“熵”是不确定性,信息的,度量,(,就好比人的身高、,体重,,可以用来衡量人的体格,),:,信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。,熵大,越不确定,信息量小,影响小,权重,小,熵小,越确定,信息量大,影响大,权重,大,“熵”是一种客观的赋权方法“熵”原本是物理中热力学概念,后,指标赋权中熵值法的一般原理,根据,熵的特性,,我们可以,用熵值来判断某个指标的离散,程度,:,指标,熵值越小,,离散,程度越大,该指标对综合评价的影响(即权重)也就越大,。,指标赋权中熵值法的一般原理根据熵的特性,我们可以用熵值来判,熵值法原理及应用实践,2,熵值法如何计算权重?,3,怎样合理应用熵值法?,熵,值法,是做什么用的?,1,熵值法原理及应用实践2 熵值法如何计算权重?3 怎样合理应用,“熵”的一般计算公式,其中,:,,,n,为总样本数,,为指标值,一个规划求极值问题,“熵”的一般计算公式其中:,n为总样本数,为指标值 一个规划,“权”的一般计算公式,其中,:,为第,j,个指标,(,维度,),的熵,,m,为指标总数,“权”的一般计算公式其中:为第j个指标(维度)的熵,m为指标,利用样本数据上感受下熵的变化,请大家动一动手,用,EXCEL,计算出样本数据的熵!,感受下不同分布的指标数据算出来的熵值会怎样变化?,详见附录,1,利用样本数据上感受下熵的变化请大家动一动手,用EXCEL计算,熵值法的一般步骤,步骤一,确立指标体系,步骤二,清洗指标极值,步骤三,归一化指标处理,步骤四,计算指标“熵”和“权”,步骤五,指标加权计算得分,熵值法的一般步骤步骤一确立指标体系步骤二清洗指标极值步骤三归,熵值法的,一般步骤之一:确立指标体系,案例解说,我们,用手游认知客户挖掘模型实例来解说熵值法计算指标权重的全过程。下图是手游认知客户挖掘模型的,二级,指标,评价,体系,,其中各个维度指标对应的权重系数均是通过熵值法计算出来的,。,下面,具体看下模型中“,手游认知能力,”,部分指标,权重的计算,过程,。,一,级,二,级,熵值法的一般步骤之一:确立指标体系案例解说 我们用手游,熵值法的,一般步骤之,二,:清洗指标极值,案例解说,方法,:,即,剔除各,指标中,极,大或者,极,小的值,,一般用比较合理的上下限值替换这些极值。目的是,减少,极值,数据,对该指标的熵的影响,;,原则,:剔除占样本总数不到,1-2%,但指标值贡献率超过,20-30%,以上的极值样本,样本,id,游戏流量(,K,),贡献率,981,6358,0.8%,982,6401,0.8%,983,6631,0.8%,984,6635,0.8%,985,7193,0.9%,986,7432,0.9%,987,7993,1.0%,988,8385,1.0%,989,8691,1.1%,990,10038,1.2%,991,10263,1.3%,992,10417,1.3%,993,10936,1.3%,994,11307,1.4%,995,14254,1.8%,996,15073,1.9%,997,15326,1.9%,998,16480,2.0%,999,16542,2.0%,1000,61573,7.6%,样本,id,游戏流量(,K,),贡献率,981,6107,0.9%,982,6107,0.9%,983,6107,0.9%,984,6107,0.9%,985,6107,0.9%,986,6107,0.9%,987,6107,0.9%,988,6107,0.9%,989,6107,0.9%,990,6107,0.9%,991,6107,0.9%,992,6107,0.9%,993,6107,0.9%,994,6107,0.9%,995,6107,0.9%,996,6107,0.9%,997,6107,0.9%,998,6107,0.9%,999,6107,0.9%,1000,6107,0.9%,去极值后,熵值法的一般步骤之二:清洗指标极值案例解说方法:即剔除各指标,熵值法的,一般步骤之三:归一化指标处理,案例解说,方法,:指标归一化过程也称之为指标的无量纲化,即将指标实际值转化为不受量纲影响的指标平价值。方法比较多,具体见附录,无纲量化方法一览,;,原则,:比较常用的是,临界值,法,和,Z-score,法,(,更合理,保持了数据的连续性,减少数据信息丢失,),,最终将所有指标转化为正区间里面,二者具体处理如下:,分箱处理,逻辑处理,临界值法,Z-score,法,1,2,3,,,100,(0,1,熵值法的一般步骤之三:归一化指标处理案例解说方法:指标归一化,熵值法,的,一般步骤之四:计算指标“熵”和“权”,案例解说,类似,,按,此公式还可以继续计算出,和,同理可以计算出,和,熵,权,熵值法的一般步骤之四:计算指标“熵”和“权”案例解说类似,按,熵值法,的,一般步骤之五:指标加权计算得分,案例解说,利用,以上,3,个指标的,权,重,和,归一,化,指标值,计算上级指标的分数:,手游认知能力得分,=0.336*,手,游历史付费,金额,+,0.212,*,手,游访问,次数,+,0.452,*,手,游访问天数。,当然,,模型其他部分的底层指标权重,和,一,级,指标权重均可以按以上步骤计算得到,并一层层由下往上进行加权,最终得到模型的综合得分。,方法,:计算综合得分就是指标合成的过程,一般可以采用加法原理和乘法原理,;,原则,:最常用的是加法合成法,,其具体处理如下:,加法合成法,熵值法的一般步骤之五:指标加权计算得分案例解说 利用以,熵值法原理及应用实践,2,熵,值法如何计算权重?,3,怎样合理应用熵值法?,熵,值法,是做什么用的?,1,熵值法原理及应用实践2 熵值法如何计算权重?3 怎样合理应用,熵值法的优点在于其客观、准确和简便,优点,熵值法能深刻反映出指标的区分能力,进而确定权重。这种思想和我们的得分评价模型指标选择的,机理是一致的,;,是一种客观赋权法,有理论依据,相对主观赋权具有,较高的可信度和精确度,;,算法简单,实践起来比较,方便操作,,无需借助其他分析软件实现。,熵值法的优点在于其客观、准确和简便优点熵值法能深刻反映出指标,熵值法原理及应用实践课件,熵值法不是万能赋权法,缺,点,智能程度不够,高,。与多元回归和主成份等统计方法不同,它不能考虑指标与指标间横向的影响,(,如:相关性,),,更不能确定指标,对,目标,/,得分的,影响,方向,(,如:正相关,或,负相关,),;,同其他客观赋权法一样,若无业务经验的指导,,权重可能失真,;,对样本的依赖性比较大,,随着建模样本变化,权重会有一定波动;,熵值法不是万能赋权法缺点 智能程度不够高。与多元回归和主成份,项目中合理应用熵值法的几点个人经验:,必须,结合,专家打分,法,才可以发挥熵,值,法的优势。事实上,指标评价体系建立的基础就是专家经验;,在确定权重前,需要完全确定,指标对目标得分的影响方向,。非线性的指标要么剔除,要么进行预处理;,熵值法,对底层指标比较适用,,而对上层指标权重需要重点借助专家经验;,不要怕麻烦,好好处理所有指标的极值问题,对权重的优化有好处;,个人经验,项目中合理应用熵值法的几点个人经验:必须结合专家打分法才可,附录,1.,计算熵值的数据样本,2.,熵值法的,SQL,实现脚本,3,.,无纲量方法一览,附录1.计算熵值的数据样本2.熵值法的SQL实现脚本3.,附录,附录,1,.,计算熵值的数据样本,附录,2,.,熵值法的,SQL,实现脚本,附录附录1.计算熵值的数据样本附录2.熵值法的SQL实现,附录,3,无,量纲,方法一览,阀,值,法,(,临界值法,),1,、,2,、,3,、,4,、,Z-score,法,1,、,比重法,1,、,2,、,折线型,曲线型,直线,型,附录3 无量纲方法一览阀值法(临界值法)折线型曲线型直线型,Thank you,Thank you,
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6