- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
投影寻踪分类模型在雷电灾害风险分析中的应用与比较.doc
投影寻踪分类模型在雷电灾害风险分析中的应用与比较
摘要:目的 利用北京地区雷电监测资料,应用投影寻踪分类模型,对北京市雷电灾害进行风险分析,并与层次分析模型的结果进行比较。方法 以闪电密度(次?km-2?a-1)、人口密度(人?km-2)和GDP(万元?km-2)作为主要指标,使用DPS数据处理系统进行投影寻踪分析。结果 应用投影寻踪分类模型估算的雷电风险值与该地区实际雷电灾害发生频次的区县间变化趋势大致相同。结论 基于三指标的投影寻踪分类模型可用于雷电灾害的风险分析。
关键词:投影寻踪;雷电灾害;风险分析
雷电是我国沿海地区的一类常见自然灾害。目前主要通过构建多指标体系的雷电灾害风险评估模型来进行相关风险分析及区域划分。其中,从指标体系到形成风险评估模型的过程中,如何确定各个指标的权重系数是关键。总体上权重的确定方法包括两类,主观赋值法和客观赋值法。主观赋值法如通过专家咨询[1],但因有人的主观经验混在其中,因而在某种程度上均会影响最终结果的客观性和准确性。客观赋值法如层次分析法[2-4]、模糊综合评判法[5,6]等。层次分析法可通过计算机编程不依赖于人,通过对多层次指标的权重进行层次收敛,而获得各指标的权重。而投影寻踪方法作为一类由样本数据驱动的探索性分析方法,可基于原始数据的结构特征求得每个指标的权重,因而也可以排除人为主观判断而带来的干扰。
1投影寻踪分类模型
1.1 PP发展简史和原理 投影寻踪(projection pursuit,PP)是一类于20世纪70年代中期发展起来的一类处理非正态高维数据的统计方法,其融合了统计学、应用数学和计算机技术,主要用来分析和处理高纬观测数据,尤其适合于分析非正态非线性高纬数据。
PP是在70年代初由Kruskal开始试验和发展的。最开始,他通过将高纬数据投影到低维空间,获得数据的最优投影,用以解决数据的聚类结构和化石分类问题。之后,由Friedman和Tukey在1974年加以改进,并正式提出了PP概念。1976年,相关计算机图像系统PRIM-9发布。1979年及其后若干年内,Friedman等人还相继提出了投影寻踪分类模型(projection pursuit classification model,PPC)、投影寻踪回归模型(projection pursuit regression model,PPR)等方法[7]。目前,该方法已被广泛应用于包括气象[8]、环境科学[9]、经济学[10]和灾害评价[11]等方面。
1.2 PPC原理 作为一类探索性数据分析方法,PP由样本数据驱动,利用计算机技术将高维数据通过某种组合投影到低维子空间上。再通过采用投影指标函数分析与优化结果,寻找到能反映原高维数据结构或特征的投影,从而实现研究和分析高维数据的目的。其基本原理是通过将待评价对象的各评价指标样本进行线性投影,按照一定的原则寻求最优投影方向向量,即客观权重,从而建立综合评价指数进行评价。由于该方法对于指标和样本量无特别要求,且分析效果更为清晰,因此是一类较为实用和稳健的分析方法[7]。
1.3 PPC步骤 本研究应用的PPC模型的建模过程主要包括以下5个步骤[7]
步骤1:样本评价指标的归一化处理。
设p个指标n个样本集的原始数据为{x*(i,j)|i=1,2,……,p}
正向指标x(i,j)=■ (式1)
负向指标x(i,j)=■(式2)
xmax(j)、xmin(j)分别代表第j个指标值的最大和最小值。x(i,j)代表经过归一化处理后的指标值序列。
步骤2:构造投影指标函数Q(a)。目的是将p维数据{x*(i,j)|i=1,2,……,p}综合成以a={a1,a2,……,ap}为投影方向的一维投影值z(i):
z(i)=■a(j)x(i,j),(i=1,2,……,n)(式3)
然后根据{z(i)|i=1,2,……,n}的一维散布图进行分类。其中,a为单位长度向量。综合投影指标时,要求投影值 的散步特征应符合以下要求:局部投影点尽可能密集,如凝聚成若干点团,整体投影上点团之间距离尽可能大。按此投影指标函数还可表达为以下公式:
Q(a)=SzgDz(式4)
上式中,Sz为投影值的标准差,Dz为投影值的局部密度,
Sz=■(式5)
Dz=■■(R-r(i,j)gu(R-r(i,j))(式6)
上式中,E(z)为序列{z(i)|i=1,2,……,n}的平均值。R为局部密度的窗口半径。R的选择原则如下:使包含在窗口内的投影点的平均个数不太少,且不会随着n的增大而增加太多,此外还应避免滑动平均偏差太大。可以根据试验来确定R的大小。
t0为样本间距,r(
文档评论(0)