数量模型与算法基础:幂律.pptx

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

幂律

齐普夫定律ZipfsLawZipf定律是美国学者G.K.齐普夫提出的。可以表述为:在自然语言的语料库里,一个单词出现的次数与它在频率表里的排名成反比。上个世纪30年代,Zipf对此作出了研究,并给出了量化的表达——齐普夫定律(ZipfsLaw):一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。就是 r×f=COr f=C/r^1Zipf定律是文献计量学的重要定律之一,它和洛特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。

汉字使用频率统计使用频率排名前5个汉字(使用频率之和为10%): 的一是了我使用频率排名第(6~17)个汉字(使用频率之和为10%): 不人在他有这个上们来到时/link?url=SQyragilOETE2Ofcid4lPySETscZildBRh-gcmasz_kFg_PaHdnEfvIyfmt3dC7WDCTA5UJNGwpkyu9j3BhuuonZMVus-NQ0iRkTqtcsNGm

Zipf模型

模型模拟3000个城市的人口数据clc;clearall%用Zipf模型模拟3000个城市的人口数据,放入gm变量中npm=3000gm1=wr=1fori=1:npmgm(i)=gm1/i^pwr;endforplot(gm,ok)figure%建立新图画面loglog([1:npm],gm,“-or”)%画双对数点线图

Zipf模型续:

20%城里居住着80%的人口吗?%计算排名前20%的城里居住的人口(某国)gm20和%排名前20%的城里居住的人口占总人口的百分比,即相对规模,xdgm20zgm=sum(gm)%总规模pm20=npm/5gm20=0;fori=1:pm20gm20=gm20+gm(i);endforgm20xdgm20=gm20/zgm%百分相对规模

100个城市,3000W,plot(gm)

1000个城市,3000W,plot(gm)

1000个城市,3000万loglog(gm)

Zipf模型:中国一线城市人口触顶?房地产/房价预测需要:中国一线城市人口触顶?中国1000城市人口数据直线拟合大部数据Zipf模型观察,比较Zipf直线

从US人口局下载到的资料有

2000至2008年10年间的普查资料

宁夏回族自治区2010年第六次全国人口普查主要数据公报

区统计局2011年5月10日/link?url=FEIb_yYlwNjgA6IR1xnZyJwe-TxbCHzA5h5q7M2gmrAOxfp_MnYC4V4-vUfYmXpjIcc7QIBy-4SxwBk31AfKIa人口数(人)比重[8](%)自然增长率(‰)人口密度[9]

练习题如城市人口服从ZIPF模型,计算排名前20%城市居住人口的占比是否是80%。

clc;clearallnpm=2000rk1=wr=1%Zipfslawfori=1:npmrk(i)=rk1/i^pwr;endfor%总人口zrk=sum(rk)zrk20p=sum(rk(1:0.2*npm))rkzb20p=zrk20p/zrk%人口占比fori=1:npmrkzb(i)=rk(i)/zrk;endfor%人口累计占比rkljzb(1)=rkzb(1);fori=2:npmrkljzb(i)=rkljzb(i-1)+rkzb(i);endforfigure1loglog([1:npm],rk,or)%bar([1:npm],rkzb,r)%holdon%plot(rkljzb,-og)%%%%%%%%%%%%%%%%%%%%%城市人口(按排名百分数)xscale=npm/100rkp(1)=sum(rk(1:1*xscale));rkzbp(1)=rkp(1)/zrk;forj=2:100rkp(j)=sum(rk((j-1)*xscale+1:j*xscale));rkzbp(j)=rkp(j)/zrk;endfor%人口累计占比(按排名百分数)forj=1:100rkljzbp(j)=sum(rkzbp(1:j));endforfigure2ifxscale1bar([1:npm],rkzb,r)holdonplot(rkljzb,-og)xlabel(pm)yla

文档评论(0)

胖鸥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档