- 1、本文档共47页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
幂律
齐普夫定律ZipfsLawZipf定律是美国学者G.K.齐普夫提出的。可以表述为:在自然语言的语料库里,一个单词出现的次数与它在频率表里的排名成反比。上个世纪30年代,Zipf对此作出了研究,并给出了量化的表达——齐普夫定律(ZipfsLaw):一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。就是 r×f=COr f=C/r^1Zipf定律是文献计量学的重要定律之一,它和洛特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。
汉字使用频率统计使用频率排名前5个汉字(使用频率之和为10%): 的一是了我使用频率排名第(6~17)个汉字(使用频率之和为10%): 不人在他有这个上们来到时/link?url=SQyragilOETE2Ofcid4lPySETscZildBRh-gcmasz_kFg_PaHdnEfvIyfmt3dC7WDCTA5UJNGwpkyu9j3BhuuonZMVus-NQ0iRkTqtcsNGm
Zipf模型
模型模拟3000个城市的人口数据clc;clearall%用Zipf模型模拟3000个城市的人口数据,放入gm变量中npm=3000gm1=wr=1fori=1:npmgm(i)=gm1/i^pwr;endforplot(gm,ok)figure%建立新图画面loglog([1:npm],gm,“-or”)%画双对数点线图
Zipf模型续:
20%城里居住着80%的人口吗?%计算排名前20%的城里居住的人口(某国)gm20和%排名前20%的城里居住的人口占总人口的百分比,即相对规模,xdgm20zgm=sum(gm)%总规模pm20=npm/5gm20=0;fori=1:pm20gm20=gm20+gm(i);endforgm20xdgm20=gm20/zgm%百分相对规模
100个城市,3000W,plot(gm)
1000个城市,3000W,plot(gm)
1000个城市,3000万loglog(gm)
Zipf模型:中国一线城市人口触顶?房地产/房价预测需要:中国一线城市人口触顶?中国1000城市人口数据直线拟合大部数据Zipf模型观察,比较Zipf直线
从US人口局下载到的资料有
2000至2008年10年间的普查资料
宁夏回族自治区2010年第六次全国人口普查主要数据公报
区统计局2011年5月10日/link?url=FEIb_yYlwNjgA6IR1xnZyJwe-TxbCHzA5h5q7M2gmrAOxfp_MnYC4V4-vUfYmXpjIcc7QIBy-4SxwBk31AfKIa人口数(人)比重[8](%)自然增长率(‰)人口密度[9]
练习题如城市人口服从ZIPF模型,计算排名前20%城市居住人口的占比是否是80%。
clc;clearallnpm=2000rk1=wr=1%Zipfslawfori=1:npmrk(i)=rk1/i^pwr;endfor%总人口zrk=sum(rk)zrk20p=sum(rk(1:0.2*npm))rkzb20p=zrk20p/zrk%人口占比fori=1:npmrkzb(i)=rk(i)/zrk;endfor%人口累计占比rkljzb(1)=rkzb(1);fori=2:npmrkljzb(i)=rkljzb(i-1)+rkzb(i);endforfigure1loglog([1:npm],rk,or)%bar([1:npm],rkzb,r)%holdon%plot(rkljzb,-og)%%%%%%%%%%%%%%%%%%%%%城市人口(按排名百分数)xscale=npm/100rkp(1)=sum(rk(1:1*xscale));rkzbp(1)=rkp(1)/zrk;forj=2:100rkp(j)=sum(rk((j-1)*xscale+1:j*xscale));rkzbp(j)=rkp(j)/zrk;endfor%人口累计占比(按排名百分数)forj=1:100rkljzbp(j)=sum(rkzbp(1:j));endforfigure2ifxscale1bar([1:npm],rkzb,r)holdonplot(rkljzb,-og)xlabel(pm)yla
您可能关注的文档
- TD-LTE的空中接口(空口理论).pptx
- ui设计:VI基础设计系统.ppt
- 设计表现:概要.ppt
- TD-LTE的关键技术课件.pptx
- 数学实验:实验十二 缉私艇追赶走私船模型实验.ppt
- 数学实验:实验十一 非线性方程(组)求解.ppt
- 数字电路实验:电子技术应用实验.ppt
- 随机过程:第一章 概率与随机变量.ppt
- 随机过程:平稳随机过程.ppt
- 随机过程:随机变量的数字特征.ppt
- 第十一章 电流和电路专题特训二 实物图与电路图的互画 教学设计 2024-2025学年鲁科版物理九年级上册.docx
- 人教版七年级上册信息技术6.3加工音频素材 教学设计.docx
- 5.1自然地理环境的整体性 说课教案 (1).docx
- 4.1 夯实法治基础 教学设计-2023-2024学年统编版九年级道德与法治上册.docx
- 3.1 光的色彩 颜色 电子教案 2023-2024学年苏科版为了八年级上学期.docx
- 小学体育与健康 四年级下册健康教育 教案.docx
- 2024-2025学年初中数学九年级下册北京课改版(2024)教学设计合集.docx
- 2024-2025学年初中科学七年级下册浙教版(2024)教学设计合集.docx
- 2024-2025学年小学信息技术(信息科技)六年级下册浙摄影版(2013)教学设计合集.docx
- 2024-2025学年小学美术二年级下册人美版(常锐伦、欧京海)教学设计合集.docx
文档评论(0)