网站大量收购闲置独家精品文档,联系QQ:2885784924

随机数的首位数字出现概率统计分析.docVIP

随机数的首位数字出现概率统计分析.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
随机数的首位数字出现概率统计分析

随机数的首位数字出现概率统计分析 西南大学2011级 朱熹 朱心阳 周亚晶 何龙 刘伟 田宸宇 内容摘要:本文运用一系列统计方法对学生人数进行统计分析,以及自己对实验现象的隐含的原理的猜测、证明。实验结果表明:a)首位数字是1的数字出现的几率最大,依次是2至9逐个递减。并且满足一定的函数关系。b)所有数字所在的数量级一定要有很大的差距,不然无法得出这个结论。c)所统计的数字一定不要受太大的人为因数影响。 以此定律,我们可以检验一些记账的数据是否被私自删改,以及比赛投票的结果的检验复查,防止一些简单的造假行为。 关键词:统计分析;首位数字;数量级;随机 1、引言 2001年,美国最大的能源交易商安然公司宣布破产,当时传出了该公司高层管理人员涉嫌做假账的传闻。事后人们发现,安然公司在2001年到2002年所公布的每股盈利数字就不符合本福特定律,这证明了安然的高层领导确实改动过这些数据。如今做假账这些行为应当严厉打击,也许在次定律发现之前,做的一些假账逃过了法律的制裁。传闻1935年,美国的一位叫做本福特的物理学家在图书馆翻阅对数表时发现,对数表的头几页比后面的页更脏一些,这就说明了前几页翻阅得跟多,由此本福特发现了这一定律。本福特定律看似不符合逻辑,实质上它是经得起检验的。为此我们作出此次统计调查再一次亲身感受结论的正确性,同时我们也将作出自己的猜想,以及自己对定律的理解。 2、提出问题 对于自然出现的数字的首位数,是否1~9这九个数字的出现概率一定为1/9?如果不是,那它们将满足什么关系?为什么会出现不等于1/9这种情况?这种规律能否在实际生活工作中应用?能不能对此有一个直观的理解?这就是本次统计方案设计大赛我们队所研究的课题——首位数字出现几率的概率统计。 3、分析问题 对于自然出现的这些数字0、1、2、3、4、5、6、7、8、9,如果按照一定的度量单位制,这里我们假设他们为十进制进位方式,且数字按固定比例增长,那么在首位数字较小时,首数增长得会很慢,这意味着首位数变化的速率会很慢,但是当首位数字增长后,随着首位数字变大,首位数字的值增长也会加快。举个例子,假设股票市场上的指数一开始是1000点,并以每年10%的程度上升,那么要用7年多时间,这个指数才能从1000点上升到2000点的水平;而由 2000点上升到3000点只需要4年多时间;但是,如果要让指数从10000点上升到20000点,还需要等7年多的时间。也就是说,如果这些数据随机地出现,就算出现概率是等可能的,那么在一段时间内,我们看到的1出现的次数也将大于其他数字,所以这直接造成了首位数字是1出现的几率最大。 4、设计统计方案 我们猜想这些数字出现的规律满足由1开始逐渐递减,并且符合一定的函数关系。为此,我们将采集大量数据,为了让数据满足“随机、自然出现”这个条件,我们对重庆沙坪坝、洋人街和北碚的商铺做了调查,调查对象为这些商店的月营业额。由于商店类型不同,所以它们的营销额差距也是相当大的,可以产生相差几个数量级的营销额,且不受太多人为因素的影响。不要过多的选择同一地点且同一种商品的商店,那样可能将产生一些相似的数据。按照不同的月份分为12组,那么每个商店将可以为我们提供出12个数据。例如,第一家一月份的营业额为38914元,第二家一月份营业额为4339元,第三家一月份营业额为985元,第四家……那第一组的数据便为:38914、4339、985……之后,通过java编程统计,便能得到每个组中这九个数字在首位时出现的概率。之后再进行分析比对,于是得出结果。为了验证该结果,我们同时也将对其他一些数据进行同样的统计分析,例如贴吧点击数、不同投票的结果等等。 5、统计结果 所有调查的商店每月份的营销额的首位数字数量及比列如下:(第一行为首位数字,第二行为数据的个数,第三行为数据个数占总个数的百分数。后面的表同此) 1 2 3 4 5 6 7 8 9 287 174 102 84 74 66 59 54 48 30.4% 18.4% 10.7% 8.8% 7.9% 6.9% 6.3% 5.6% 5.0% 通过对采集到的数据进行汇总和统计,我们发现在这些数据中,首位为1的出现概率远大于其他数字,并且接近于30%;而2~9这些数字出现的概率不仅远小于1出现的概率,其出现概率也是符合逐级递减的规律。并且符合数字越大递减的速率越慢的这一规律。与前面的猜想一致。 误差分析 将我们得到的数据与标准值相比较得方差 σ=【(0.304-0.301)^2+(0.184-0.176)^2+(0.107-0.097)^2+(0.088-0.097)^2+(0.079-0.079)^2+(0.069-0.067)^2+

文档评论(0)

taotao0c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档