数据分析师-数据分析师基础-概率论_布朗运动.docx

数据分析师-数据分析师基础-概率论_布朗运动.docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE1

PAGE1

概率论基础

1随机变量与概率分布

1.1原理与内容

随机变量是概率论中的基本概念,它将随机事件的结果映射到实数上。随机变量可以分为离散型和连续型。离散型随机变量取值为可数集,而连续型随机变量取值为实数集中的一个区间。

概率分布描述了随机变量取值的概率。对于离散型随机变量,我们使用概率质量函数(PMF)来描述;对于连续型随机变量,我们使用概率密度函数(PDF)来描述。

1.2示例

假设我们有一个公平的六面骰子,我们关心的是掷出的点数。这是一个离散型随机变量的例子。我们可以定义一个随机变量X,表示掷出的点数。X的概率质量函数(PMF)为:

P

在Python中,我们可以使用numpy和matplotlib来可视化这个PMF:

importnumpyasnp

importmatplotlib.pyplotasplt

#定义随机变量X的取值

x=np.arange(1,7)

#定义概率质量函数

pmf=np.ones(6)/6

#绘制概率质量函数

plt.bar(x,pmf)

plt.xlabel(点数)

plt.ylabel(概率)

plt.title(六面骰子的概率质量函数)

plt.show()

2期望与方差

2.1原理与内容

期望是随机变量的平均值,它反映了随机变量的中心趋势。对于离散型随机变量X,期望定义为:

E

对于连续型随机变量X,期望定义为:

E

其中fx是X

方差是随机变量与其期望值的偏差的平方的期望值,它反映了随机变量的离散程度。方差定义为:

V

2.2示例

继续使用六面骰子的例子,我们可以计算X的期望和方差:

E

V

在Python中,我们可以使用numpy来计算这些值:

importnumpyasnp

#定义随机变量X的取值

x=np.arange(1,7)

#定义概率质量函数

pmf=np.ones(6)/6

#计算期望

expectation=np.sum(x*pmf)

print(f期望值:{expectation})

#计算方差

variance=np.sum((x-expectation)**2*pmf)

print(f方差:{variance})

3大数定律与中心极限定理

3.1原理与内容

大数定律描述了当独立同分布的随机变量的个数趋于无穷大时,它们的样本平均值趋于期望值。大数定律分为弱大数定律和强大数定律。

中心极限定理描述了当独立同分布的随机变量的个数趋于无穷大时,它们的样本平均值的分布趋于正态分布。中心极限定理是概率论和统计学中的一个非常重要的定理,它解释了为什么在许多实际问题中,随机变量的分布往往呈现出正态分布的特性。

3.2示例

假设我们有一个公平的六面骰子,我们连续掷n次,然后计算平均点数。根据大数定律,当n趋于无穷大时,平均点数将趋于期望值3.5。在Python中,我们可以使用numpy来模拟这个过程:

importnumpyasnp

#定义随机变量X的期望值

expectation=3.5

#定义掷骰子的次数

n=10000

#模拟掷骰子的过程

rolls=np.random.randint(1,7,size=n)

#计算平均点数

average=np.mean(rolls)

print(f平均点数:{average})

#绘制平均点数与期望值的差异

plt.hist(rolls,bins=6,range=(0.5,6.5),density=True)

plt.axvline(expectation,color=r,linestyle=dashed,linewidth=2)

plt.xlabel(点数)

plt.ylabel(频率)

plt.title(六面骰子的频率分布)

plt.show()

在这个例子中,我们连续掷了10000次骰子,然后计算了平均点数。我们可以看到,平均点数非常接近期望值3.5。此外,我们还绘制了点数的频率分布,可以看到它呈现出均匀分布的特性,这与我们定义的概率质量函数是一致的。#布朗运动的引入

4布朗运动的历史背景

布朗运动,这一概念最早由苏格兰植物学家罗伯特·布朗在1827年观察到。当时,布朗正在研究花粉颗粒在水中的运动,他注意到花粉颗粒在显微镜下表现出一种无规则的、随机的运动模式。这种运动并非由外界刺激引起,也不遵循任何可预测的路径,而是呈现出一种持续的、微小的振动。布朗的这一发现,最初被归因于生物活动,但后来的研究表明,这种运动实际上是由水分子对花粉颗粒的随机碰撞所引起的,

您可能关注的文档

文档评论(0)

kkzhujl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档