数据分析师-数据分析师基础-概率论_极限定理与收敛性.docx

数据分析师-数据分析师基础-概率论_极限定理与收敛性.docx

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE1

PAGE1

概率论基础

1随机变量与分布

随机变量是概率论中的基本概念,它将随机事件的结果映射到实数上。随机变量可以分为离散型和连续型。离散型随机变量取值为可数集,而连续型随机变量取值为实数集中的一个区间。

1.1离散型随机变量的分布

离散型随机变量的分布可以通过概率质量函数(PMF)来描述,即随机变量取每一个可能值的概率。例如,考虑一个公平的六面骰子,其随机变量X的PMF为:

P

1.2连续型随机变量的分布

连续型随机变量的分布则通过概率密度函数(PDF)来描述。PDF在某一点的值并不直接给出该点的概率,而是表示在该点附近单位长度内的概率。例如,标准正态分布的PDF为:

f

2数学期望与方差

数学期望和方差是描述随机变量特性的两个重要参数。

2.1数学期望

数学期望是随机变量的平均值,对于离散型随机变量X,其数学期望定义为:

E

对于连续型随机变量X,其数学期望定义为:

E

2.2方差

方差描述了随机变量与其数学期望的偏离程度,定义为:

V

2.3代码示例

假设我们有一个离散型随机变量X,其取值为1,2,

#定义随机变量的取值和概率

values=[1,2,3]

probabilities=[0.2,0.3,0.5]

#计算数学期望

expectation=sum([value*probabilityforvalue,probabilityinzip(values,probabilities)])

print(数学期望:,expectation)

#计算方差

variance=sum([(value-expectation)**2*probabilityforvalue,probabilityinzip(values,probabilities)])

print(方差:,variance)

3大数定律简介

大数定律是概率论中的一个基本定理,它描述了大量独立同分布的随机变量的平均值趋于其数学期望的性质。大数定律分为弱大数定律和强大数定律。

3.1弱大数定律

弱大数定律指出,对于独立同分布的随机变量序列X1,X2,

3.2强大数定律

强大数定律则指出,对于独立同分布的随机变量序列X1,X2,

3.3代码示例

我们可以使用Python来模拟一个随机变量序列,并观察其样本均值如何收敛于数学期望。假设随机变量X服从标准正态分布,我们生成一个长度为10000的随机变量序列,并计算前n个随机变量的样本均值,观察其收敛性:

importnumpyasnp

importmatplotlib.pyplotasplt

#生成随机变量序列

X=np.random.standard_normal(10000)

#计算样本均值

sample_means=np.cumsum(X)/np.arange(1,10001)

#绘制样本均值的收敛性

plt.plot(sample_means)

plt.axhline(y=0,color=r,linestyle=--)#标准正态分布的数学期望为0

plt.title(样本均值的收敛性)

plt.xlabel(样本数量)

plt.ylabel(样本均值)

plt.show()

在这个例子中,我们生成了一个长度为10000的标准正态分布随机变量序列,并计算了前n个随机变量的样本均值。随着样本数量的增加,样本均值逐渐收敛于数学期望0,这符合大数定律的描述。#极限定理与收敛性

4收敛的概念

在概率论中,收敛是一个核心概念,它描述了随机变量序列在某种意义上趋于一个确定值或另一个随机变量的行为。收敛的概念在极限定理中起着关键作用,帮助我们理解大量独立随机事件的累积效应。收敛可以分为几种类型,包括几乎处处收敛、依概率收敛、依分布收敛等,每种收敛类型都有其特定的定义和应用场景。

4.1几乎处处收敛

几乎处处收敛(AlmostSureConvergence)是最强的收敛类型之一,它要求随机变量序列在除了一个测度为零的集合外的所有点上都收敛到一个确定值或另一个随机变量。数学上,如果有一序列随机变量(X_n)几乎处处收敛到(X),则对于几乎所有的(),有(X_n()X())。

4.2依概率收敛

依概率收敛(ConvergenceinProbability)描述的是随机变量序列(X_n)以概率1收敛到随机变量(X)。这意味着对于任意的(0),有(_{n}P(|X_n-X|)=0)。依概率收敛比几乎处处收敛弱,但仍然是一种重要的收敛类型,尤其是在处理大数定律时。

4.3依分布收敛

依分布收敛(ConvergenceinDis

文档评论(0)

kkzhujl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档