数据分析师-数据分析师基础-概率论_大数定律与中心极限定理.docx

数据分析师-数据分析师基础-概率论_大数定律与中心极限定理.docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE1

PAGE1

概率论基础

1随机变量与概率分布

1.1原理与内容

随机变量是概率论中的基本概念,它将随机事件的结果映射到实数上。随机变量可以分为离散型和连续型。离散型随机变量的取值是有限或可数无限的,而连续型随机变量的取值是不可数无限的,通常在某个区间内。

概率分布描述了随机变量取值的概率。对于离散型随机变量,我们使用概率质量函数(PMF)来描述;对于连续型随机变量,我们使用概率密度函数(PDF)来描述。概率分布函数(CDF)则描述了随机变量取值小于等于某个值的概率。

1.2示例

假设我们有一个离散型随机变量X,它表示抛掷一枚公平的骰子的结果。X的概率质量函数(PMF)可以表示为:

P

使用Python的numpy和matplotlib库,我们可以绘制这个PMF:

importnumpyasnp

importmatplotlib.pyplotasplt

#定义随机变量X的取值和概率

x_values=np.arange(1,7)

pmf=np.ones(6)/6

#绘制PMF

plt.bar(x_values,pmf)

plt.xlabel(X的取值)

plt.ylabel(概率)

plt.title(离散型随机变量X的PMF)

plt.show()

2期望与方差

2.1原理与内容

期望值是随机变量的平均值,它反映了随机变量的中心趋势。对于离散型随机变量X,期望值定义为:

E

对于连续型随机变量X,期望值定义为:

E

方差是随机变量与其期望值的偏差的平方的期望值,它反映了随机变量的离散程度。方差定义为:

V

2.2示例

继续使用抛掷骰子的例子,我们可以计算随机变量X的期望值和方差:

#计算期望值

expected_value=np.sum(x_values*pmf)

print(f期望值:{expected_value})

#计算方差

variance=np.sum((x_values-expected_value)**2*pmf)

print(f方差:{variance})

3独立随机变量

3.1原理与内容

独立随机变量是指两个或多个随机变量之间没有相互影响。如果随机变量X和Y是独立的,那么它们的联合概率分布函数可以表示为:

P

独立随机变量的期望值和方差可以分别计算,而它们的和的期望值和方差则可以表示为:

E

V

3.2示例

假设我们有两个独立的随机变量X和Y,它们分别表示抛掷两枚公平的骰子的结果。我们可以计算X+Y

#定义随机变量Y的取值和概率

y_values=np.arange(1,7)

pmf_y=np.ones(6)/6

#计算随机变量Y的期望值和方差

expected_value_y=np.sum(y_values*pmf_y)

variance_y=np.sum((y_values-expected_value_y)**2*pmf_y)

#计算X+Y的期望值和方差

expected_value_sum=expected_value+expected_value_y

variance_sum=variance+variance_y

print(fX+Y的期望值:{expected_value_sum})

print(fX+Y的方差:{variance_sum})

4随机变量序列

4.1原理与内容

随机变量序列是指一系列独立同分布的随机变量。在概率论中,随机变量序列的性质和行为是研究的重点,尤其是在大数定律和中心极限定理中。

随机变量序列的期望值和方差可以分别计算,而它们的和的期望值和方差则可以表示为:

E

V

4.2示例

假设我们有一个随机变量序列{Xi}i=

#定义随机变量序列的长度

n=10

#计算随机变量序列的和的期望值和方差

expected_value_sum_sequence=n*expected_value

variance_sum_sequence=n*variance

print(f随机变量序列的和的期望值:{expected_value_sum_sequence})

print(f随机变量序列的和的方差:{variance_sum_sequence})

以上示例展示了如何使用Python的numpy和matplotlib库来计算和绘制随机变量的期望值、方差和概率分布。这些基本概念是概率论的基石,为后续学习大数定律和中心极限定理提供了必要的数学工具。#大数定律

5弱大数定律的定义与证明

弱大数定律(WeakLawof

文档评论(0)

kkzhujl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档