数据分析师-数据分析师基础-概率论_随机变量的变换与函数.docx

数据分析师-数据分析师基础-概率论_随机变量的变换与函数.docx

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE1

PAGE1

概率论基础

1随机试验与样本空间

随机试验(RandomExperiment)是指在相同的条件下,试验结果可能不同,但所有可能的结果是已知的。例如,抛掷一枚硬币,可能的结果是正面或反面,这是一个随机试验。样本空间(SampleSpace)是随机试验所有可能结果的集合。在硬币抛掷的例子中,样本空间S={正面,反面}。

1.1示例

假设我们进行一个随机试验,抛掷一枚骰子,观察其朝上的面的点数。

#定义样本空间

importrandom

#定义一个函数来模拟抛掷骰子

defroll_dice():

returnrandom.randint(1,6)

#执行试验

for_inrange(10):

print(roll_dice())

2事件与概率

事件(Event)是样本空间的子集,即随机试验中某些结果的集合。概率(Probability)是衡量事件发生的可能性的量,其值在0到1之间,0表示事件不可能发生,1表示事件必然发生。

2.1示例

假设我们进行一个随机试验,抛掷一枚骰子,观察其朝上的面的点数。我们定义事件A为“点数为偶数”。

#定义事件A

defis_even(number):

returnnumber%2==0

#计算事件A的概率

trials=10000

successes=0

for_inrange(trials):

ifis_even(roll_dice()):

successes+=1

probability_A=successes/trials

print(事件A的概率大约为:,probability_A)

3随机变量与分布函数

随机变量(RandomVariable)是将样本空间中的每个结果映射到实数集上的函数。分布函数(DistributionFunction)描述了随机变量取值的概率分布。例如,对于离散随机变量,我们通常使用概率质量函数(ProbabilityMassFunction,PMF)来描述其分布。

3.1示例

假设我们进行一个随机试验,抛掷一枚骰子,观察其朝上的面的点数。我们定义随机变量X为“点数”。

#计算随机变量X的分布

fromcollectionsimportCounter

trials=10000

results=[roll_dice()for_inrange(trials)]

distribution=Counter(results)

#输出分布

forxinrange(1,7):

print(X=,x,的概率大约为:,distribution[x]/trials)

在连续随机变量的情况下,我们通常使用概率密度函数(ProbabilityDensityFunction,PDF)来描述其分布。例如,假设我们有一个连续随机变量Y,其概率密度函数为f(y)=2y,其中0=y=1。

3.2示例

importnumpyasnp

importmatplotlib.pyplotasplt

#定义概率密度函数

defpdf(y):

return2*y

#生成y值

y=np.linspace(0,1,100)

#计算对应的概率密度值

density=pdf(y)

#绘制概率密度函数

plt.plot(y,density)

plt.xlabel(Y)

plt.ylabel(Density)

plt.title(ProbabilityDensityFunctionofY)

plt.show()

在概率论中,我们还经常使用累积分布函数(CumulativeDistributionFunction,CDF)来描述随机变量的分布。累积分布函数F(x)表示随机变量X取值小于等于x的概率。

3.3示例

#定义累积分布函数

defcdf(x):

ifx1:

return0

elifx2:

return(x-1)**2

else:

return1

#生成x值

x=np.linspace(0,3,100)

#计算对应的累积分布值

cumulative=[cdf(xi)forxiinx]

#绘制累积分布函数

plt.plot(x,cumulative)

plt.xlabel(X)

plt.ylabel(CumulativeProbability)

p

文档评论(0)

kkzhujl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档