- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
AppendixA概率论统计学复习.
概率论统计学复习
摘要:本课程要求学生具有微积分、概率论和线性代数的基础。本章只对其中概率论统计学的重要概念进行简单的复习。
阅读材料: Wooldrige的Appendix A、B、C
1、概率论的复习
在现实生活中,我们常常遇到许多事先不能确定结果的现象,例如抛硬币,抛之前无法确定是正面还是负面。世界的许多方面都存在随机性,所谓“随机性”就是事前无法知道结果,而一旦被揭示就会取定一个实现值,概率理论提供了有用的数学工具对随机性进行描述和定量分析。
1.1 随机变量与概率分布
样本空间
所有可能结果组成的集合,通常记为;在样本空间的每一个可能结果称为基本事件,记为?。
随机变量
定义在样本空间上的单值函数,即?(?),通常简化为?。
事件
样本空间的一个子集,即一个可能结果或多个可能结果组成的集合就称为随机事件,简称事件。样本空间是其本身的子集,称为必然事件;空集?也是的子集,称?为不可能事件。
通常用随机变量的取值或者取值范围表示随机事件,例如{}。
概率
描述事件发生可能性大小的数量指标。事件A的概率记为P(A)。
通常研究随机变量各种取值情况的概率。随机变量的全部概率特征称为随机变量的概率分布。
离散随机变量的概率分布
通常用一个二维表格直观描述离散随机变量X的概率分布
X … P …
其中,
伯努尼分布
连续随机变量的概率分布
用密度函数描述;
累计分布函数 ;
概率分布的数字特征
期望 记为或
对于离散变量,;
对于连续变量,。
方差 记为或
运算规则:给定任意常数,;.
标准差 或
矩 称为变量X的阶矩,时就是X的期望。
1.2 联合分布、条件分布与独立性
本课程的计量经济学以客观经济系统中具有随机性质的经济关系为研究对象。;
X的边际密度函数定义为;
Y的边际密度函数定义为。
注意:如果是离散变量,则积分变为求和,密度函数变为离散变量的概率分布即可。
条件分布
给定X,Y的条件密度函数定义为;同理给出X的条件密度函数。
独立性
若,那么称这两个变量独立。
联合分布的数字特征
协方差用于度量两个变量的线性相关程度,记为或;
.
意味着两个变量同方向变动,称之为正相关;
称之为负相关;
称之为不相关。
相关系数 ;.
如果独立,那么,.
条件分布的数字特征
条件期望(重点!!)
协方差和相关系数衡量的是两个随机变量之间的线性相关关系,两个变量在协方差和相关系数的定义公式中是对称的。在经济学研究中,我们更感兴趣的是用一个变量X去解释另一个变量Y;而且Y和X的关系很有可能是非线性的。在前面已经引入了“给定一个变量X,Y的条件密度函数”的概念,从条件分布我们可以知道变量X的变动如何影响变量Y的分布。然而,研究变量的分布很复杂,一个好的办法就是用一个简单的数字特征——“给定X,Y的条件期望”来总结出这个分布。条件期望在现代计量分析中扮演了一个很重要的角色,本课程的全部内容都是讲解如何在条件期望上进行系数估计和假设检验。
给定X,Y的条件期望定义为 .
条件期望的性质:
1)对于任意的函数,;
2)对于任意的函数和,;
3)若X和Y独立,那么;
4)若,那么
5)若以及某一函数有,那么
;;
其中
6)(迭代期望法则,LIE)
.
条件方差
如果X和Y独立,那么.
1.3 各种常见分布
正态分布
通常记为x??(?,?),其密度函数为;
令,那么服从标准正态分布?(0,1),
卡方分布
假设n个变量Xi?N(0,1),那么;
t-分布
假设两个独立的随机变量Z?N(0,1), y? ,那么
F-分布
假设和是两个独立的卡方分布,那么
3、统计学的复习
3.1 基本概念
总体、参数、随机样本
所谓总体就是一个随机变量X(或一个随机向量);X的分布函数通常记为;其中就是待估计的参数。在计量经济学中,也称数据生成过程。
在进行n次重复独立实验后,得到总体X的n个观察值,而在实验之前,实际上是相互独立均与总体X同分布的n个随机变量。称为总体X的容量为n的简单随机样本,简称样本;称为样本的观察值,简称样本值。
统计量
如果是的连续函数,且其中不含有任何未知参数,则称为一个统计量。常见的统计量有:
样本均值 ;
样本方差;
样本标准差;
样本k阶原点矩 ;
样本k阶中心矩。
假设,,是某个X和Y联合分布的样本,那么
样本协方差
样本相关系数
注意! 相关系数只衡量了X和Y的线性关系,不能反映非线性关系。可以先用散点图观察两者的大概关系。
图1 图2
图3 图4
文档评论(0)