大学应用统计学经典——统计数据的整理和显示课件幻灯片.pptVIP

大学应用统计学经典——统计数据的整理和显示课件幻灯片.ppt

  1. 1、本文档共146页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

应用统计学-31

2

3

4

5

6

分类数据的逻辑检查数值型的数据计算检查7

什么是口径?统计数据的二重性8

9

例3.1表3-1是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,4门课程成绩都高于70分的学生。表3-110

筛选出统计学成绩等于75分的学生。11

12

统计学成绩等于75分的学生。13

筛选出英语成绩最高的前三名学生14

15

英语成绩最高的前三名学生16

筛选出4门课程都大于70分的学生条件区数据区17

18

19

20

4门课程都大于70分的学生21

22

23

例3.(排序)按统计学成绩高低排序24

25

26

27

按统计学成绩高低排序28

广东沿海古海蚀平台的高度2-3m3m2m数据来源:谭惠忠等(1995)(黄海基面)(黄基)1.6m29

30

31

32

33

定义3.1落在某一特定类别(或组)中的数据个数,称为频数(frequency),也称次数。定义3.2把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布(frequencydistribution)。定义3.3一个总体(或样本)中各个部分的数值的比重,称为比例(proportion)。定义3.4将比例乘以100得到的数值,称为百分比或百分数(percentage)。定义3.5总体或样本中各不同类别数值之间的比值,称为比率(ratio)。34

35

36

例3.2(例2.3)37

38

39

40

注意:此处应该是频数41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

例3.3例3.357

58

59

60

61

62

63

定义3.6将各有序类别或组的频数逐级累加起来得到的频数,称累积频数。定义3.7将各有序类别或组的百分比逐级累加起来,称为累积频率或累积百分比。定义3.8根据统计研究的需要,将原始数据按某种标准划分成不同的组别,称为数据分组。定义3.9分组后的数据称为分组数据。定义3.10把一个变量值作为一组,称为单变量值分组。定义3.11将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组。64

定义3.12在组距分组中,一个组的最小值,称为下限(lowlimit);一个组的最大值,称为上限(upperlimit)。定义3.13一个组的上限值与下限值之差,称为组距。定义3.14在组距分组时,如果各组的组距相等,称为等距分组。定义3.15在组距分组时,如果各组的组距不相等,称为不等距分组。定义3.16每一组的下限和上限之间的中点值,称为中值。65

66

最大值最小值最大值67

68

例:以生产零件个数为变量。69

以生产零件个数为变量,变量太多啦!如何区分分类变量和数值变量?70

例:每五隔个零件为一个区间(变量)。71

72

73

74

前组上限不在内第一组下限低于最小变量,最后一组上限高于最大变量。75

连续变量上限值可采用小数点的形式,如109.9976

若最大、最小值与其他数据相差太大,为避免空白组或个别极端值漏掉,可用开口组9416077

组距分组掩盖了各组内的数据分布状况。注意:不等距分组:(1)根据生理成长特点的人口年龄分组0-6岁(幼儿组),7-17(少儿组),18-59岁(成年组),60岁以上(老年组)(2)粒度划分78

频数密度:每一岁有多少人79

80

81

82

83

84

85

宽度没有数值意义长宽都有数值意义86

87

88

89

90

定义3.17直方图是用矩形的宽度和高度(即面积)来表示频数分布的图形定义3.18由“茎”和“叶”两部分组成的、反映原始数据分布的图形,称为茎叶图。91

92

93

“?”表示0-4,“?”表示5-9。105-109110-1146-78-994

例3.495

例3.496

97

接收区域98

99

100

101

102

103

104

105

箱图的制作106

107

108

109

什么是左偏?什么是右偏?110

111

单科最高、最低平均最高、最低集中、离散程度112

113

时间序列线图的制作114

115

116

例3.6117

118

119

120

键入坐标名121

122

雷达图的制作123

124

从图中读出什么信息?125

126

127

例3.7128

129

130

分类131

132

去掉网络线133

134

135

文档评论(0)

book_zhj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8002066073000063

1亿VIP精品文档

相关文档