课 题: 1.4总体分布估计 教学目的: 1了解当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布,并会用这两种方式估计总体分布; ⒉了解当总体中的个体取不同数值较多,甚至无限时,可用频率分布表或频率分布直方图估计总体分布,并会用这两种方式估计总体分布 教学重点:用样本的频率分布估计总体分布 教学难点:频率分布表和频率分布直方图的绘制 授课类型:新授课 课时安排:1课时 教 具:多媒体、实物投影仪 内容分析: 统计学中有两个核心问题,一是如何从整体中抽取样本?二是如何用样本估计总体?经过前面的学习,我们已经了解了一些常用的抽样方法.本节课,我们在初中学过样本的频率分布的基础上,研究总体的分布及其估计 教学过程: 一、复习引入: 1.简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样 ⑴用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为程中各个个体被抽到的概率为1;在整个抽样过Nn; ⑵简单随机抽样的特点是,逐个抽取,且N各个个体被抽到的概率相等; ⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.(4).简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样 2.抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本 适用范围:总体的个体数不多时 优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法. 3.随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号; 第二步,选定开始的数字;第三步,获取样本号码 4.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等 ②为将整个的编号分段(即分成几个部分),要确定分段的间NNN(N为总体中的个体的个数,n为样本容量)是整数时,k=;当nnn不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N能被nN整除,这时k=.③在第一段用简单随机抽样确定起始的个体编号l ④按照n事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到获取整个样本) 隔k当①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样; ②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的. ③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样 5.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层 6.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样. 随机抽样、系统抽样、分层抽样都是不放回抽样 7. 分布列: x1 x2 „ xi P P1 P2 „ Pi 分布列的两个性质: ⑴Pi≥0,i=1,2,„; ⑵P1+P2+„=1 ξ „ „ 二、讲解新课: ⒈频率分布表或频率分布条形图 历史上有人通过作抛掷硬币的大量重复试验,得到了如下试验结果: 试验结果 正面向上(0) 反面向上(1) 频数 36124 35964 频率 0.5011 0.4989 抛掷硬币试验的结果的全体构成一个总体,则上表就是从总体中抽取容量为72088的相当大的样本的频率分布表.尽管这里的样本容量很大,但由于不同取值仅有2个(用0和1表示),所以其频率分布可以用上表和右面的条形图表示.其中条形图是用高来表示取各值的频率. 说明:⑴频率分布表在数量表示上比较确切,而频率分布条形图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚.⑵①各长条的宽度要相同;②相邻长条之间的间隔要适当. 试验结果 当试验次数无限增大时,两种试验结果的概率 频率值就成为相应的概率,得到右表,除了抽正面向上(记为0) 0.5 样造成的误差,精确地反映了总体取值的概率分布规律.这种整体取值的概率分布规律通常称为反面向上(记为1) 0.5 总体分布. 说明:频率分布与总体分布的关系: ⑴通过样本的频数分布、频率分布可以估计总体的概率分布. ⑵研究总体概率分布往往可以研究其样本的频数分布、频率分布. 2.总体分布:总体取值的概率分布规律 在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布 一般地,样本容量越大,这种估计就越精确 3.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线. 频率/组距总体密度曲线单位Oab 它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积. 三、讲解范例: 例1.为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下(单位:kg) 56.5 72 62 55 64 76 68.5 57 59 65.5 69.5 73.5 68.5 72 70.5 71 64 69.5 65.5 58.5 65 56 62.5 66.5 57 66 55.5 74 62.5 67.5 61.5 67 66 74 62.5 63.5 72.5 64.5 69.5 70.5 64.5 70 59.5 63 65 56 66.5 59 72 65 66.5 57.5 63.5 60 69 59.5 68 61.5 64.5 66 64 65.5 64.5 55.5 71.5 63.5 76 67 75.5 66.5 64.5 68 67.5 70 73 65 57.5 68 68.5 70 76 71 73 64.5 62 70 60 63.5 64 63 58.5 75 68 58 58 74.5 71.5 58 62 59.5 试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计 解:按照下列步骤获得样本的频率分布. (1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76—55=21)所得的差告诉我们,这组数据的变动范围有多大. (2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数适合的.于是组距为2,组数为11. (3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是 [54.5,56.5),[56.5,58.5),„,[74.5,76.5). (4)列频率分布表,如表① 频率分布表 分组 [54.5,56.5) [56.5,58.5) [58.5,60.5) [60.5,62.5) [62.5,64.5) [64.5,66.5) [66.5,68.5) [68.5,70.5) [70.5,72.5) [72.5,74.5) [74.5,76.5) 合计 频数累计 频数 2 6 10 10 14 16 13 11 8 7 3 100 频率 0.02 0.06 0.10 0.10 0.14 0.16 0.13 0.11 0.08 0.07 0.03 1.00 (5)绘制频率分布直方图.频率分布直方图如图所示 频率/组距54.556.558.560.562.564.566.568.570.572.574.576.5体重 由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们起着相互补充的作用. 在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在(64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5kg的学生较少,约占8%;等等 例2.对某电子元件进行寿命追踪调查,情况如下: 寿命(h) 100~200 个数 20 200~300 30 300~400 80 400~500 40 500~600 30 出频率分布表; (2)画出频率分布直方图和累计频率分布图; (3)估计电子元件寿命在100h~400h以内的概率; (4)估计电子元件寿命在400h以上的概率; (5)估计总体的数学期望值 频率解:(1) 寿命 频数 频率 0.1 0.15 0.40 0.20 0.15 1 累计频率 0.10 0.25 0.65 0.85 1 组距100~200 20 200~300 30 300~400 80 400~500 40 500~600 30 合计 200 100 200 300 400 500 600 频率分布直方图 寿命 (2)频率分布直方图如右和累计频率分布图如下 累计 频率 1 0.80 0.60 0.40 0.20 0.10 0 100 200 300 400 500 600 寿命 (3)频率分布图可以看出,寿命在100h~400h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100h~400h的概率为0.65 (4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为 0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35 (5)样本的期望值为 1002002003003004004005000.100.150.400.2022225006000.151537.51409082.53652所以,我们估计总体生产的电子元件寿命的期望值(总体均值)为365h 四、课堂练习: 1 . 为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品14件. ⑴列出样本频率分布表; ⑵画出表示样本频率分布的条形图; ⑶根据上述结果,估计此种商品为二级品或三级品的概率约是多少? 解:⑴样本的频率分布表为 产品 一级品 二级品 三级品 次品 频数 5 8 13 4 频率 0.17 0.27 0.43 0.13 ⑵样本频率分布的条形图如右: ⑶此种产品为二极品或三极品的概率为0.27+0.43=0.7 2. 如下表: 分 组 [10.75,10.85) [10.85,10.95) [10.95,11.05) [11.05,11.15) [11.15,11.25) 频数 3 9 13 16 26 频 率 分 组 [11.25,11.35) [11.35, 11.45) [11.45, 11.55) [11.55, 11.65) 合 计 频数 20 7 4 2 100 频 率 ⑴完成上面的频率分布表. ⑵根据上表,画出频率分布直方图. ⑶根据上表,估计数据落在[10.95,11.35)范围内的概率约为多少? 答案:⑴⑵略. ⑶数据落在[10.95,11.35)范围的频率为0.13+0.16+0.26+0.20=0.75 ∴ 落在[10.95,11.35)内的概率约为0.75 五、小结 :用样本的频率分布估计总体分布,可以分成两种情况讨论: ⒈当总体中的个体取不同数值很少(并不是总体中的个数很少)时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图; ⒉当总体中的个体取不同值较多、甚至无限时,对其频率分布的研究要用到初中学过的整理样本数据的知识. 它们的不同之处在于:前者的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来表示取各个值的频率;后者的频率分布表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率 六、课后作业: 七、板书设计(略) 八、课后记: 本文来源:https://www.wddqw.com/doc/8ad174e5d938376baf1ffc4ffe4733687e21fc8a.html