统计学完整版

时间:2022-04-28 17:28:13 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
1.什么是统计统计活动,收集数据的活动;统计资料,统计工作的成果;统计学,分析数据的方法和技术,搜集、整理、分析和解释数据的科学四个方面:1.数据搜集:

取得数据2.数据整理:处理数据3.数据分析:探索数据规律4.数据解释:结果的说明 2.总体:统计调查对象的全体,即所研究的全部个体(数据) 的集合。按其个体能否计数分为可计数总体和不可计数总体。可计数总体:其个体具有相同的计量单位,可以计算总体单位总数,也称为简单现象总体。不可计数总体:其个体具有不同的计量单位,不可计算总体单位总数,也称为复杂现象总体。总体的性质:同质性,大量性,差异性。总体单位:构成统计总体的个别事物称为统计总体单位。总体与总体单位的关系:总体和总体单位的具体形式随着统计研究目的的不同而不同。总体和总体单位的关系不是一成不变的,随着研究目的的变动,两者可以相互转化。4.样本:按照一定的概率从总体中抽取的一部分个体的集合。构成样本的个体的数目称为样本容量。样本具有随机性 ,即样本不具有唯一性。5.标志 标志是指说明总体单位特征的名称,标志的具体表现称为标志表现。按反映总体单位特征分为品质标志和数量标志。品质标志:总体单位属性特征。数量标志:总体单位数量特征。6.数据的计量尺度:定类尺度,定序尺度,定距尺度,定比尺度。①定类尺度:也称名义尺度或分类尺度;计量层次最低;对事物进行平行的分类;各类别可以指定数字代码表示;使用时必须符合类别穷尽和互斥的要求;数据表现为类别;具有=数学特性2定序尺度:也称顺序尺度;对事物分类的同时给出各类别的顺序;比定类尺度精确;未测量出类别之间的准确差值;数据表现为类别,但有序;具有><数学特性。3定距尺度:也称间隔尺度;对事物的准确测度;比定序尺度精确;数据表现为数值;没有绝对零点;具有+-数学特性。4定比尺度:也称比率尺度;对事物的准确测度;与定距尺度处于同一层次;数据表现数值;有绝对零点;具有数学特性。7.数据类型:分类数据(定类),顺序数据(定序),数值数据(定距、定比)8统计数据调查组织方式:普查、抽样调查(最重要)、统计报表、重点调查、典型调查。9.统计数据的误差:登记性误差(人为造成,可避免) 代表性误差(客观存在,可以控制。不能完全消除)(简答)数据的统计质量标准:精确性,准确性,关联性,及时性,一致性,经济性(低成本性)10分组概念:根据统计研究目的和任务的要求,选择合理的分组标志(一个或几个)将总体划分为若干组成部分的统计方法。双重含义:分组原则:穷尽原则:互斥原则。分组种类:标志性质(品质分组、数量分组);标志多少(简单分组、复合)。分类数据和顺序数据主要是作定性分类整理。对数值型数据则主要是作定量分组整理。11.组距:上限与下限之差。12.组中值:下限与上限之间的中点值,它代表该组变量值的一般水平,它的前提条件是:组内单位的分布是均匀的。13.组距分组:需要遵循不重不漏的原则;灵活使用开口组;可采用等距分组,也可采用不等距分组。14频数:分布在各类别中的数据个数。15、频率:某一类别数据个数占全部数据个数的比值。16累积频数:各类别频数的逐级累加。包括向上累积和向下累积两类。17累积频率:各类别频率(百分比)的逐级累加。包括向上累积和向下累积两类。18.统计表分几部分、画图原则、设计:设计:合理安排统计表的结构;总标题内容应满足3W 要求;数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明;表中的上下两条横线一般用粗线,其他线用细线;通常情况下,统计表的左右两边不封口;表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一;对于没有数字的表格单元,一般用“—”表示;必要时可在表的下方加上注释。(简答)条形图,直方图的特点、区别与联系1.条形图:用宽度相同的条形的高度或长短来表示各类别数据的图形。有单式条形图、复式条形图等形式。特点:主要用于反映分类数据的频数分布。绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。2.直方图:在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布即直方图。直方图下的总面积等于1区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(示类别)则是固定的。2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。3.直方图的各矩形通常是连续排列,条形图则是分开排列。4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据。19数据分布特征的测度:1集中趋势:众数、中位数、平均数。2离散程度:异众比率、四分位差、方差和标准差、离散系数。3分布的形状:偏态、峰态。算术平均数=总体标志总量÷总体单位总量 1.指标(统计指标)是说明现象总体数量特征的概念及其数值。 2. 构成要素 实践中有六个要素构成:指标名称、指标数值、时间限制、空间范围、计算方法、计量单位,其中前两者是最基本的构成部分。3. 特点:总体性;数量性;具体性 。指标与标志两者的主要区别是:1)说明的问题不同:标志是说明总体单位特征的,指标是说明总体特征的;2)表现形式不同:标志中的数量标志可以用数值表示,而品质标志不能用数值表示,所有的统计指标都是用数值表示的。两者的主要联系是:有些统计指标的数值是在总体单位的数量标志值基础上直接汇总得到的;而有的则通过归类整理得到。在一定条件下(研究目的的调整),指标和标志之间可以相互转化。 统计指标按其所反映的内容或其数值表现形式,分为总量指标、相对指标和平均指标。 总量指标是反映总体规模的统计指标,通常以绝对数形式表现,故又称其为绝对数。 相对指标是两个绝对数之比,亦称为相对数。 平均指标又称为平均数或均值,它所反映的是现象在某一空间或时间上的平均数量状况。 统计指标体系是指由若干相互联系的统计指标构成的有机整体。2. 表现形式:1数学等式关系(2)相互补充关系。3. 设计指标体系的基本要求:1科学性(2)目的性(3)全面性(4)统一性(5)可比性(6)核心性(7)可行性(8)互斥性 普查是指为特定目的专门组织的非经常性全面调查 2.通常是一次性或周期性的 3.一般需要规定统一的标准调查时间 4.数据的规范化程度较高 5.应用范围比较狭窄 抽样调查1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。2. 具有经济性、时效性强、适应面广、准确性高等特点 3.具体问题研究见第五章 统计报表1. 统计调查方式之一2.过去曾经是我国主要的数据收集方式3.按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据4.有各种各样的类型 典型调查是指从全部总体单位中选择一个或几个有代表性的单位进行深入细致的调查。所选择的典型单位应能反映所研究问题的本质属性或特征 3.典型调查主要用于定性研究,调查结果一般不能推断总体。登记性误差是指调查过程中由于人为因素造成的误差,存在于所有的调查之中。概率抽样,非概率抽样,全面性调查

有抽样框误差、回答误差、无回答误差、调查员误差、测量误差。代表性误差由于抽样的随机性所带来的误差。所有样本可能的结果与总体真值之间的平均性差异 影响抽样误差大小的因素 样本量的大小 总体的变异性。统计数据的质量要求:精确性(精度);准确性;关联性;及时性;一致性;经济性(低成本性) 分组概念:根据统计研究目的和任务的要求,选择合理的分组标志(一个或几个)将总体划分为若干组成部分的统计方法。 双重含义:“分”与“合” 2.分组原则:穷尽原则,互斥原则。3.分组目的:组内单位的同质性;组间单位的差异性。数据分组的作用:区分事物的类型 例:将我国企业进行分组,就可以有效地区分它们在所有制方面的区别 研究统计总体的结构 例企业根据职工文化程度不同分组,以便根据不同文化层次分期分批培训 反映现象之间的依存关系 单变量值分组(要点)组距分(要点)将变量值的一个区间作为一组,适合于连续变量,适合于变量值较多的离散变量 组距分组(几个概念)1.下限:一个组的最小值 2.上限:一个组的最大值 3.组距:上限与下限之差 4.组中值:下限与上限之间的中点值,它代表该组变量值的一般水平,它的前提条件是:组内单位的分布是均匀的。 统计图—条形图是指用宽度相同的条形的高度或长短来表示各类别数据的图形。有单式条形图、复式条形图等形式,主要用于反映分类数据的频数分布。绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。 统计图—直方图是指用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布。在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图。直方图下的总面积等于1 统计图—直方图(直方图与条形图的区别)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的

直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。直方图的各矩形通常是连续排列,条形图则是分开排列。条形图主要用于展示分类数据,直方图则主要用于展示数值型数据 众数、中位数和均值的关系:众数不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用。中位数不受极端值影响,数据分布偏斜程度较大时应用,均值,易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用。 假设检验步骤的总结 设立零假设H0和备择假设H1;选择统计量,计算被检验的实际统计量之值;确定统计量的抽样分布;确定显著性水平,根据显著性水平确定临界值;根据临界值(或者p值),确定检验准则,即给出拒绝域和接受域;将计算的被检验实际统计量之值与临界值比较(或者根据p值大小判断),从而判定接受或拒绝零假设,完成统计假设检验。 总体均值的检验(t-检验)1.假定条件,总体服从正态分布,检验统计量。2 未知:




本文来源:https://www.wddqw.com/doc/09f36954783e0912a3162a0f.html