完整版贾俊平统计学第六版思考题答案解析x

时间:2022-07-30 06:55:13 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。






专业资料



第一章:

1 什么是统计统计学是一门收集、分析、表述、解释数据科学艺术

2 描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方推断统计:研究的是如何利用样本数据来推断总体特征。

3 统计学据可以分成哪几种类型,个有什么特点按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据: 数字尺度测量的观察值, 结果表现为数按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:试验中收集到的数据; 控制条件;自然科学领按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。

4 举例说明总体、样本、参数、统计量、变量这几个概总


体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判样本:从总体中抽取的一部分元素的集参数:用来描述总体特征的概括性数字度量。 (平均数、标准差、比例统计量:用来描述样本特征的概括性数字度量。 (平均数、标准差、比例变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现别或变化。(商品销售额、受教育程度、产品质量等级(对一千灯泡进行寿命测试, 那么这千个灯泡就是总体, 从中抽取一百个进行检测, 百个灯泡的集合就是样本, 这一千个灯泡的寿命的平均

值和标准差还有合格率等描征的数值就是参数, 这一百个灯

泡的寿命的平均值和标准差还有合格率等描述特征值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

5 变量可以分为哪几分类变量:说明事物类别;取值是分类数顺序变量:说明事物有序类别;取值是顺序数值型变量:说明事物数字特征;取值是数值型数变量也可以分为:随机变量和非随机变量;经验变量和理论变量

6 举例说明离散型变量和连续型变离散型变量:只能取有限个、可数值的变量。 (企业个数、产品数连续型变量: 以在一个或多个区间中取任何值的变量。 (年龄、 温度、零件尺寸误差)

7 请举出统计应用的几个例市场调查、人口普查等。


8 请举出应用统计学的几个领社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

精心整理





专业资料





第二章:

1 什么是二手资料?使用二手资料需要注意些什么什么是二手资料:已经存在的;跟研究内容有关的;别人所做的调查或研究;会被我们





利用的,资料。

注意:需要进行评估:考虑原始数据收集人、收集目的、收集途径、收集时间及数据来源。





2 比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。





概率抽样:以一定的入样概率,按照一定的随机性原则选取样本(即样本被选中的概率已知或可计算) 技术含量高、


成本高。





用于描述性、 解释性、推断性研究; 研究目的在于掌握对象总体的数字特征,得到总体参数的置信区间。





非概率抽样:不按照入样概率和随机性原则,而按照方便、滚雪球或配额等抽样形式选取样本;技术含量低、成本低、时效快、操作简便。 用于探索性研究; 研究目的在于发现问题, 为更深入的数量分析提供准备。





下面题目(略)

2.3 除了 自填式 ,面访式 和电话式 还有什么搜集数据的办法 试验式 和观察式

2.4 自填式,面访式和电话式各自的长处和弱点 自填式;优点: 1 调查组织者管理容易 2 成本低,可进行大规模调查 3 对被调查者,可选择

方便时间答卷,减少回答敏感问题压力。缺点: 1 返回率低 2 不适合结构复杂的问卷,调查

内容有限 3 调查周期长 4 在数据搜集过程中遇见问题不能及时调整。

面访式;优点: 1 回答率高 2 数据质量高 3 在调查过程中遇见问题可以及时调整。缺点: 1






成本比较高 2 搜集数据的方式对调查过程的质量控制有一定难度 3 对于敏感问题, 被访者会





有压力。

电话式;优点: 1 速度快 2 对调查员比较安全 3 对访问过程的控制比较容易。缺点: 1 实施

地区有限 2 调查时间不能过长 3 使用的问卷要简单 4 访者不愿回答时,不易劝服。

2.6 如何控制调查中的回答误差 对于理解误差,学习一定的理学知识,记忆误差,缩短所涉及的时间范围,有意识误差,





做好被调查者的心理工作, 要遵守职业道德, 为被调查者保密, 尽量在问卷中不涉及敏感问题。 2.7 怎么减少无回答

对于随机误差, 要提高样本容量,对于系统误差, 只有做好准备工作并做好补救措施。 比如





说要一百份的问卷回复, 就要做好一百二十到一百三十的问卷准备, 进行面访式的时候要尽量的劝服不愿意回答的被访者,以小物品的馈赠提高回复率。




精心整理





专业资料





第三章:

1 数据的预处理包括哪些内容数据审核:从完整性和准确性方面调查原始数据(完整性:单位、个体是否遗漏;准确性:检查错误、异常数据筛选:根据需要找出符合特定条件的某类数据数据排序:按一定顺序将数据排列,体现数据特征或趋势。

2 分类数据和顺序数据的整理和图示方法各有哪分类数据:整理:制作频数分布表,用比例、百分比、比率进行描述性分析。



图示:条形图、帕累托图、饼图。顺序数据::整理:制作

频数分布表,用比例、百分比、比率进行描述性分析。



图示:累积频数、累计频率分布图、环形图、条形图、帕累

托图、饼图。

3 数值型数据的分组方法有哪些?简述组距分组的步分组方法:单变量分组:把每一个变量值做为一组(只适合离散型变量,变量值较少)组距分组:将全部变量值依次划分为


若干区间,一个区间变量值做为一组( 组距分组又分为:等距分组、异距分组 分组步骤: 确定组数 515确定各组组 5 倍数; 组距 >最大变量值 - 最小变量值)根据分组整理成频数分布表。

4 直方图与条形图有何区别1 条形图用于展示分类数据;直方图用于展示数值型数据2 条形图用长度表示个类别频数,宽度固定(无意义) ;直方图用面积表示各组频数长度表

每组频数(或频率) ,宽度为组距(有意义) 3 条形图各

矩形分开排列,直方图各矩形连续排列。 (分组数据具有连

续性)

5 绘制线图应注意哪些问题?

时间在横轴, 观测值在纵轴; 横轴纵轴长度比例大概为 107;纵轴下端一般从 0 开始,数据与 0 距离过大的话用折断符。

6 饼图与环形图有什么不同?饼图:只能绘制一个样本或总体各部分的比例。





条形图:可以同时绘制多个样本或总体各部分的比例。中间有一空洞,每个样本或总体数据表现为一个环。

7 茎叶图与直方图相比有什么优点?他们的应用场合是什么?

茎叶图在给出数据分布情况的同时, 又能给出每一个原始


数据 (保留了原始数据的信息) 直方图用于大批量数据,茎叶图用于小批量数据。 8、鉴别图标优劣的准则有哪些?





显示数据、强调数据间的比较、有对图形的统计描述和文字描述、避免歪曲、把读者注意力集中于数据内容上、服务于一个明确的目的。

8 制作统计表应注意哪几个问题合理安排统计表结构表头一般包括表号,总标题和表中数据的单位等内容;表中的上下两条横线一般用粗线,中间的其他用细线在使用统计表时,必要时可在下方加注释,注明数据来源公式:组中值 =(上 +下限) /2



精心整理



专业资料





第四章:

1 一组数据的分布特征可以从哪进几个方面进行测度可以从以下三方面进行测度:集中趋势:反映个数据向其中心值的靠拢或集中程离散程度:反映各数据远离其中心值的趋势分布形状:数据分布的峰态和偏态;


2 怎样理解平均数在统计学中的地平均数在统计学中具有重要地位:是集中趋势的最主要测度,是一组数据的重心所在;





是数据误差相互抵消的结果, 利用了全部数据信息, 具有无偏性; 只适用于数值型数据,不适用于分类或顺序数据。 3 简述四分位数的计算方法:

四分位数是一组数据排序后处于 25% 75%位置上的值。具体计算方法是: n/4 3n/4 4

对于比例数据的平均为什么采用几何平均对于比例数据采用几何平均比采用算数平均更合理。

n n

1 Gi

i 1

1 G



5 简述众数、中位数和平均数的特点和应用场合。 众数:主要用于分类数据集中趋势的度量;是一组数据的峰值;优点:不受极值的影响。缺点:具有不唯一性;只有数据量较大时才有效中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。平均数:主要用于数值型数据集中趋势的度量;是一组数据的重心所在。

优点:利用了所有数据信息;数据误差相互抵消,具有无偏性;


缺点:易受极值影响;当数据分布偏斜程度较大时代表性差。





6 简述异众比率、四分位差、方差或标准差的应用场异众比率:分类数据的离散程度测度四分位差:顺序数据的离散程度测度方差:数值型数据的离散程度测度 7 标准分数有哪些用途?





标准分数: Xi- /s 即:(变量值减去其平均数) / 标准差标准

分数给出了一组数据中各数据的相对位置(其离平均数的距离用标准差衡量用途:在对多个具有不同量纲的变量进行处理时,要对变量进行标准化处理检查一组数据中是否有离群值。

8 为什么要计算离散系数离散系数 =标准差 / 平均数原因:方差和标准差反映的是数据离散程度的绝对值:一方面,受原变量值自身水平高





低的影响(与变量平均数大小有关) ;另一方面,与原变量值得计量单位有关,计量单位不同,离散程度也不同。因此,为消除变量值水平高低和变量值单位对离散程度的影响,要计算离散系数。

9 测度数据分布形状的统计量有哪些?峰态系数、偏态系数。






精心整理





专业资料



第六章:

1 什么是 量? 什么要引 量? 什么不含任何未知参定 X1,X2?? Xn是从 X 中抽取的容量 n 本,如果由此构造一个函数 T X1,X2?? Xn,不依 于任何未知参数, 称函数 T X1,X2?? Xn)是一个 什么: 了使 推断成 可能。





2 什么是次序 X1,X2?? Xn是从 X 中抽取的容 n 本, X1,X2?? Xn 足如下条件的函数: 每当 本得到一个 x1,x1 ?? xn 其由小到大的排序中第 i x(i) 就作 次序 Xi ,而 X(1),X(2) ?? X(n) 就称 次序 量。 3 什么是充分 加工 程中一点信息都不 失的 量称 充分 量。





4 什么是自由独立 量的个数。

5 述三个重要分布及正 分布 的关系卡 X1,X2, ?? Xn n


Xi~N(0,1)



X=X1^2+?? +Xn^2 服从以 n 自由度的卡方分布F

布: X~X^2(m),Y^2~X^2(n) ,且 X,Y 相互独立,

Z=X/m/Y/n Z~F(m,Z 分布: X~N(0,1),Y~X^2(n) ,且 X,Y 相互独立, T=X/(Y/n)^(1/2), T~t(n)

6 什么是抽 分布 量(随机 量)的概率分布是一种 概率分布。

7 述中心极限定理的意 中心极限定理: 从均 μ,方 o^2 的任意任意 体中抽取 本量 n 本当 n 充分 本均 X 的抽 分布近似服从均 μ,方差 o^2/n 分布。





精心整理





专业资料





第七章:

1 解释估计量与估计值估计量:用于估计总体参数的随机变量。估计值:估计总体参数时计算出来的估计量的具体值。 2 简述评价估计量好坏的标准无偏性:估计量抽样分布的数学期望 =总体参数有效性:对同一参数的两个无偏点估计


量,拥有更小标准差的估计量更有效一致性:随着样本容量的增大,估计量的值越来越接近总体参数。

3 怎样理解置信区间由样本统计量所构造的总体参数的估计区间。

4 解释 95%的置信区间95%的置信区间值通过某种方法构造的估计区间中,有 95%的区间包含总体参数的真值。 5 Za/2 是标准正态分布上侧面积 a/2 z , 公式 统计总体均值时 的边际误差

6 解释独立样本和匹配样本的含独立样本:两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。 (想工人)匹配样本:一个样本中的数据与另一个样本中的数据相互对应。

7 简述样本量与置信水平、总体方差、估计误差的关系样本量越大,置信水平越高,总体方差和估计误差越小。



精心整理





专业资料





第八章:

1 假设检验和参数估计有什么相同点和不同点相同点:是


统计推断的两部分;都运用样本对总体进行推断。不同点:推断角度不同。 参数估计: 用样本统计量估计总体参数,

总体参数估计前未知。 假设检验: 对总体参数提出假设, 样本信息验证假设成立否。

2 什么是假设检验中的显著性水平?统计显著是什么意思?显著性水平:原假设正确时却被拒绝的概率或风险统计显著:指拒绝原假设,即求出的值落在小概率区间上(拒绝域内)

3 什么是假设检验中的两类错α错误(弃真错误) :原假设为真,却被我们拒绝了β错误(取伪错误) :原假设为假,却被我们接受了。

4 两类错误之间存在什么样的数量关在样本量一定的情况下,二者是此消彼长的关系。 5 解释假设检验中的 P 值。

当原假设为真 时所得到的样本观察值或更极端值出现的概率。 (它的大小取决于三个因素,一个是样本数据与原假设之间的差异,一个是样本量,再一个是被假设参数的总体分布。

6 显著性水平与 P 值有何区别 显著性水平:原假设为真时拒绝原假设的概率,即拒绝域,大小由研究者自己决定P 值:原假设为真时所得的样本观察结果或更极端值出现的概率, 是实测的显著性水平。

7 假设检验依据的基本原理是什么?


假设检验基于小概率原理:即小概率事件在一次实验中是几乎不可能发生的,而一旦发生,我们就有理由拒绝原假设。 8 在单侧检验中,原假设和备择假设的方向应该如何确

想收集证据予以支持的假设作为备择假设; 将想收集证据予以否认的假设作为原假设,





同时原假设应基于广泛的社会经验基础。 备择假设的方向与想要证明的正确性的方向一致。备择假设和原假设互斥,且等号总在原假设上。



精心整理



专业资料





1 什么是方差分析?它研究的是什么?方差分析: 体的均 是否相等来判断分 型自 型因 量是否有 著影响。

研究内容:研究的是分 型自 量和数 型因 量之 的关系(有没有影响) 2 多个 体均 是否相等 什么不作两两比 ,而用方差分析方法提高 效率:两两





增加分析可靠性,排除 概率,减少 差。 (多次


增加犯α 的概率)

3 方差分析包括哪些 型?他 有何区 因素方差分析和双因素方差分析。

因素方差分析 : 一个分 型自 一个数 型因 量的影响;双因素方差分析:涉及两个分 型自 量。 4 方差分析中有哪些基本假定正 体;方差 性; 独立 5 方差分析的基本思想。方差分析是通 差来源的分析判 体均 是否相等, 而分析自 量的影响。





6 因子和 理的含因子:也称因素,是 象; 理:也称水平,是因素的不同表 7 差和 差的含 SSE是指每个水平或 的个 本数据与其 平均 的平方和,反映了每个 各的 离散状况





差( SSA)是指各 平均 X i 平均 差平方和,反映 本均 的差异程度 8 内方差和 方差的含

内方差指因素的同一水平 ( 同一个 ) 本数据的方差; 方差指因素的不同水平 ( 不同 ) 下各 本之 的方差。 9 述方差分析的基本步

1提出假 (一般提法形式如下: H0μ 1=μ 2=μ 3=? =μi= ? . μk,自 量没有 著影响 ,


H1μ i (i=1,2,3 ?..,k) 不全相等, 量有 著影响) 2构造 (包括: 算各 本的均 算全部 算各 差平方和, 量)

3 决策。(将 量的 F 定的 著性水平 F 行比 ,作出原假 H0的决策) (F=MSA/MSE)

10 是什么是交互作用交互作用是指几个因素搭配在一起会 生一种新的效 的作用。

11、方差分析中多重比 的作用是什么通 体均 的配 一步 到底哪些均 存在差异。

12、解 无交互作用和有交互作用的双因素方差分析无交互作用双因素方差分析:两个分 型自 于因 量的影响是相互独立的。





有交互作用双因素方差分析: 除了行因素和列因素 数据 独影响外, 两个因素的搭配

生一种新的影响 13、解 R^2 的作用和含



精心整理





专业资料






R SSA(组间 SS



2

SST(总 SS 即关系强度,也就是自变量对于因变量差异的解释程度。





精心整理


本文来源:https://www.wddqw.com/doc/4acb9135a46e58fafab069dc5022aaea998f410f.html