社会统计资料的整理

时间:2023-02-17 14:22:12 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
第三章 社会统计资料的整理



原始资料杂乱无章,需加整理,才能为人所用。统计资料的整理,其基础是统计分组。所谓统计分组.就是按统计研究的目的和要求,将总体单位或全部调查数据按一定的标志划分成若干组,使组内差异尽量小,而组与组之间则有明显差异,从而使原本杂乱无章的资料有序化,以便为在统计分析中提炼各种有用信息打下基础。



第一节 统计分组的原则与标准



统计分组的标志分为数量标志和品质标志两大类。按国际惯例,无论采用何种标志进行统计分组,都应遵循以下一般原则:(1)分组应使各类别构成之和等于总体;2)分组设计应能反映统计总体的分布规律性。

在统计资料搜集的基础上,按分组原则,将总体中所有单位依一定顺序归类整理,即可得到能够表明总体单位总数在各组分配情况的频数(或次数)分布数列,简称数列。频数分布数列是统计分组工作的产物。显然,按品质标志进行分组,我们可以得到品质数列;按数量标志进行分组,我们可以得到变量数列。

统计分组的关键在于选择分组标志和划分各组界限。一般来讲,按品质标志来分组,差别比较明确,区分也较容易。按数量标志来分组则不同,对于划分各组界限,变量数列有较大的任意性。如果划分不当,不仅容易混淆各组的差别,也可能无法反映变量的分布特征。在统计整理和统计分析中,广泛应用变量数列,借以观察某一数量标志的变动及其分布状况。因此,如何编制变量数列是我们重点需要掌握的。

第二节 统计表

统计调查搜集来的资料往往是没有次序的原始资料,使原始资料有序化,列表和作图是两种基本方法,得到的分别就是统计表和统计图。变量数列是统计表的一种常用形式。 1.统计表的格式、内容与种类

统计表是表示统计资料的表格,在由横行、纵栏交叉结合而成的表格上,它能系统地组织和合理地安排大量数字资料。统计表的主要功用是汇总和积累统计资料,以简捷和有条理的方式表示统计资料的特征,从而使统计资料易于查对、比较、分析和记忆。

统计表通常有一定格式:总标题、横行标题(表侧)、纵栏标题(表头)、统计数值(表身) 统计表从内容上看,是由主词和宾词两部分构成的。主词是统计表所要说明的对象,它可以是总体各单位的名称、总体的各个组或总体单位的全部。宾词是用来说明主词的标志和标志(或指标名称和指标数值)。主词通常列于表的左瑞,宾词通常列于表的上端。但有时为了编排合理和阅读方便,也可以互换位置,将主词置于表的上端,将宾词置于表的左瑞。

1


统计表的种类是按主词和宾词交叉划分的。统计表按主词是否分组以及分组的程度,分为简单表、简单分组表和复合分组表。统计表按宾词如何表达和配置,可分为简单设计两种。

2.统计表的制作规则

第三节 变量数列的编制

在社会统计学中,总体中各单位的分布特征首先是用统计表来表示的。能够表示变量分布及其特征的统计表,即变量数列。它的编制,在社会统计资料的整理中有特殊的意义。 变量数列有两个构成要素;①变量值——用来分组并按大小顺序排列的数量标志的具体数值,用符号Xi表示;②频数——总体单位在各组中出现的次数,用符号fi表示。将各组频数除以总体单位总数N(也称总体容量),就得到相对频数,简称频率.用符号Pi表示。用频率也可以将变量分布的状况清晰地表示出来。

变量数列的编制比较复杂,这不仅因为划分各组界限有较大弹性,而且因为因变量有离散变量和连续变量之别,需分别加以讨论。 1.对于离散变量

离散变量所描述的对象的数量特征,可以按一定次序列出它的整数值,相邻两变量值不会出现小数.因而能编制出单项式和组距式两种变量数列。所谓单项数列,是指数列中每一个变量值一组,有几个变量值就有几组;所谓组距数列,是指数列中每一组由两个变量值的一个差值范围来表示。

首先,离散变量的整数值如果变动幅度较小,可以将每一个变量值列为一组,编制单项数列。其次,离散变量的整数值如果变动幅度较大,而且总体单位数N又很大,则要编制组距数列。组距数列又有等距和异距两种。组距数列的首组和末组还有开口组和闭口组之别。

对离散变量编制组距数列的具体做法是:在变量值变动的最大范围内,将全部变量值依次划分为几个区间,一个区间内的所有变量归为一组。

变量值变动的最大范围称为全距(R;区间距离(hi)称为组距;组距两端的数值称为组限;上限与下限之差就是组距;上限和下限之间的中点数值(mi)称为组中值。 2.对于连续变量



2


本文来源:https://www.wddqw.com/doc/2772f966590216fc700abb68a98271fe900eaf01.html