《统计基础知识》第二章统计数据的采集与整理(下)
二、统计数据的整理
(一)统计整理的意义
统计整理就是根据统计研究的目的,对调查得来的原始资料进行科学地加工,使之系统化、条理化,从而得出反映总体特征的综合资料的工作过程。
统计整理是整个统计工作的中间环节,起着承上启下的作用,它是统计调查的继续和深化,又是统计分析的基础和前提。
(二)统计整理的步骤
1.设计方案
2.资料审核
3.资料分组
4.资料汇总
设计方案和资料审核上整理的前提,统计分组是统计整理的关键,统计汇总是统计整理的中心,统计表和统计图是统计整理的结果。
(三)统计分组
1. 统计分组的概念
统计分组就是根据统计研究的需要,将统计总体按一定的标志区分为性质不同的若干个组成部分的一种统计分析方法。
统计分组有两层含义:对总体而言,是“分”,对总体单位而言,是“组”。统计分组是在统计总体内部进行的一种定性分类。
2.统计分组的作用
( 1)划分现象的类型
( 2)反映现象的内部结构
( 3)研究现象间的依存关系
3.分组标志的选择
正确选择 分组标志是统计分组的关键问题。分组标志是将总体分为各个性质不同的组的标准或依据。选择分组标志必须遵循下列原则:
( 1 )根据统计研究的目的选择分组标志
( 2 )选择能够反映现象本质特征的标志作为分组标志。
( 3 )考虑现象所处的具体历史条件和经济条件。
4.统计分组的方法
统计分组可按品质标志分组,也可按数量标志分组。例如:人口总体可按性别分组,也可按年龄分组等。
(四)次数分布
1.次数分布的概念
在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位在各组间的分布,称为次数分布。分布在各组的单位数称为次数或频数。各组次数与总次数之比称为比率或频率。将各组组别与次数依次编排而成的数列就叫次数分布数列,简称为分布数列或称为分配数列。
2.次数分布的特征
由于社会经济现象的性质不同,各种统计总体都有不同的次数分布形式。概括起来,社会经济现象的次数分布主要有三种类型:钟形分布、U形分布和J形分布。
(1)钟形分布。
钟形分布的特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图如一口古钟 (如图1)。社会经济现象中的许多变量分布属于这种分布类型。例如农作物的单位面积产量、学生的学习成绩、商品的市场价格等。
(2)U形分布
U形分布的特征是“两头大,中间小”,即靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,形似“U”字。(如图2)。例如:由于人口总体中幼儿和老年人死亡人数较多而中年人死亡人数较少,所以人口死亡率按年龄分布就是U型分布。
(3)J形分布
有些社会经济现象的总体分布呈 J形。即次数随着变量值的增大而增加。如果次数随着变量值的增大而减少,又称为反J形分布(如图3)。例如人口总体按年龄大小的分布就属反J型分布。

( 图 1) 钟形分布 ( 图 2)U 形分 ( 图 3)J 形分布
3.变量数列的编制
分布数列按选择分组的标志的不同,可分为品质数列和变量数列两种。品质数列是按品质标志分组形成的分布数列。如从业人员按三次产业的分组数列就是品质数列。变量数列是按数量标志分组形成的分布数列。如某村农民家庭按儿童人数的分组数列就是变量数列。品质数列由用文字表示的各组名称和频数组成。变量数列由变量和各组频数组成。变量数列可分为单项数列和组距数列。单项数列是指以一个变量值为一组编制的变量数列。组距数列是以变量值的一定范围为一组编制的变量数列。
在组距数列中,每组两端的数值称为组限,其中最大值叫上限,最小值叫下限。上下限齐全的组,叫闭口组,上下限不齐全的组,叫开口组。每组的最大值与最小值之差称为组距。各组组距都相等的数列称为等距数列,各组组距不相等数列称为异距数列。开口组的组距等于其最邻近的那一组的组距。在连续数列中,相邻两组的上、下限必须重合。当某一单位的变量值刚好等于某一组的上下限时,把它放入作为下限的那一组,即上限不在内。每组的中点数值称为组中值。单位组距内分布的次数称为次数密度。
(五)统计表
1.统计表的概念
统计表是统计资料的一种重要表现形式。广义的统计表包括统计工作各阶段所用的一切表格。狭义的统计表是表现统计整理结果的表格。
2.统计表的构成
( 1 )统计表从形式上看,由总标题、横行标题、纵栏标题和数字资料四部分组成。
总标题,即统计表的名称,简要说明表中全部统计资料的内容,一般写在统计表的上端中部。
横行标题是横行的名称,通常表示调查单位或组的名称。它代表统计表所要说明的对象,一般写在表的左方。
纵栏标题是纵栏的名称,通常表示统计指标的名称。一般写在表的上方。
数字资料,即指标数值,位于横行标题和纵栏标题的交叉处。
( 2)统计表从内容上看,由主词和宾词两部分组成。
主词是指统计表所要说明的总体,它可以是各个总体单位的名称,总体的各个组或总体单位的全部。
宾词是说明总体的统计指标,包括指标名称和指标数值。
3.统计表的种类
( 1)按作用或用途不同可分为调查表、汇总表(整理表)和分析表。
( 2)统计表按主词是否分组及分组的程度不同可分为简单表、分组表和复合表。
简单表是对总体未经任何分组的统计表。可按总体单位的名称排列或按时间顺序排列。
分组表是对总体按一个标志分组的统计表。按两个或两个以上的标志进行分组平行排列而成的表也是分组表。复合表是对总体按两个或两个以上的标志层叠起来进行分组形成的统计表。
文章评论
共有 0 位网友发表了评论 此处只显示部分留言 点击查看完整评论页面