频数分布
是一种组织好的关于位于测量量表每个类别上的个数数目的数据表。
下面这些规则可以帮助你构造一个分组频数分布表。
- 分组频数分布表应该具有大约10个组距。
- 每个区间的宽度应为相对简单的数字。
- 每个组距的最小数值应为宽度的倍数。
- 所有区间应具有相同宽度。它们应该无间断无重复地涵盖所有数值,使得任意特定数值都恰好只属于一个区间。
为了构造一个直方图,首先将数字(测量类别)沿X轴列出,然后画出位于每个X值上的一个矩形,使得:
- 矩形的高度对应每个类别的频数;
- 矩形的宽度为每个类别的实限。
由于矩形的宽度为每个类别的实限,相邻的矩形将连在一起,中间没有空隙或间隔。
修正的直方图
:对传统直方图的轻微改动使得频数分布更容易理解。在修正的图中,代替每个分数中的矩形的是一摞方块,每个方块代表一个个体。因此,在每个分数上,方块数目与这个分数中的频数相对应。
为了构造一个折线图,首先将数字(测量类别)沿X轴列出,然后,
- 每个坐标的中心上方有一个点,它的垂直位置对应这这一类别的频数;
- 点和点之间的连续线段将这一系列点连在一起;
- 最后,在分数全距的两段各画一条直线与X轴相交(零频数)。这两条线与X轴的交点通常使得一个低于分数的类别在交点左侧,另一个高于最高分数的类别在交点右侧。
折线图可以被用于用组距分组的数据。对于一个分组分布,你将每个点直接画在组距的中点处,这个中点可以通过将区间的最大值与最小值取平均值得到。
除了相邻矩形间留有空隙外,柱形图基本上与直方图相同。对于一个称名量表,矩形间的空隙强调了量表是由分开的不同的类别组成的。对于顺序量表,使用分开的矩形是因为我们不能假定所有类别的大小都相同。
当你能得到一个总体中每个分数的确切频数时,就可以构建与样本的频数分布图相同的直方图、折线图或是柱形图。
相对频数
:虽然通常我们不能得出总体中的每个分数的具体频数,但是,你通常可以得出相对频数。(图2.8)
平滑曲线
:当一个总体由等比量表的数字分数构成时,习惯上用平滑曲线代替直方图或折线图中的阶梯状或锯齿状。平滑曲线显示了我们并非将一系列点连在一起(真实频数),而是将从一个分数至另一个分数的相对变化展示出来。(图2.9)
在一个对称分布
中,可以通过中心画一条垂直线使得分布的一侧为另一侧的镜像。
在一个偏态分布
中,分数倾向于堆积在量表的一端并向另一端逐渐变细。分数逐渐向分布的一端变细的部位被称为分布的尾
。
尾在右侧的偏态分布被称为正偏态分布
,因为尾指向X轴的正方向(大于0)。如果尾指向左侧,则这个分布被称为负偏态分布
。
一个特定分数的等级
或百分等级
被定义为分布中分数低于或与特定分数相等的个体的百分率。
当一个分数被它的百分等级确认时,这个分数被称为百分位数
。