频率分布直方图
频率分布直方图,能清楚显示各组频数分布情况又易于显示各组之间频数的差别。它主要是为了将我们获取的数据直观、形象地表示出来,让我们能够更好了解数据的分布情况,因此其中组距、组数起关键作用。分组过少,数据就非常集中;分组过多,数据就非常分散,这就掩盖了分布的特征。当数据在100以内时,一般分5~12组为宜。
基本信息
- 中文名
频率分布直方图
- 横轴表示
样本数据的连续可取数值
- 纵轴表示
频率除以组距
- 众数
图中最高矩形中点的横坐标
- 学科
数学1
- 外文名
Frequency distribution histogram
基础定义
各组频率之和的值为1,在频率分布直方图中表现为所有矩形的高之和等于1。 各组的平均频率密度是指组频率与组距的比值,是指改组内单位距离上的频率。以平均频率密度为纵坐标,取代频率分布直方图中的频率,所作的统计图称为平均频率密度直方图。 平均频率密度直方图中所有矩形的面积之和等于1.也就是平均频率密度直方图中所有矩形的顶边与直方图两边界边及横轴围成的图形的面积等于1. 当样本量不断增加而组距不断减小,每一组的平均频率密度就非常接近组中值处的频率密度,此时频率密度直方图的矩形顶边就非常接近一光滑曲线,该曲线就是频率密度函数曲线,统计中称这条光滑曲线为总体密度曲线。
应用举例
频率分布直方图能清楚显示各组频数分布情况又易于显示各组之间频数的差别。它主要是为了将我们获取的数据直观、形象地表示出来,让我们能够更好了解数据的分布情况,因此其中组距、组数起关键作用。分组过少,数据就非常集中;分组过多,数据就非常分散,这就掩盖了分布的特征。当数据在100以内时,一般分5~12组为宜。
从频率分布直方图可以估计出的几个数据:
众 数:频率分布直方图中最高矩形的底边中点的横坐标 。
算术平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和。
加权平均数:加权平均数就是所有的频率乘以数值后的和相加
中位数:把频率分布直方图分成两个面积相等部分的平行于Y轴的直线横坐标。
演绎过程
1.找出所有数据中的最大值和最小值,并算出它们的差(极差)。
2.决定组距和组数。
3.确定分点。
4.将数据以表格的形式列出来。(列出频率分布)
5.画频数分布直方图(横坐标为样本资料、纵坐标是样本频率除以组距)。
与频率分布直方图相关的一种图为折线图。我们可以在直方图的基础上来画,先取直方图各矩形上边的中点,然后在横轴上取两个频数为0的点,这两点分别与直方图左右两端的两个长方形的组中值相距一个组距,将这些点用线段依次联结起来,就得到了频数分布折线直方图。