小编整理:
次数分布表是一种用于统计数据的表格,它通过将数据划分到等距的分组区间中,将数据按照其数值大小列入各个相应的组别中,以便更好地理解和分析数据。这种表格可以展示数据的分布情况,
帮助人们发现数据的一些规律和特征。次数分布图则是一种更直观的展示方式,包括直方图、次数多边形图和累加次数分布图等,它们可以更清晰地显示数据的分布情况。这些方法被广泛应用于统计学、社会学、医学等领域,帮助人们更好地理解和分析数据。
次数分布表
次数分布表指对于一组大小不同的数据划出等距的分组区间(称为组距),然后将数据按其数值大小列入各个相应的组别内,便可以出现一个有规律的表式。次数分布图有直方图、次数多边形图及累加次数分布图等。 编制步骤
求全距
全距指最大数与最小数之间的差距。从被分组的数据中找出具有最大值与最小值的两个数据,然后从最大值的数据中减去最小值的数据,所得差数就是全距。决定组数与组距组距是指每一组的间距,用符号i表示。组距经常用2、3、5、10、20等数值表示。组数分组数目要看数据的多少,如果数据个数在100个以上,习惯上一般分10—20组,常取12—16组。如果数据的总体分布为正态,可用下面的经验公式计算组数(K),这样可使分组满足渐近最优关系。i=全距/K,为了分组方便,常取上述的一些正整数,这势必影响分组多少。一般说来,分组数目或组距小有变化时,对次数分布表作用的显示和计算的准确性,不产生很大影响。因此对组数与组距并不要求严格界定。分组多少与哪些因素有关?我们应该如何掌握它的标准?一般说来,分组的数目多,则组距小,计算精确。但它要求总的数据量大,否则会出现有的组距内无次数分布的现象,那将使整个数据的分布规律显示不明显,也就不能发挥次数分布表的作用了。如果分组少,组距就大,计算简单,但引进计算误差较大。因此,要做到既不增加搜集数据的工作量,又能使分组后的计算精确到最大限度,那么,按上述公式分组,是一个较好的方法。列出分组区间分组区间又称为分组阶段。列分组区间要注意以下几点:最高组区间内应能包含最大值的数据,最低组区·间应能含最小值的数据。最高组或最低组的下限最好是组距i的整数倍。这样便于确定各区间的下限与上限,减少计算。各分组区间的排列顺序,一般按纵坐标单位顺序排列,即数值大的分组区间排在上面。数值小的分组区间排在下面。为了书写方便,各分组区间只写下限的数值,然后在右侧画一横线,而且一般用整数。例如,分组区间可写为10—,20—,30—,40—等,但我们必须明确,实际上各组的精确界限应是9.5—19.499,19.5—29.499,29.5—39.499,在登记次数时,一定要按精确限划分数据的组别。登记次数依次将数据登记到各个相应的组别内,一般用划线记数()或写正字的方法。为确保登记准确,第一次登记后需再核实登记一次。计算次数(f)各组的次数计算好后,还要计算总和即总次数。一是为了以后计算的需要,二是为了核对各组总和与数据的总数(N)是否相等。抄录新表登记核实后,重新制表,这个新表应有以下栏目:一栏为分组区间、二栏为组中值,各分组区间组中值的计算是精确下限加上组距i的二分之一。或精确下限与精确上限之和的一半。三栏为次数(f),四栏为相对次数,可用百分次数、或频数比率(f/N),这一栏有时可不用列出。这样整理的统计表就是次数分表。意义及缺点 编制次数分布表是对数据进行分类整理的一个很重要的步骤,它可将一堆杂乱无序的数据排列成序,这个表可告诉我们:大小数据的次数是多少,其分布情况如何。同时次数分布表还可显示这一组数据的集中情况(平均值大约在78-80之间)及差异情况等。次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。 类型
次数分布图有直方图、次数多边形图及累加次数分布图等。在次数分布图的基础上,若对分布进行精略分析:看其变动趋势、差异细节,获得更为直观印象就要绘制次数分布图。直方图直方图又名等距直方图,它是以矩形的面积表示连续性随机变量次数分布的图形。是常用的统计图之一。次数多边形图次数多边形图是线图的一种,是表示连续性随机变量次数分布的图形,因此又属于次数分布图。凡是等距分组的可以用.直方图表示的数据,都可用次数多边形图来表示。累加次数分布图累加次数分布图有累加直方图与累加曲线两种,它们都是在累加次数分布图的基础上绘制的。