Exce表格网

excel异距数列怎么做(异距数列是指各组次数均不相等的变量数列)

来源:www.0djx.com  时间:2023-03-01 07:45   点击:270  编辑:表格网  手机版

1. 异距数列是指各组次数均不相等的变量数列

次数密度,亦称频数密度,指组距数列中单位组距内分布的次数。

亦称频数密度。组距数列中单位组距内分布的次数。

次数密度可消除组距因素对异距数列次数分布的影响,在异距数列中,只有计算次数密度才能准确地反映实际的次数分布情况。在等距数列中,由于组距相同,各组次数的分布同次数密度的分布相一致

2. 异距数列怎么计算组中值

在编制过程中,要正确处理的具体问题。

①组数与组距编制组距数列,必须对总体进行分组,针对一个总体,应将其分为多少组,这要根据研究的目的来确定,同时要本着以能简单明了地反映问题为原则。如果组数过多,必然会造成总体单位分布分散,同时还有可能把属于同类的单位归到不同的组中,不能真实反映出事物的本质特点和规律性;如果组数过少,又会造成把不同性质的单位归到同一个组内,失去区别事物的界限,达不到正确反映客观事实的目的。

因此,必须恰当地确定组数。美国学者斯特奇斯 (HASturges)提出,在总体各单位标志值分布趋于正态的情况下,可根据总体单位数(N)来确定应分组数(n),

公式为:n=1+3.322lgN上式可供分组时参考,但也不能生搬硬套。当总体单位数过少时,按上述公式计算的组数可能偏多;而当总体单位数很多时,计算的组数又可能偏少。

确定组数后,还应确定组距。组数和组距之间存在着密切关系。在全距(最大变量值与最小变量值之差)一定的情况下,组距的大小和标志变量数列的全距大小成正比变化,与组数多少成反比变化。组数越多,组距越小;组数越少,组距越大。

由于组距数列有等距数列与异距数列之分,在采用等距分组的情况下,变量数列编制的组距(d)可采用下列公式确定:

②组限与组中值组距数列中,每个组都有两个端点,这两个端点称为组限。数值小的端点称为组的下限,数值大的端点称为组的上限。若一组内有上限缺下限,或有下限缺上限称为开口组;若一组内的上限、下限都齐全称为闭口组。

组距数列掩盖了组内各单位的实际变量值,通常用组中值近似地代替每组变量值的一般水平。注意:用组中值来代表各组的一般水平时,变量值在该组应呈均匀分布,或在组中值两侧呈对称分布,否则,用组中值作为一组的代表值会有一定的误差。

3. 什么是异距数列

就是总体按单项式分组而形成的变量数列,每个变量值是一个组,按变量值大小顺序排列。

 延伸:

组距数列是总体按组距式分组而形成的变量数列,每个组由一个变量值的区间表示,在变量个数较多、变动幅度较大时采用。组距数列又分为:等距数列和异距数列。

4. 异距数列是各组组距不完全相等的组距数列

、变量数列的编制

  变量数列的编制比较复杂,因此有必要对变量数列的编制方法、编制步骤以及编制过程中需注意的问题进行探讨。

  (一)阵列,求全距

  首先对原始资料进行初步整理,即将各个变量值按大小顺序排列,形成一个阵列,并确定其全距R。全距是指资料中的最大值与最小值之差,能反映资料中各变量值波动的范围大小。通过初步整理,可使我们大致了解该资料的某些特征和变动规律,从而为正确编制变量数列提供必要的依据。

  (二)确定变量数列的形式

  编制单项数列还是组距数列,主要取决于所研究变量的类型以及变量变动的幅度。对于连续变量,因其所描述对象的数量特征,在一个区间内可以有无限多个数值,无法按一定次序将其变量值一一列举,所以只能编制组距数列。对于离散变量,则要根据其变量值的多少和变异幅度的大小来确定。如变量值较少以及变异幅度较小的,可编制单项数列;如变量值较多以及变异幅度较大的,应编制组距数列。具体如何分组,要结合分析目的及资料特点确定。

  (三)确定组距和组数

  组距的大小和组数的多少互为制约成反比关系。组距越大,组数就越少;组距越小,组数就越多。组数过少,容易把不同质的单位归在一个组内;组数过多,又容易把同质单位划入到不同的组内。两者都不符合分组的要求,都不能确切地反映总体的分布特征。因 此,确定组距和组数,应全面分析资料所反映的经济内容、变量值的离散程度或集中趋势以及数据多少等因素,要使组距能如实地反映出各组之间的数量界限,将同质单位归入同一组,而将不同质单位划分为不同的组,准确、真实地揭示出总体的分布特征及规律性。

  当变量值变动比较均匀,并且可能编制等距数列的条件下,其组距也可采用斯特奇斯公式求得。这是一种假定总体各单位按其标志分布趋于正态分布的条件下,根据总体单位数目近似确定分组数目并计算组距近似值的方法,是由经验总结得来。计算公式为:

            组距(i)=      

   需要指出,根据经验,由此公式求出的组数,当数据较少时,往往过多;当数据较多时,则往往过少。所以该公式只能作为参考之用。

  组距数列有等距数列和异距数列两种,选等距分组还是异距分组,应根据统计研究的任务和所研究现象变化的特点来决定。一般而言,凡是现象的变动比较均匀的,宜采用等距分组。如按工资,按身高、体重,按零件尺寸误差等分组。等距分组,由于各组组距相同,各组单位数(次数)只受标志变量的影响,因此可直接比较各组的次数。同时,根据等距数列资料,便于直接绘制统计图,计算各项综合指标并进行对比分析。因此,应尽可能采用等距分组。但在社会经济统计中,有些现象性质差异的变动并不均衡,往往波动很大,如急剧上升或下降,这就难以用等距分组的方法来划分不同性质的组,从现象量的变化中反映出不同质的差别,这就必须采用异距分组。

  采用异距分组编制的异距数列,由于各组次数要受组距大小不同的影响,为消除此影响,更确切地反映出各组次数的实际分布状况,可计算次数密度或标准组距次数。

  次数密度,就是单位组距内分布的次数,又称为频数密度。计算公式为:

                    次数密度=  

  标准组距次数,即选定数列中某一合适的组距作为标准组距,用标准组距除以各组组距,得各组组距折合为标准组距的系数,再将各组的折合系数分别乘各组的次数,即可得各组的标准组距次数。

  次数密度与标准组距次数其实质是相同的,它们都是对异距数列进行分析的重要指标。两者计算上的联系表现为:标准组距次数等于次数密度与标准组距的乘积。

  (四)确定组限

  组距、组数确定后,需进一步确定组限。组限应根据变量的性质来确定,更要有利于反映出总体各单位的实际分布特征。具体应考虑以下几个方面。(1)组限最好采用整数表示,各组下限尽可能取所选定组距的倍数。(2)组限一般不用负值表示,最小为零。(3)应使最小组下限不大于资料中的最小变量值,最大组上限不小于资料中的最大变量值。(4)对连续变量和离散变量组限的划分和表示方法,在技术上有不同的要求。对连续变量,相邻两组的组限应重叠,并且习惯上按照“上限不在本组内,应归入到下一组”的原则处理与上限相同的变量值。

  (五)计量各组单位数

  通过手工汇总或电子计算机汇总,在变量分组确定以后,直接计量各组内总体单位数目,得出各组总体单位的分配次数或以组次数占总次数的比率形式,则变量数列的编制结束,根据变量数列可进行各种统计分析。

5. 异距数列组中值

次数密度,就是单位组距内分布的次数,又称为频数密度。计算公式为:

               次数密度等于标准组距次数,即选定数列中某一合适的组距作为标准组距,用标准组距除以各组组距,得各组组距折合为标准组距的系数,再将各组的折合系数分别乘各组的次数,即可得各组的标准组距次数。

  次数密度与标准组距次数其实质是相同的,它们都是对异距数列进行分析的重要指标。两者计算上的联系表现为:标准组距次数等于次数密度与标准组距的乘积。

顶一下
(0)
0%
踩一下
(0)
0%
相关评论
我要评论
用户名: 验证码:点击我更换图片