梅林晨
(陕西学前师范学院,陕西 西安 710100)
摘 要:平均差优于标准差这一观点一直以来都存在一定支持者,但仔细分析不难发现这一观点根本不能成立。从计算方式、数学关系、敏感性和正态分布下的换算公式推导四个方面对标准差与平均差展开研究,可以得出以下结论:第一,标准差与平均差有着统一公式和数学关系。第二,平均差计算过程有低估变异性问题。第三,平均差难于动摇标准差在统计学中的重要地位。
教育期刊网 http://www.jyqkw.com
关键词 :统计学;平均差;标准差
中图分类号:O212文献标识码:A文章编号:1673-260X(2015)08-0003-02
1 问题的提出
标准差与平均差都是人为构造出来,使用统计学手段,反映统计样本或总体的离散程度的统计指标。一般来说,标准差在实际应用中要比后者广泛一些。多数国内统计学教材在编写时对两者采取了平行介绍的方式进行处理,并从实用角度出发,偏重介绍应用更广的标准差,并认为平均差计算存在不便。对此,十余年来一直有学者提出反驳意见,认为平均差优于标准差,相关论文和著作较多但观点较为相似,试总结如下:
(1)认为在数字计算时,平均差计算不存在乘方和开方计算,计算量低于标准差,由此认为平均差更简便,并使用例题举证;
(2)从自己的实际工作经验出发,发现标准差计算结果往往大于平均差,由此提出观点,认为标准差存在高估变异性的问题,并使用例题举证;
(3)从测量离差一般水平的思路出发,进而认为标准差是平均差的代替,所以标准差不如平均差;
(4)认为在高性能计算机大量普及的情况下,平均差即使有计算不便,但两者在计算上的差异是可以被忽略的,使用哪种区别不大。
由以上观点,进一步得出了平均差优于标准差,并且应当大力推广平均差的结论。
2 平均差优于标准差的观点不能成立
对于此种观点,笔者作为一名从事高校统计学教学的教师,委实不敢苟同,现将以上所列论点进行逐条分析:
(1)对于平均差计算更简便的问题,上述论证只能说明平均差在进行具体数字的手工算术计算时计算量要小于标准差,而对代数计算只字不提,对于具体数字来说,绝对值计算不需要讨论正负问题,当然计算量要小,但对于不涉及具体数字的代数计算来说,绝对值的讨论当然要复杂一些。平均差计算更简便的观点只在算术领域成立,在代数领域难以成立。
(2)标准差计算结果往往大于平均差是一个实际计算观察的结果,而且也确实符合实际情况,后面笔者也会对此进行代数证明。但是标准差计算结果大于等于平均差这一现象其实无法得出标准差存在高估变异性的问题的结论,只能说明两者对变异性的测量存在差异,到底是标准差高估了变异性还是平均差低估了变异性,这一现象是不足以说明的。
(3)与其说是标准差代替了平均差,不如说是由于标准差的优点获得了广泛使用,变异指标的意义在于衡量分布的变异性,并不是说越接近离差的一般水平变异指标就越好。
(4)即使在高性能计算机大量普及的情况下,平均差与标准差的差异也是不能忽视的。首先是标准差函数可导,平均差函数不可导,这一区别导致两者在微积分处理上存在巨大差异。其次,标准差对应的是二阶矩,对所有平方可积的函数适用,平均差对应的是另一种范数,其适用函数的空间不同于平方可积函数的空间。而平方可积函数的空间具有许多更好的性质。平均差与标准差函数的可导性和可积空间上有很大差异,没有了导数存在且连续的标准差,大量的数学推导都无法展开,所以建立在标准差基础上的数理统计体系很难使用平均差代替。因此平均差与标准差的差异不光在算术计算上,更重要的是在数理推导上的差异,而后者与计算机性能的高低并没有太大关系。
综上所述,认为平均差优于标准差的观点无法成立。
3 平均差与标准差的数理关系分析
3。1 平均差与标准差的计算方式的联系
平均差和标准差的计算方式都是以离差概念为基础的,离差是单项数值与平均值之间的差,公式可写作,离差是一个向量,其绝对取值代表了单项数值偏离平均值的程度,正负号代表了单项数值偏离平均值的方向,如果想要构造一个衡量总体变异性的统计指标,使用离差来作为构造的基础是很自然的选择,但是也很容易证明,由于离差取值的方向性,其数学期望恒为零。因此,取消离差的正负号后再来构造统计指标才有意义,从这个角度出发,我们可以构造出方差和标准差两种指标,即和。前者是离差平方的数学期望,后者是离差绝对值的数学期望,而方差本身计算出来的指标要比统计量高一阶,所以可以对其求平方根进行标准化,就得到了标准差。由此可见,平均差和标准差的计算方式存在着密切联系,其中,平均差的计算公式可以转化为,而标准差的计算公式可以转化为,所以,平均差和标准差的计算公式可以统一为:,其中平均差为该统计量取一阶的结果,标准差为该统计量取二阶的结果。因此,平均差和标准差应当看作同源、同类但不同阶的统计量,不存在谁是谁的替代品的问题。
3。2 平均差与标准差的相互关系
在得出平均差与标准差的一般公式之后,我们可以看出两者的计算过程存在比较紧密的关联,但两者呈现的数量关系却无法直接显现,前面提到,实际数据观察似乎支持标准差大于等于平均差的观点,但直接对两者进行相减的话,绝对值号又影响了进一步的讨论。但是,既然平均差和标准差都大于等于零,如果可以证明标准差的平方即方差与平均差的平方之差大于等于零,其实也就证明了标准差大于等于平均差。计算如下:,所以标准差确实大于等于平均差,其中只有在离差绝对值的方差等于零时两者相等。但这一结果不能说明标准差高估了变异性,前面的证明可以看出,方差之中包含了平均差包含的所有用离差反映的变量值的变异性信息之余,还包含了离差本身的变异性信息,进一步来说,既然方差可以被分解为变量值的平均差的平方与离差绝对值的方差之和,那么离差绝对值的方差也可以被分解为离差平均差的平方与离差的离差绝对值的方差之和,由此可以形成一个关于平均差的无穷级数,而这一无穷级数之和收敛于变量值的方差。由此可以看出,其实方差包含了变量值各级离差的平均差所反映的所有变异性,而且这些变异性之间不存在重复计算问题,而标准差正是方差的标准化,所以,并非是标准差高估了变量的变异性,而是平均差只测量出了变量值包含的所有变异性的一部分。
3。3 平均差函数与标准差函数对变异性敏感程度的比较
如果从平均数的角度观察平均差函数与标准差函数,不难发现其中的一些区别,平均差函数可做如下变化:A.D.=,可以看出平均差函数即离差的简单算术平均数,离差的大小并不影响其权重,所以对于平均差来说,极端变量值的变异性被同等看待了。而标准差可做如下变化:,可以看出根号内的公式可以看成以离差本身大小为权重的加权算术平均数,所以越极端的变量值会被给予越多的关注,这一点更符合人们对于数据变异性的直接感觉。可以直观的构造如下两组数说明这种区别:1,1,0,-1,-1和2,0,0,0,-2,两者拥有相同的均值0和平均差0。8,但直观感觉前者的变异性较小,如果使用标准差,则前者标准差为0。89,后者为1。26,就有效的衡量出了这种变异性。
3。4 在正态分布下平均差与标准差的取值讨论
如假设X服从正态分布,,则有,由此可以看出,在正态分布下,平均差与标准差的取值存在稳定的倍数关系。同理其实不难证明,在参数确定的特定分布下,平均差与标准差的取值都存在该分布特有的稳定关系。至于是否可以在具体数字计算时结合这种稳定关系,使用平均差估算标准差,还有待后续研究证明其可靠性。
4 总结
由以上分析可见,标准差与平均差是有着统一公式和数学关系的两种变异指标,并不存在排他性问题,其中平均差在具体数字计算时有一定优势,但不利于代数运算和数学推导,同时平均差在计算变异性时存在信息损失低估变异性的问题,因此难于动摇标准差在统计学中的重要地位。
教育期刊网 http://www.jyqkw.com
参考文献:
(1)韩兆洲,杨林涛。极差、平均差和标准差之间测度关系研究[J]。统计与信息论坛,2008(04)。
(2)桂文林,伍超标。标准差和平均差的内在关系及应用研究[J]。数理统计与管理,2005(02)。
(3)赵海燕,陈立秋,张晓方。平均差和标准差在变异指标中的代表性浅议[J]。统计与咨询,2002(04)。
(4)朱子云,朱益超。平均差的算法改型及其数学性质研究[J]。丽水学院学报,2012(02)。
(5)吕华兴。统计中的标准差标准吗?平均差比标准差更标准[J]。江苏统计,2000(05)。