平均数中位数和众数的意义分别是什么 概况来说,这些都是样本的统计量,那么其用途自然也是来描述样本的性质,所以这些统计量的区别也自然在于描述一组样本不同的性质,下面分别来说。 1.平均数 首先平均数是一组【常规】样本【大概率上】最有代表性的统计量,比如你上学时想知道哪个班级的学生成绩更好些,工作时想知道哪个行业薪水更高点,你会问分数、工资的平均数是多少,以此来反映样本的整体情况。这种直观的感觉也同样可以在数学上证明,平均数是MSE最小的统计量,换言之在用一维统计值(一个数字)描述一组样本时,平均数就是最能够反应整体情况的了。 但注意,前边用到【常规】【大概率上】这些字眼,原因在于根据样本的特殊情况,有时候平均数并不能反映出样本的真实特征来。以平均工资举例,经常有很多人吐槽自己的工资被“平均”了,其实这就是偏态分布导致平均数无法描述整体样本的情况,那么在平均数有点失灵时,我们就需要其他统计量登场了。 2.中位数 中位数是一个很常见的,用来弥补平均数在偏态分布中不足之处的,有很好用的统计量。根据平均数的计算方法我们知道,样本中任何一个数值的改变都会影响最终计算结果,那如有一个数值出现了极大的离群变化,则平均值就可能失效。 以班级平均分举例,正常情况下5名同学的分数分别为100、99、98、97、96(学霸班啊。),则平均数为98;但这次考试有一名太过自信睡着了,分数为100、99、98、97、20,平均数瞬间变成82.8、但这能够反映该班级的实际情况吗?其实多数同学还是考了相当不错的分数的。反观中位数的,前后均是98,相对而言能更好的反映样本情况。 因此中位数通常会在样本出现少数离群值的时候,用于提供相对尊重样本主要情况统计量。其算法也反映了该特点,其中一个数值的变动,尤其是边界上的变动,不一定会改变该统计量的数值,所以在偏态分布时,用中位数更加具有实际意义。例子:国家统计局发布数据,2023年城镇居民家庭人均可支配收入31790.30元,而人均可支配收入的中位数是29129.00元,说明收入就是一定程度的偏态分布,类似二八定律,因此作为普通人还是老老实实看中位数吧。。 这里再补充一个思考题,部分评分制竞技体育赛事的分数计算方法为:去掉一个最高分,去掉一个最低分,平均分是XXX,这其实就是兼顾了平均数和中位数特质的又一个统计量。 3.众数 众数与前两者区别较大。平均数和中位数都是用来尽可能反映样本整体情况,一组样本从整体上来讲,围绕在哪个数值周围;而众数则反映的是局部特征,一组样本在哪里最密集。这个统计量一般要根据具体的需要和样本特征来使用。 最后举一个例子:一组样本是100、100、100、30、20、0、0,则平均数是50、中位数是30、众数是100,每一个统计量都不能反映全部特征,但每一个却也都能反映出一定程度的信息。 因此不同统计量的意义就是在不同维度反映样本性质。 本文来源:https://www.wddqw.com/doc/deb6e087b90d4a7302768e9951e79b8968026898.html