有些日子没见了,首先祝大家节日快乐,吉祥如意!更新不会停,但是最近确实懈怠了,见谅!
统计函数是Excel中目前数量最多的函数类别,其数量之多,以及作用之广,说是函数界的“豪门贵族”也不算为过。
统计函数的作用不只是统计数据,更重要的是用于统计学分析。统计函数的作用包括聚类、集中趋势度、离散,趋势预测和概率分布等相关的分析。
一、如何轻松记住函数
快速记住和理解它们,最好的方法就是先进行分组,发现它们的规律,以及内在的联系;
▍理解这几个函数就不用愁了
在同一组函数中,结尾是否含A的区别是什么呢?
比如COUNT与COUNTA,AVERAGE与AVERAGEA,MIN与MINA等等。虽然他们的基本含义是一样的,但是在计算的逻辑上是有差异的,一般情况下含A表示在指定的计算范围内不忽略文本与逻辑值。不含A则忽略文本与逻辑值。
△示例
比如在示例中,COUNT统计的结果只是含数字的单元格个数,但是COUNTA统计了包含非数字的单元格。最小值MINA的结果为0是因为把逻辑值FALSE也包含在内,FALSE即表示0;再看看示例中的两种不同的均值计算逻辑
❶AVERAGE的计算结果是9.625,计算逻辑为=77/8; 注:只统计A列中的数字之和,以及为数字的单元格个数 ❷AVERAGEA的计算结果为7.09,逻辑为=78/11注:求和是把逻辑值TRUE计算在内,TRUE即1,另外分母基数中包含了所有单元格。
▍函数中含IF和IFS的意义
在Excel中,IF是一个独立的逻辑判断函数,但它也常常和其他的统计函数或者数学函数进行“组合”,比如COUNTIF()、AVERAGEIF等等。其含义一般是表示根据指定的条件求值,COUNTIF()表示根据指定条件求单元格个数,而COUNTIFS则表示根据多个条件求单元格个数;
▍函数升级与兼容函数
Excel版本迭代以后,经常也会对原有函数进行升级,比如从AVERGE()到AVERGIF(),再到AVERAGEIFS(),函数的功能越来越多样化。
比如排名函数RANK()演化出RANK.EQ(),RANK.AVG(),RANK.EQ()的含义是:如果排名存在重复值则取最优排名,这个函数的作用和早期的RANK()函数的作用是一样的,是RANK()函数的替代版本,因此RANK()函数本身已经被划入到兼容性函数了,保留它是为了向低版本Excel兼容,新衍生的函数RANK.AVG()的作用则对重复排名进行了处理,即取实际排名的平均值。
类似于RANK.EQ()这样结构的函数,一般是表示函数进行了升级,但是又保留了原来的函数向低版本兼容。类似的情况还有不少,比如众数MODE.SNGL()和MODE.MULT()是基于MODE升级的;协方差COVARIANCE.P()和COVARIANCE.S()是基于COVARIANCE升级的;方差STDEV.S()和STDEV.P()是基于STDEV升级的。
二、函数之间千丝万缕的联系
▍协方差、方差与标准差的关系
在计算偏差和离散中涉及到三类函数:协方差、方差和标准差。协方差用于衡量实际值与期望值之间的偏差。方差则是协方差的一种特殊情况,即当两个变量是相同的情况,用于表示离散程度。以下表中是数据为示例,它们的计算逻辑以及关系是:
❶总体协方差:
=COVARIANCE.S(A11:A15,B11:B15)
❷当两组数据相同,相当于
=COVARIANCE.S(A11:A15,A11:A15)
❸上述协方差的特殊形式,等同于方差
=VAR.P(A11:A15)
❹方差的根即为标准差;他们之间的转化关系为
VAR()=STDEV()^2或者
VAR()=POWER(STDEV(),2)
▍相关系数与偏差的关系
协方差、方差与标准差是用来衡量偏差以及离散程度,函数CORREL()则用来衡量两组数据之间的相关性,在函数帮助中我们可以看到相关系数的计算逻辑(当然这个计算过程只作了解就行),相关系数的计算方法为: 简单说,相关系数的计算逻辑为:X、Y的协方差除以X的标准差和Y的标准差。因此相关系数也可以看成是一种特殊形式的协方差,一种剔除了两个变量量纲影响、标准化后的特殊协方差。▍中位数、四分位数与极值
集中趋势度的分析离不开均值,有时候也会用到众数和中位数,乃至极值等;从下图中也可以看出它们之间的关系也不一般(横向表示不同函数下返回同样的结果)❶四分位函数QUARTILE()可以替代MAX()、MIN()以及MEDIAN()函数
❷LARGE()或者SMALL()可以替代MAX()或者MIN()函数;而且LARGE()与SMALL()函数本身还可以互相转换,因为它们是互为倒序的关系。
这么看MAX()和MIN()的存在感是不是很弱?因为可替代性太强了,不过相比之下MAX()和MIN()函数的特点就是极其简单,易于理解,而且在高版本中更演化出MAXA、MAXIFS更加多样化的函数。这就是Excel函数的灵活与强大之处。▍频数与计数的关系
当需要对数据进行分组时,可能会用到COUNTIF()或COUNTIFS()函数;但如果是统计数据的分布频数,可以直接用FREQUENCY()函数更加简便。
下面是两种函数方法对数据进行分组,相比之下COUNTIFS()的做法更加复杂,但是COUNTIFS()的好处是更加灵活,不仅可以处理数字,还可以处理文本。
在Excel中利用函数解决问题,从来就没有一套固定的“公式”,高手往往具备的是解决问题的“艺术”。
▍附:常用统计函数全景图
- 如何成体系掌握Excel函数(一)