【四分位差怎么计算】四分位差(Interquartile Range,简称IQR)是统计学中用于衡量数据分布离散程度的一个重要指标。它表示中间50%的数据范围,即第三四分位数(Q3)与第一四分位数(Q1)之间的差值。该指标在分析数据的集中趋势和异常值识别方面具有重要作用。
一、四分位差的定义
四分位差 = Q3 - Q1
其中:
- Q1 是第一四分位数,也称为下四分位数,表示有25%的数据小于或等于该值;
- Q3 是第三四分位数,也称为上四分位数,表示有75%的数据小于或等于该值。
二、四分位差的计算步骤
| 步骤 | 内容说明 |
| 1 | 将数据从小到大排序 |
| 2 | 确定数据个数n |
| 3 | 计算位置公式:Q1的位置 = (n + 1) × 0.25;Q3的位置 = (n + 1) × 0.75 |
| 4 | 根据位置确定Q1和Q3的值 |
| 5 | 用Q3减去Q1得到四分位差 |
> 注意:不同软件或教材可能采用不同的方法计算四分位数,如使用线性插值法或直接取整数位置等,结果可能会略有差异。
三、举例说明
假设有一组数据:
12, 15, 18, 20, 22, 25, 28, 30, 35, 40
1. 数据已排序;
2. n = 10;
3. Q1位置 = (10 + 1) × 0.25 = 2.75 → 取第2和第3个数的平均值:(15 + 18)/2 = 16.5
4. Q3位置 = (10 + 1) × 0.75 = 8.25 → 取第8和第9个数的平均值:(30 + 35)/2 = 32.5
5. 四分位差 = 32.5 - 16.5 = 16
四、四分位差的意义
- 反映中间50%数据的分散程度:数值越大,数据越分散;数值越小,数据越集中;
- 适用于非对称分布数据:相比极差和标准差,四分位差更能反映真实的数据分布情况;
- 用于识别异常值:通常将低于 Q1 - 1.5×IQR 或高于 Q3 + 1.5×IQR 的数据视为异常值。
五、总结表
| 指标 | 含义 | 公式 | 用途 |
| 四分位差 | 中间50%数据的范围 | IQR = Q3 - Q1 | 衡量数据离散程度、识别异常值 |
| 第一四分位数 | 有25%数据小于或等于该值 | Q1 = (n+1)×0.25 | 分析数据下部分布 |
| 第三四分位数 | 有75%数据小于或等于该值 | Q3 = (n+1)×0.75 | 分析数据上部分布 |
通过上述方法,可以有效地计算出四分位差,并用于数据分析和判断数据的稳定性与异常情况。


