【相关系数r公式化简】在统计学中,相关系数(Pearson相关系数)是衡量两个变量之间线性关系强度和方向的一个重要指标。其原始公式较为复杂,但通过数学推导可以将其化简为更易理解和计算的形式。本文将对相关系数r的公式进行详细分析与化简,并以表格形式展示不同形式之间的对应关系。
一、相关系数r的原始公式
相关系数r的定义公式如下:
$$
r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}
$$
其中:
- $ x_i, y_i $:分别为两个变量的观测值;
- $ \bar{x}, \bar{y} $:分别为两个变量的均值;
- 分子为协方差的分子部分;
- 分母为两个变量标准差的乘积。
这个公式虽然准确,但在实际计算中可能较为繁琐,尤其是当数据量较大时。
二、公式的化简形式
为了简化计算,可以将原始公式进行代数变形,得到另一种等价表达式:
$$
r = \frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{\sqrt{[n\sum x_i^2 - (\sum x_i)^2][n\sum y_i^2 - (\sum y_i)^2]}}
$$
其中:
- $ n $:样本数量;
- $ \sum x_i y_i $:两变量乘积之和;
- $ \sum x_i $ 和 $ \sum y_i $:两变量的总和;
- $ \sum x_i^2 $ 和 $ \sum y_i^2 $:两变量平方和。
这种形式更适合用于手工计算或编程实现,因为它避免了先计算每个数据点的均值再减去均值的过程。
三、总结对比表
| 公式名称 | 公式表达 | 特点说明 |
| 原始公式 | $ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} $ | 更直观地体现协方差与标准差的关系,适合理论理解 |
| 化简公式 | $ r = \frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{\sqrt{[n\sum x_i^2 - (\sum x_i)^2][n\sum y_i^2 - (\sum y_i)^2]}} $ | 计算更便捷,适用于实际应用和编程实现 |
四、小结
相关系数r的公式可以通过代数方法进行化简,使其更便于计算和应用。无论是从理论角度还是实践角度,掌握这两种形式都有助于更好地理解和运用相关系数这一统计工具。在实际操作中,根据具体需求选择合适的公式形式,可以提高效率并减少计算错误的可能性。


