导读 在统计学中,相关系数是用来衡量两个变量之间线性关系强度和方向的指标。最常用的相关系数是皮尔逊相关系数(Pearson correlation coeffi
在统计学中,相关系数是用来衡量两个变量之间线性关系强度和方向的指标。最常用的相关系数是皮尔逊相关系数(Pearson correlation coefficient),它反映了两个连续变量之间的线性关系程度。计算公式为:
\[ r = \frac{\sum{(x_i - \bar{x})(y_i - \bar{y})}}{\sqrt{\sum{(x_i - \bar{x})^2}\sum{(y_i - \bar{y})^2}}} \]
其中,\(x_i\) 和 \(y_i\) 分别表示两组数据中的每个观测值,\(\bar{x}\) 和 \(\bar{y}\) 分别表示这两组数据的平均值。\(r\) 的取值范围在-1到+1之间,接近+1表示正相关,接近-1表示负相关,接近0表示没有线性相关。
除了皮尔逊相关系数外,还有斯皮尔曼等级相关系数(Spearman rank correlation)和肯德尔等级相关系数(Kendall rank correlation),它们分别用于评估非线性关系和有序数据之间的相关性。这些系数同样能够提供有价值的统计信息,帮助我们更好地理解数据间的内在联系。