样本相关系数是用于衡量两个变量之间线性相关程度的统计量,通常用r表示,其计算方法如下。
首先要明确样本相关系数的计算公式,最常用的是皮尔逊相关系数公式。假设我们有两个变量X和Y,分别有n个观测值,即X=(x1,x2, …, xn),Y=(y1,y2, …, yn)。皮尔逊相关系数r的计算公式为:r = [∑(xi - x̅)(yi - ȳ)] / [√(∑(xi - x̅)²) × √(∑(yi - ȳ)²)] ,其中x̅是变量X的样本均值,计算公式为x̅ = (∑xi) / n;ȳ是变量Y的样本均值,计算公式为ȳ = (∑yi) / n 。
计算样本相关系数一般可以按照以下步骤进行。第一步,计算变量X和Y的样本均值x̅和ȳ。例如,对于变量X的一组观测值x1,x2, …, xn ,将所有观测值相加,再除以观测值的个数n,就得到x̅;同理计算出ȳ。第二步,计算每个观测值与均值的偏差。对于变量X,计算xi - x̅;对于变量Y,计算yi - ȳ。第三步,计算偏差的乘积。将每一对(xi - x̅)和(yi - ȳ)相乘,然后将所有乘积相加,得到∑(xi - x̅)(yi - ȳ)。第四步,分别计算变量X和Y偏差的平方和。即计算∑(xi - x̅)²和∑(yi - ȳ)² 。第五步,将第四步得到的两个平方和分别开方,然后相乘,得到√(∑(xi - x̅)²) × √(∑(yi - ȳ)²) 。最后,用第三步得到的结果除以第五步得到的结果,就得到样本相关系数r。
样本相关系数r的取值范围是[-1,1]。当r = 1时,表示两个变量完全正相关;当r = -1时,表示两个变量完全负相关;当r = 0时,表示两个变量之间不存在线性相关关系,但可能存在其他非线性关系