[상관분석]

두 변수의 선후관계가 명백하지 않아 종속관계를 정의할 수 없는 경우에 상호의존도 (interdependency)를 직선적으로 정량화하는 방법이다. 직선관계로 나타낼 수 없는 2차적 관계와 같은 복잡한 관계는 상관분석으로 해석해낼 수 가 없다. 따라서 상관분석은 우선 산점도를 그려보아서 대략적으로 직선적인 관계가 추측될 때에만 이용할 수 있다. 상관분석을 시행하면 상관계수(r)와 [모상관계수=0]이라는 귀무가설에 따른 유의확률(p-value)을 구할 수 있다. 유의확률이 작더라도 상관계수도 작으면 유의한 선형관계가 없다고 판단하는 것이 일반적이다. 상관계수(r)의 제곱(r2)을 [설명력]이라고 하는데 이는 '한 변수의 어느 정도를 다른 변수값의 변화로 설명할 수 있는가?'를 나타낸 것인데 자료의 숫자에 따라 크게 달라지므로 (자료의 수가 많을 수록 r2의 값이 커진다) 큰 의미를 줄 필요는 없다.

1. 단순상관분석 (bivariate correlation analysis)

단순상관분석을 시행할 때에는 교란변수(confounding variable)가 두 변수에 미치는 영향에 대해 주의를 기울여야 한다.

모수적 방법인 Pearson 상관계수는 관측치가 간격척도 이상의 척도(즉 간격척도와 비척도)로 측정된 자료에서 사용될 수 있다. 비모수적인 방법은 Spearman상관계수, Kendall의 타우-b 등이 있으며 보고서 작성시 추천되는 Spearman상관계수는 두 변수 X, Y 각각의 순위간에 직선적 관계가 있는지 여부를 확인하는 방법이다.

2. 편(partial)상관분석

교란변수(confounding variable)의 영향을 제외, 통제하여 상관분석을 실시하는 방법을 편상관분석이라고 한다. 통제할 변수는 1개 이상일 수 있으며 통제할 변수의 수가 편상관계수의 차수(order)가 된다. 몇개의 교란변수는 통제할 수 있는 간단한 방법이지만 교란변수의 수가 많아지면 이용할 수 없다.

[Home]