5.중다회귀분석
0.08326 +0.05290 +0.00675 -0.69496으로 정확히 마지막 4단계의 전체 설명량 R과 같이 진다.
이렇듯 위계적 중다회귀분석은 전체 설명변량이 개별 변인의 상대적 기여도로 분할되고 제외되는 변량이 없기 때문에 개별 변인의 효과를 검증하고자 하는 연구에 적합하다. 특히, 변인의 투입은 연구자에 의해 결정되므로 독립변인들의 효과에 대해 미리 가설을 설정하는 것과 같다. 따라서 위계적 중다회귀분석은 독립변인들의 상대적 효과를 밝히기 위한 가설검증 연구에 적합한 회귀분석 방법이다.
5-1. 위계적 중다회귀분석의 응용
위계적 회귀분석의 한 가지 중요한 응용이 공변량분석 (analysis of covariance)이다. 이것은 위계적 회귀분석의 동일한 결과를 '해석적 관점'에서 달리하는 것이다. 예를 들어 앞의 예에서 많은 연구들을 통해 외모가 대인 매력에 결정적으로 중요한 변인이라는 것은 이미 잘 알려진 사실이라고 할 때, 중다회귀분석에 외모변인을 포함시키지 않을 수 있다. 그러나 보다 좋은 전략이란 “외모가 종속변인(대인 매력)을 설명하는 정도(설명량)를 제외한다면 나머지 변인인 유머, 성격, 지능이 얼마나 대인매력을 설명할 것인가에 대해 회귀모형을 검증하는 것이다.
이를 위해 1단계에서 외모(FACE)를 투입하여 회귀모형을 만든 후 순차적으로 알고자 하는 변인들을 투입하면서 외모를 제외한 나머지 변인들의 예측력을 검증해 간다. 이때<결과 2.7)과 마찬가지로 1~4단계로 회귀모형을 검증하지만 회귀모형에 대한 해석을 달리한다. 즉, 외모라는 변인의 설명량 57.2%를 전체 설명변량 69.5%에서 뺀 12.3%를 실제 알고자 하는 설명변량으로 간주함으로써 외모를 통제한 상태에서의 유머, 성격, 지능의 효과를 파악하는 것이다. 물론 외모의 효과가 통제되었을 때 각 독립변인의 R 변화량과 그에 대한 유의검증(F값)을 통해 개별 변인의 상대적인 변량크기를 비교할 수도 있다.
이처럼 공변량분석을 하는 경우, 위계적 회귀분석은 여러 변인을 동시에 공변량으로 통제할 수 있다. 통제할 변인의 우선순위가 정해져 있는 경우라면 통제할 변인을 순서적으로 투입한다. 예를 들어, 외모가 가장 중요하고 그 다음으로 유머능력이 중요하며 성격이 다음으로 중요하다고 할 때, 이들 변인의 대인매력에 대한 효과는 익히 잘 알려져 있어 이들을 통제한 상태에서 '지능'의 효과를 파악하고자 한다면, 앞의 1-4단계의 회귀모형과 동일하게 되겠지만 역시 해석을 달리한다. 즉, 통제변인 세 개의 설명변량 68.8%를 제외한 나머지 0.7%가 알고자 하는 변인의 설명변량인데, 이는 통계적으로 유의미하지 않다(p>05). 따라서 외모와 유머능력, 성격변인을 통제하였을 때 지능변인은 대인매력을 예측하지 못한다고 해석한다. 특히, 이때에는 마지막 4단계(⑤)의 최종 회귀모형에 대한 유의도 검증결과의 Analysis of Variance)이 유의미하다.
5-2. 중다회귀분석의 유형과 해석 85
경우에만 회귀모형의 예측력이 유의미하다는 해석을 덧붙일 수 있다.
반면, 통제할 변인들의 우선순위가 정해져 있지 않거나 부분적으로 정해져 있는 경우에는 우선순위가 결정된 변인은 순서적으로 투입하고 그렇지 않은 변인은 한꺼번에 투입하는 방법을 사용한다. 이는 위계적 회귀분석과 표준 회귀분석을 결합한 형태로, 변인들간에 블록을 만들어 블록 내에서는 표준 회귀분석을 하고 블록간에는 위계적으로 분석하는 것이다. 예를 들어, 외모변인은 우선순위가 정해져 있지만 유머능력과 성격변인에 대해서는 그 중요도가 알려져 있지 않을 때, 외모를 가장 먼저 투입하고, 유머능력과 성격은 한꺼번에 투입하고, 마지막 단계로 지능변인을 투입한다. 이때에는 유머능력과 성격변인이 한꺼번에 투입되어 한 블록 내에 있기 때문에 회귀모형은 3단계로 구성된다. 해석은 세 변인을 통제한 상태에서의 '지능'의 효과를 분석하는 것과 같이 하면 된다.
하지만 공변량분석이 아닌 경우에 우선순위가 정해지지 않은 변인을 위계적 회귀분석에 사용한다면 다소 해석이 달라진다. 예를 들어, 외모와 유머능력의 효과는 우선순위를 정할 수 있지만 성격과 지능의 우선순위는 정할 수 없는 경우를 생각해 보자. 이러한 경우는 사회조사에 흔히 발생하는데, 변인을 투입하는 것은 앞의 경우와 같이 가장 먼저 외모변인을 투입하고 그 다음으로 유머능력을 투입한다. 성격과 지능변인은 한꺼번에 투입하여 3단계의 회귀식을 구성한다. 이 경우의 결과해석은 1단계와 2단계에서는 위계적 중다회귀분석과 동일하지만, 두 변인(성격, 지능)이 한꺼번에 투입된 3단계에서는 두 변인의 준여과상관(sr)이 표준 회귀분석과 같아지기 때문에 계수만으로 상대적 중요성을 비교하여야 한다. 3단계에서 산출되는 R 변화량은 성격과 지능변인에 의한 변화량이다. 이렇게 하여 성격과 지능변인의 우선순위가 정해지면 네 개의 변인을 순차적으로 다시 투입하는 위계적 회귀분석을 수행하는 것이 바람직하다.
5-3. 위계적 중다회귀분석의 주의사항 - IV간의 다중공선성
앞서 중다회귀분석의 기본 가정(2.3.4)에서 독립변인의 지나친 상관(multicollinearity)은 분석에 결정적인 영향을 주기 때문에 반드시 체크해야 한다고 강조하였다. 그러면 앞의 <결과 2.7>의 경우는 어떠한가?
<결과 2.72에 제시되어 있는 기초상관표(결과의 ②)를 보면, 외모점수와 유머능력점수의 상관이 0.495이고 외모점수와 지능점수 간의 상관은 -0.720으로 높다는 것을 알 수 있다. 변인간의 다중공선성이 있다는 결정적인 증거는 네번째 지능변인이 투입된 후의 공차와 상승변량(VIF)에서 나타난다. 공차는 1에 접근하여야 하는데, 성격(0.930979) 변인을 제외하고 외모점수(0.253675), 유머능력 (0.542466), 지능점수 (346318) 모두 상당히 낮아 다중공선성이 의심되는 변인들이다.
다중공선성이 높은 변인은 투입되는 순서에 따라 다른 결과를 산출하기 때문에, 만일 외모점수 대신 유머능력점수가 회귀식에 먼저 투입된다면 결과 2.7>과는 상당히 다른걸 볼수 있다.
'다변량자료분석의 이해와 활용' 카테고리의 다른 글
중다회귀분석의 결과표 및 보고서 작성 요령 (0) | 2021.10.11 |
---|---|
중다회귀분석의 유형과 해석 (0) | 2021.10.08 |
중다회귀분석의 기본 가정 (0) | 2021.10.07 |
4.중다회귀분석 (0) | 2021.10.06 |
3. 중다회귀분석 (0) | 2021.10.05 |