본문 바로가기

다변량자료분석의 이해와 활용

다변량 자료분석의 유형과 적용사례

1 .다변량 자료분석의 유형과 적용사례


1-1.구조방정식 모델링

구조방정식 모델링(structure erusation modeling)은 다변량 분석기법에 대한 수요와 컴퓨터의 급속한 발달로 인해 가장 최근에 개발된 방법이다. 
그만큼 각 분야 연구자들의 욕구를 잘 반영하고 있다고 할 수 있다. 구조방정식 모델링은 LISRELILIneer StructuralRELationship) 이라고도 하는데, 이는 한 컴퓨터 프로그램의 이름이 그대로 분석명칭으로통용된 것이다. 
LISREL은 잠재적인 요인의 구조를 밝혀줄 뿐만 아니라 요인 혹은 변인간의 인과관계를 설명하는 기법으로, 크게 측정모델(measturement model)과 구조모델(structural model)의 두 부분으로 나누어져 있다. 
측정모델은 앞서 언급한 확인적 요인분석과 유사한 개념과 목적을 갖고 있으며, 구조모델은 변인간의 인과관계를 예측하기 위해 여러 개의 회귀모형이 결합된 형태라고 할 수 있다.

그러나 LISREL은 회귀분석보다 변인간의 예측적 관계성을 검증하는 데 있어 더욱 강력하다. 왜냐하면 LISREL은 측정의 오차가 없음을 가정하고 여러 종속변인을 사용할수 있을 뿐만 아니라 직접적으로 측정되지 않은 잠재변인 요인분석에서 말하는 요인)간의예측 관계성을 검증하는 등 포괄적인 융통성을 갖기 때문이다. 
따라서 연구자가 요인분석처럼 이론적인 요인의 구조를 파악하고자 하는 동시에 그 변인(관찰변인 혹은 잠재변인)간의 관계성을 검증하고자 할 때 매우 강력한 분석도구가 된다. 
이는 마치 확인적 요인분석과 중다회귀분석을 동시에 수행하는 효과를 갖는다. 


1-2.다변량 자료분석의 기초

구매 의도는 다시 구매행동에 영향을 준다는 이론적인 모델을 검증하고자 하는 경로도식이다. 
LISREL을 통해 도식에서 화살표를 따라 추정되는 각 경로계수(path coefficient)를 비교하여 영향력의 크기를 파악하고(회귀계수처럼 해석) 별도로 산출되는 적합도지수(goodness of fit index)를 근거로 모델의 적합성을 판단한다.

LISREL에서는 위처럼 원으로 표시되면 잠재변인을 나타내고 사각형으로 표시되면 측정변인을 나타낸다.
잠재변인간의 관계성을 분석하는 구조모델이 일반적 이지만, 만일 측정변인과 잠재변인의 관계성을 분석한다면 측정모델로서 확인적 요인분석을 수행하는 것이 된다.

* 주의 : LISREL은 변인간의 기초상관행렬(correlation matrix)이나 공변량행렬(covariancematrix)을 통해 분석되기 때문에 모든 자료는 기본적으로 연속형 자료여야 한다. 
하지만 범주형 자료를 분석할 수 있는 절차를 포함하고 있다(LISREL에서 PRELIS라는 절차를 이용).

지금까지 연구의 목적에 따라 이 글에서 다루고 있는 다변량 분석기법들을 간단하게 소개하였다. 
마케팅이나 사회 및 행동과학의 연구자들은 여기서 다루고 있는 분석방법들을 활용함으로써 현재 조사나 연구에서 직면한 방법적인 문제를 보다 명쾌하게 풀어 갈 수 있을 것이다. 
그리고 과거의 단순한 빈도나 단변량적 설명에서 벗어나 복잡한 현상을 보다 정확하고 합리적으로 설명할 수 있는 해법을 찾게 될 것으로 기대한다.

이 책에서 다루고 있는 통계기법들은 다변량 분석법들 가운데 가장 중요하고도 활용도가 높은 것들이다. 
모든 다변량 통계기법들을 다루지 못한 것에 안타까움을 느끼지만, 실상 연구자나 실무자들에게 불필요하게 시간을 강요하는 기타의 통계방법들이 많다. 
이 글은 각각의 분석방법을 실제 사용하면서 겪게 되는 문제점과 개념적 복잡성을 예제를 통해 쉽게 설명하였으며, 수학공식을 배제하여 누구나 쉽게 읽을 수 있도록 배려하였다. 
특히, 다른 글들에서 발견할 수 없는 체계적인 통계 논리를 기술하고 있고 결과물을 자세히 설명하고 있어 초보자에서부터 숙달된 전문가에 이르기까지 값지게 활용할 수 있을 것이다.

통계학을 전공하지 않은 연구자나 실무자들에게 문제해결을 위해 처음부터 다시 통계를 공부하라는 것은 엄청난 시간을 낭비하라는 것에 불과하다. 


1-3.중다회귀분석

중다회귀분석(multiple regression analysis)은 사건과 현상들의 예측적 관계성을 밝히는데 사용되는 통계기법이다. 
예측적 관계성은 구체적으로 독립변인과 종속변인의 인과관계로 독립변인들이 종속변인을 얼마나 예측하고 설명하는가를 알고자 할 때 주로 사용된다.

역사는 세상을 이해하고 설명하려는 사람들의 욕구로 인해 발전하여 왔다. 작게는 개인의 행동에서부터 정치적 사건과 사회경제적 현상을 설명하고자 하며, 나아가 빅뱅(bisbang)이나 빅크런치(big chinch)와 같은 우주 현상을 이해하고자 한다. 
이러한 욕구는 지식충족 이상의 의미를 갖고 있는데, 현상이나 사건에 대한 이해는 장차 벌어질 사태에대한 예측적 힘과 그로 인한 효과적인 통제방법을 제시해주기 때문이다. 이런 점에서 중다회귀분석은 값진 정보를 제공하는 통계기법일 수 있다.

일반적으로 중다회귀분석은 광범위한 예측의 문제를 다룬다. 
예를 들어, 기업에서 종업원들의 생산성 향상에 기여하는 요인이 무엇인지를 알고자 하거나, 마케터가 소비자들의 구매를 예측하는 요인을 찾고자 할 때, 혹은 사회학자가 사회 폭력과 범죄의 영향요인을 알고자 하거나 정치발전을 저해하는 요인을 예측하고자 할 때 중다회귀분석은 적절한 해답을 준다. 만일 사회 폭력에 영향을 주는 요인을 중다회귀분석을 통해 객관적으로 규명할 수 있다면, 사회폭력을 줄이는 문제를 보다 합리적으로 해결할 수 있다. 
또한종업원의 생산성을 증가시키는 요인이 직무에 대한 종업원들의 동기라는 것이 예측된다.면, 기업에서 생산성을 증가시키기 위해 어떻게 해야 하는지는 보다 명확해진다.

역사적으로 볼 때 중다회귀분석은 현실적인 문제를 해결하는 데 많은 도움을 제공하여 왔다. 
특히 미국에서 성 및 인종차별을 금지하는 민권법(Civil Rights Act)이 발효되면서 많은 소송이 제기되었고, 그로 인해 많은 연구자들은 성과 인종차별이 임금에 미치는영향을 밝히기 위해 수학적 모델로서 중다회귀분석을 사용하였다. 
이것이 중다회귀분석의 발전에 모태가 되었으며, 그 결과 미국의 동등고용법 확립에 큰 기여를 하였다. 
통계적 모델로서 회귀모형은 임금을 결정하는 많은 변인들(성, 인종, 교육수준 등) 중 통계적으로 유의미한 변인이 무엇인지를 밝혀줄 뿐만 아니라 그 변인의 영향력 정도를 알려준다.
이로부터 오늘날 회귀분석은 마케팅과 사회연구에서 변인들의 예측적 관계성을 설명하고자 할 때 매우 합리적으로 사용되는 강력한 분석도구의 하나가 되었다.

'다변량자료분석의 이해와 활용' 카테고리의 다른 글

4.중다회귀분석  (0) 2021.10.06
3. 중다회귀분석  (0) 2021.10.05
중다회귀분석의 기초 개념 2  (0) 2021.10.01
중다회귀분석 기초개념  (0) 2021.10.01
측정의 척도  (0) 2021.09.30