1.측정의 척도가 왜 중요한가?
통계학을 조금이라도 접해 본 독자라면 측정의 척도(measurement scale)가 모든 분석방법에 기초가 된다는 것을 알 것이다.
왜냐하면 측정의 척도는 데이터의 성질을 규정할 뿐 아니라 어떠한 자료분석방법을 선택할 것인지를 결정하기 때문이다.
측정(meeasurement)이란 현상이나 사상에 수치를 할당하는 과정이라고 정의된다. 앞서 쉬어가기 - 과학과 상식의 차이 > 에서 통계적 방법이 과학적 도구의 하나로서 현상을 양적인 데이터로 분석한다고 하였는데,
이는 결국 알고자 하는 현상을 측정한다는 말이다. 쉽게 말하면, 우리는 길이를 측정하기 위해 자라는 측정도구 즉, 척도를 사용하고 무게를 측정하기 위해 저울이라는 척도를 사용한다.
마케팅이나 사회 및 행동과학에서 주로 인간행동이나 사회적 현상을 측정하기 위해서 나름대로의 척도를 사용하는데, 성격척도나 태도척도가 그 대표적인 예들이다.
보통 측정의 척도는 대상을 측정하는 방법에 따라 명목척도(nominal scale), 서열척도(ordinal scale), 간격척도(interval scale), 비율척도(ratio scale)의 네 가지 유형으로 구분한다.
각 측정척도를 간단히 비교해보자. 명목척도는 남자에게 1을 부여하고 여자에게 2를 부여하는 것처럼 분류의 의미만을 가지며, 서열척도는 학업석차(1등, 2등, 3등)와 같이 서열(순위)을 의미하지만 그 간격이 동일하지는 않다.
한편 간격척도는 온도와 같이 절대영점을 갖지 않으나 일정한 간격을 갖는 경우이며, 비율척도는 길이나 무게와 같이 절대영점을 가지면서 하위척도의 모든 특성을 포함하는 척도를 말한다.
측정척도가 갖는 중요성은 “측정 대상이 가지고 있는 속성이 아니라 측정하는 방법에 의존한다”는 점이다. 예를 들어, 지능은 간격척도로 분류되지만 이를 상·중·하로 측정하였다면 분류의 의미로서 명목척도에 해당할 수 있다.
연령의 경우도 마찬가지로 어떻게 측정하였는가에 따라 간격척도 혹은 명목척도가 될 수 있다. 예를 들어, 연령을 10대, 20대, 30대로 측정하였다면 명목척도의 의미를 갖지만, '만 몇 세와 같이 측정하였다면 간격척도가 된다.
이밖에도 그 예는 무한히 많다. 따라서 측정의 척도는 측정하고자 하는 대상의 속성(예 : 연령, 지능)이 어떠한가가 중요한 것이 아니라 '어떻게 측정하였는가'가 중요한 문제이며, 그에 따라 분석방법이 결정된다.
사실 마케팅과 사회 및 행동과학에서 간격척도와 비율척도를 구분하는 것은 큰 의미를 갖지 않는다.
왜냐하면 자연과학과는 달리 간격척도의 구분이 명확하지 않을 뿐만 아니라 이 두 측정척도는 모두 이론적으로 정상분포를 따른다고 가정되기 때문에 동일한 측정척도의 범주로 묶을 수 있다.
유사하게 명목척도와 서열척도도 같은 의미에서 이항분포나 분포를 따르기 때문에 같은 측정척도의 범주로 묶을 수 있다.
2.다변량 자료분석의 기초
여러분들은 자신이 수집한 자료의 측정척도를 연속형' 이냐 '범주형' 이냐로만 구분해도 충분하다.
왜냐하면 어떤 다변량 자료분석을 선택할 것인가 하는 문제는 측정된 자료가 연속형이냐 범주형이냐에 따라 결정되기 때문이다.
따라서 자신이 수집한 데이터가 명목인지, 서열인지, 혹은 간격인지, 비율인지를 따지기 위해 시간을 낭비할 필요는 없으며, 다만 명목 혹은 서열(범주형)을 간격 혹은 비율(연속형)과 구분할 수만 있으면 어떤 분석방법을 적용할 것인지를 결정할 수 있다
범주형과 비연속형 자료는 엄밀한 의미에서 다르게 취급될 수 있으나 편의상 연속형과 구분한다는 의미에서 동일하게 사용하며, 여기서는 쉽게 이해되는 범주형으로 통일한다.
물론 그 후의 문제는 자료를 분석하고 해석하는 일이 남을 것이다.
측정과 관련하여 또 하나의 중요한 문제는 측정의 명확성과 관련된 것이다. 측정하고자 하는 대상을 정확히 측정하지 못했다는 것은 그 결과를 신뢰하고 일반화할 수 없다.
타당도와 신뢰도의 문제: 측정이 잘 되었는지를 확인해야 한다
3. 다변량자료분석 심화
자료의 특성이 회귀분석에 적합하지 않기 때문에 적절한 분석을 수행하지 못하게 된다.
물론, 이 경우에 대안적으로 판별분석을 수행할 수 있지만 그렇게 되는 경우 연구의 목적과 접근방법이 달라지게 된다.
따라서 최초에 계획한 연구목적을 합리적으로 달성하기 위해 자료의 수집 이전에 어떤 분석방법을 사용할 것인지를 명확히 결정해 두는 것이 올바른 연구수행에 기초가 된다.
또한 자료가 수집된 후에도 그 자료가 각 분석방법을 사용하기 위한 조건을 만족하는지를 다시 한 번 점검해야 한다. 즉, 연구의 목적이 변인간의 예측적 관계성을 검증하는 것인지(회귀분석),
관찰되지 않는 잠재적인 변인구조를 파악하고자 하는 것인지(요인분석), 예측변인들을 통해 집단을 구분하고자 하는 것인지(판별분석) 등 연구목적에 따라 자료가 수행될 분석방법에 적합한지를 검토해야 한다.
이때는 여러가지 선택 전략에 따라 적합성을 판단할 수 있을 것이다.
4. 측정의 척도와 다변량 분석방법의 선택전략
이처럼 연구목적을 확립하고 자료를 수집하고 분석하는 과정은 매우 유기적인 관련성을 갖고 있다.
자료의 수집이 앞서 말한 측정과 관련된 문제라면, 연구의 목적을 명확히 하는 것은 알고자 하는 현상을 논리적으로 풀어가려는 과학적 접근 즉, 연구문제에 대한 가설(hypothesis)의 설정과 검증과정이다.
이러한 과정을 연구설계(restearch design)라 한다. 연구설계는 포괄적인 의미에서 연구의 전체적인 연구과정을 계획하고 상정된 변인들의 측정을 포함한 변인통제와 수행될 자료분석에 대한 계획을 포함한다.
보다 좁은 의미에서 연구설계를 변인들의 명확한 효과를 얻기 위한 연구 절차의 명세화와 표준화라고 정의한다면, 연구설계와 측정, 그리고 자료분석의 유기적인 관계를 나타낼 수 있다.
'다변량자료분석의 이해와 활용' 카테고리의 다른 글
4.중다회귀분석 (0) | 2021.10.06 |
---|---|
3. 중다회귀분석 (0) | 2021.10.05 |
중다회귀분석의 기초 개념 2 (0) | 2021.10.01 |
중다회귀분석 기초개념 (0) | 2021.10.01 |
다변량 자료분석의 유형과 적용사례 (0) | 2021.10.01 |