[ DATA SCIENCE ]

모수검정과 비모수검정

목차

요약영상

1 Videos

Parametric test and non-parametric test

DataLink Research Group

DataLink Research Group, Seoul, Republic of Korea
Received Date: 2023-03-31, Revised Date: 2023-04-30, Accepted Date: 2023-05-30, Published Date: 2023-06-15
10.12972/DataLink.2024.s-4-1-3
DataLink Research Group. 2024. Data type. DataLink Library 2024:s-4-1-3.
Print

요약

통계적 가설검정은 표본 데이터를 이용하여 모집단에 대한 가설의 타당성을 판단하는 절차이며, 표본 데이터의 분포 특성과 측정 수준에 따라 모수검정(parametric test)과 비모수검정(nonparametric test)으로 구분할 수 있습니다.

모수검정은 모집단이 평균, 분산 등과 같은 모수(parameter)에 의해 특정되는 확률분포를 따른다는 가정 아래 수행되는 검정 방법입니다. 이때 실제 분석에서는 모집단의 분포를 정규분포로 가정하는 경우가 많으며, 정규분포 가정 아래에서 표본평균과 표본분산을 이용하여 검정통계량을 구성합니다. 이러한 검정통계량은 표준정규분포, 카이제곱분포, t분포, F분포 등과 연결되며, 이를 바탕으로 평균, 분산, 두 집단 간 차이, 여러 집단 간 차이 등에 대한 가설을 검정할 수 있습니다. 따라서 모수검정은 모집단의 분포 가정, 독립성, 등분산성 등의 조건이 충족될 때 효과적으로 활용될 수 있습니다.

반면 비모수검정은 모집단의 분포를 특정한 모수적 확률분포로 가정하기 어렵거나, 표본의 크기가 작거나, 표본 데이터가 순서척도 또는 명목척도로 측정된 경우에 활용됩니다. 비모수검정은 평균이나 분산과 같은 모수 자체보다 관측값의 부호, 순위, 빈도와 같은 정보를 이용하여 가설을 검정합니다. 대표적인 방법으로는 부호검정, Wilcoxon 부호순위검정, Mann-Whitney U 검정, Kruskal-Wallis 검정 등이 있으며, 이들은 특정 분포 가정이 엄격하게 충족되지 않는 상황에서 유용하게 적용될 수 있습니다. 다만 비모수검정은 일반적으로 모수검정보다 검정력이 낮을 수 있으므로, 표본 데이터의 특성과 연구 목적을 함께 고려하여 선택해야 합니다.

결국 모수검정과 비모수검정은 서로 대립되는 방법이라기보다, 표본 데이터의 조건과 분석 목적에 따라 선택되는 상호보완적 검정 방법이라고 할 수 있습니다. 연구자는 모집단의 분포 가정 가능성, 표본 크기, 측정 척도, 검정하고자 하는 가설의 성격을 종합적으로 검토하여 적절한 검정 방법을 선택해야 하며, 이를 통해 통계적 결론의 신뢰성과 타당성을 높일 수 있습니다.

주제어

가설검정, 모수검정, 비모수검정, 정규분포, 순서척도, 명목척도, 데이터종류

1. 모수검정

모수검정(parametric test)은 모집단이 정규분포일 때 주로 수행합니다.

모집단의 확률분포는 일반적으로 평균이 $\mu$ 이고 분산이 $\sigma^2$인 정규분포를 따릅니다. 그리고 표본의 개체들은 모집단의 분포와 동일한 확률분포를 따르므로 표본의 개체도 정규분포를 따릅니다.

$$X_1,X_2,\cdots,X_n \sim {\rm iid} \, N(\mu, \sigma^2)$$

모집단의 분포가 정규분포를 따르면 새로운 확률변수인 표본평균($\bar{X}$)은 평균이 $\mu$이고 분산이 $\dfrac{\sigma^2}{n}$인 정규분포를 따르고 $Z$변환한 확률변수는 표준정규분포를 따릅니다.

$$Z=\dfrac{\bar{X}-\mu}{\dfrac{\sigma}{\sqrt{n}}} \sim {\rm iid} \, N(0, 1)$$

여기서, $n$은 표본크기

표본분산($S^2$)에 $\dfrac{(n-1)}{\sigma^2}$을 곱한 또 다른 새로운 확률변수, $\chi^2$은 표본크기가 $n$인 표본에서는 자유도가 $(n-1)$인 카이제곱분포를 따릅니다.

$$\dfrac{(n-1)S^2}{\sigma^2} \sim \chi_{n-1}^2$$

표본평균($\bar{X}$)을 $Z$변환한 새로운 확률변수($Z$) 식에서 모표준편차($\sigma$)를 알지 못하여 모표준편차를 표본표준편차($S$)로 대치하면 또 다른 새로운 확률변수, $T$가 됩니다. $T$는 자유도 $(n-1)$인 t분포를 따릅니다.

$$\dfrac{\bar{X}-\mu}{\dfrac{\sigma}{\sqrt{n}}} \sim {\rm iid} \, t_{n-1}$$

두 확률변수, $V \sim \chi_{(k)}^2$와 $U \sim \chi_{(m)}^2$가 서로 독립이면 새로운 확률변수, $F$는 자유도가 $k$와 $m$인 F분포를 따릅니다.

$$F=\dfrac{\dfrac{V}{k}}{\dfrac{U}{m}} \sim \chi_{m, k}^2$$

중요한 점은 이상의 모수추정과 모수의 가설검정에서 사용할 새로운 확률변수들은 모두, 정규분포를 따르는 모집단으로부터 추출된 표본통계량 표집의 확률분포입니다.

2. 비모수검정

비모수검정(non-parametric test)은 모집단이 정규분포가 아닐 때 주로 사용합니다.

2.1. 비모수검정이 필요한 경우

  • 모집단의 분포가 정규분포가 아닌 경우 : 이항분포에서의 확률 $p$가 $\dfrac{1}{2}$이 아니어서 왜도가 발생한 경우
  • 순서척도 또는 명목척도로 관측한 데이터 : 이산형 독립변수(설명변수)의 간격을 모르고 순서만 아는 경우
  • 데이터의 수가 작은 경우 : 두 표본크기 $n_1$과 $n_2$가 작은 경우

2.2. 비모수검정의 단점

비모수검정은 모수검정보다 검정력이 낮습니다. 따라서, 비모수검정에서는 귀무가설을 기각하는  확률, $\alpha$의 값을 모수검정보다 크게 해야 합니다. 반대로 귀무가설을 채택하는 확률인  $(1-\alpha)$의 값을 비모수검정에서는 모수검정보다 작게 해야 합니다.  다르게 표현하면, 비모수검정에서는 귀무가설을 기각하지 않는 확률, $\beta$의 값을 모수검정보다 작게 해야 합니다. 반대로 귀무가설을 기각하는 확률인  $(1-\beta)$의 값을 비모수검정에서는 모수검정보다 크게 해야 합니다.

2.3. 모평균에 대한 비모수검정

  1. 1표본인 경우 : 1표본은  전체 모집단에서 추출하거나 설계한 표본이 모집단의 범주(category, 수준, level)가 없어 1개인 경우를 말함니다.
    ♦ Sign test
    ♦ Wilcoxon signed ranks (대응표본 t검정의 비모수검정, the non-parametric version of  matched samples t-test)
  2. 2표본인 경우 : 2표본은 전체 모집단에서 추출하거나 설계한 표본이 모집단의 범주가 2개여서 2개의 표본이 생성된 경우를 말합니다.
    ♦ Mann Whitney U test (독립표본 t검정의 비모수검정,  the Wilcoxon rank sum test)
    ♦ the Mann Whitney Wilcoxon test (범주가 2개인 F검정의 비모수검정)
  3. 여러 표본인 경우 : 여러 표본은 전체 모집단에서 추출하거나 설계한 표본이 모집단의 범주가 2개 이상이어서 2개 이상의 표본이 생성된 경우를 말합니다.
    ♦ Kruskal Wallis test (범주가 여러 개인 F검정의 비모수검정)

2.4. Sign Test(부호검정)

부호검정은 분포의 중앙값에 대하여 검정하는 기법입니다. 부호검정의 귀무가설은 다음과 같습니다.

귀무가설($H_0$) : 모평균=중앙값

표본데이터 값이 중앙값보다 크면 +부호를 작으면 – 부호를 부여합니다. +의 개수와 –의 개수가 비슷하면 귀무가설을 기각하지 못하고 차이가 나면 귀무가설을 기각합니다. + 값이 나오는 개수를 $X$ 라 하면 확률변수 $X$ 는 이항분포를 따릅니다.

$$X \sim Bin(n,p)$$

귀무가설이 채택되면

$$p=\dfrac{1}{2}$$

따라서 $X=x$ 라면 이항분포의 확률을 구하고, 유의수준과 비교하여 판정합니다.

2.5. Mann Whitney U test (독립표본 t검정의 비모수검정, the Wilcoxon rank sum test)

두 표본크기 $n_1$과 $n_2$가 작을 때 적용합니다.  여기서, $n_1$은작은 집단의 크기,$n_2$는큰 집단의 크기입니다. 검정순서는 다음과 같습니다.

Step 1 : 순서대로 나열하고 순서 매기기
Step 2 : 표본의 크기가 다른 경우, 크기가 작은 집단의 순위 합계($T$) 구하기
Step 3 : Wilcoxson rank sum test 를 위한 하한 경계치 $T_{\alpha}$값 찾기
Step 4 : 상한치 구하기 $n_1(n_1+n_2+1)−T_{\alpha}$
Step 5 : 판정

2.6. Mann Whitney Wilcoxon test (범주가 2개인 F검정의 비모수검정)

Step 1 : 순서대로 나열하고 순서 매기기(Wilcoxon rank sum test 와 동일)
Step 2 : $\chi^2$값을 구해서 자유도가 1인 카이제곱 분포의 기준과 비교하고 판정

2.7. Kruskal-Wallis test (범주가 여러개인 F검정의 비모수검정)

Kruskal-Wallis test는  표본이 2개 이상이고 표본의 모집단이 정규분포를 따른다는 가정을 할 수 없는 경우, 표본이 2개 이상인 경우의 모수검정인 일원분산분석 대신 적용합니다. Kruskal-Wallis test를 할 때, 서로 다른 모집단에서 추출한 표본이 독립적이고 동일한  연속형 확률분포이지만 정규분포를 따르지 않는다고 가정합니다.

가정 : 서로 다른 모집단에서 추출한 표본이 독립적이고 동일한  연속형 확률분포이지만 정규분포를 따르지 않는다

귀무가설($H_0$) : 모든 모집단의 중앙값이 동일함

대립가설($H_1$) : 최소한 하나의 중앙값이 다름

용어

데이터

데이터는 질적 또는 양적 변수값의 집합입니다. 데이터와 정보 또는 지식은 종종 같은 의미로 사용하지만 데이터를 분석하면 정보가 된다고 볼 수 있습니다. 데이터는 일반적으로 연구의 결과물로 얻어집니다. 한편, 데이터는 경제(매출, 수익, 주가 등), 정부(예 : 범죄율, 실업률, 문맹율)와  비정부기구(예 : 노숙자 인구 조사)등 다양한 분야에서도 나타납니다. 그리고 데이터를 수집 및 분석하고 시각화할 수 있습니다.

일반적인 개념의 데이터는 응용이나 처리에 적합한 형태로 표현되거나 코딩됩니다. 원시 데이터 (“정리되지 않은 데이터”)는  “정리”되기 전의 숫자 또는 문자의 모음입니다. 따라서 데이터의 오류를 제거하려면 원시 데이터에서 데이터를 수정해야 합니다. 데이터 정리는 일반적으로 단계별로 이루어지며 한 단계의 “정리 된 데이터”는 다음 단계의 “원시 데이터”가 됩니다. 현장 데이터는 자연적인  “현장”에서 수집되는 원시 데이터입니다. 실험 데이터는 관찰 및 기록을 통한 과학적 조사에서 생성되는 데이터입니다. 데이터는 디지털 경제의 새로운 자원입니다.

출처

Data – Wikipedia