오늘날 여러 가지 목적으로 사용되는 통계 검정 방법이 개발된 것은 사실 그다지 역사가 깊지 않습니다. 평균의 차이를 검정하는 t 검정의 역사 역시 100년이 조금 넘었을 뿐입니다. 1908년에 t 통계량에 대한 내용을 발표한 것은 윌리엄 고셋 (William Sealy Gosset)으로 사실 그는 기네스 양조회사의 화학자였습니다.
고셋이 t 검정을 연구한 이유는 제조되는 맥주의 품질 관리를 위한 것으로 이 시기 t 통계량을 확립한 것은 이후 통계학의 발전에 엄청난 영향을 끼치게 됩니다. 다만 기네스사는 당시 개인의 이름으로 연구를 발표하는 것을 금지했기 때문에 고셋은 그의 필명인 스튜던트(Student)라는 이름을 사용했고 오늘날 우리가 이 명칭을 널리 사용하는 계기가 되었습니다.
(윌리엄 고셋의 사진. William Sealy Gosset, who developed the "t-statistic" and published it under the pseudonym of "Student".)
그래서 t 검정에서 고전에 속하는 독립표본 t 검정 (Independent two-sample t-test)을 흔히 스튜던트 t 검정 (Student's t-test)라고 부르지만, 사실 엄격히 구분해서 말하면 두 개의 표본의 크기와 분산이 같을 때 사용하는 것이기 때문에 실제로는 많이 쓰인다고 하기는 어렵습니다. R 코드와 함께 이야기를 알아보겠습니다.
A반 남학생 15명의 키가 평균이 170cm에 분산이 5cm이고 B반 남학생 18명의 키의 평균이 168cm에 분산이 4cm이라면 A반 남학생의 키가 B반보다 크다고 할 수 있을까요? 코드를 실행시켜 알아봅시다. 일단 같은 결과를 재현하기 위해 같은 시드값을 써서 표본을 만든 후 t.test()를 이용해서 독립표본 t 검정을 수행합니다. t.test 안에는 비교하고자하는 두 개의 데이터를 넣어주면 됩니다. 여기서는 각가 A,B라고 합니다.
> set.seed(1234)
> A<-rnorm span="">-rnorm>
> set.seed(1234)
> B<-rnorm span="">-rnorm>
> t.test(A,B)
Welch Two Sample t-test
data: A and B
t = 1.2637, df = 25.311, p-value = 0.2178
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.118121 4.674905
sample estimates:
mean of x mean of y
168.3135 166.5351
>
여기서 귀무가설은 두 반의 평균이 같다는 것입니다. t 통계량은 1.2637, 자유도는 df = 25.311 P 값은 0.2178 이 나왔습니다. 참고로 95 percent confidence interval에 대한 해석은 나중에 따로 설명할 예정이고 여기서는 그냥 넘어가겠습니다.
아무튼 독립표본 t 검정을 시행했는데, 여기서 의문이 두 가지 떠오릅니다. 독립표본이라는 의미와 더불어 왜 웰치 이표본 t 검정이 나왔을까요? 하나씩 설명해 봅니다.
1. 독립표본
두 개의 표본은 서로 독립적일수도 있고 아닐 수도 있습니다. 예를 들어 다이어트 전후 체중 변화는 본래 체중이 얼마였는지 관련이 있을 수밖에 없습니다. 반면 남녀의 키 차이 같은 관측치는 두 군 간에 독립적인 결과를 보여줄 것입니다.
따라서 독립표본 t 검정은 비교하고자 하는 두 집단이 서로 독립적이라는 가정을 기본으로 가지고 있습니다. 만약 독립적이지 않은 두 표본을 비교하는 경우에는 paired t test를 진행하게 됩니다. 이 부분은 나중에 설명하게 될 것입니다.
2. 정규성과 등분산성
고전적인 스튜던트 t 검정은 두 집단이 모두 정규 분포를 따르고 분산이 같다고 가정하고 진행합니다. 표본 수는 같을 수도 있고 아닐 수도 있는데, 각 경우에 계산이 좀 달라지게 됩니다. 아무튼 두 표본의 분산이 같은 경우는 그렇게 흔하지 않기 때문에 실제로는 분산이 같은 (equal variance) 두 표본을 비교하는 일은 많지 않습니다. 실제로 많이 하는 것은 웰치 t 검정입니다. 이는 서로 표본 숫자는 물론 분산이 달라도 적용이 가능합니다. (Equal or unequal sample sizes, unequal variances)
웰치 t 검정은 정규성만 만족하면 표본수나 분산이 서로 달라도 사용이 가능하므로 t 검정을 더 폭넓게 사용할 수 있는 장점이 있습니다. 따라서 R에서도 기본으로 독립표본 t 검정의 경우 웰치 t 검정 (Welch's t-test, or unequal variances t-test)를 사용합니다. 이는 표본수가 같거나 혹은 분산이 같아도 마찬가지입니다.
이렇게 윌치 t 검정이 표본의 가정에 덜 영향을 받고 신뢰할 수 있는 결과를 보여주기 때문에 통계학적으로는 더 강건한 (robust) 결과를 보여준다고 말합니다.
따라서 기본적으로 R에서 독립 표본 t 검정을 시행하는 경우 실제로는 웰치 t 검정을 시행하므로 논문에도 그렇게 쓰던가 아니면 간단히 t test나 Independent two-sample t-test를 사용했다고 설명하는 것도 좋은 방법입니다. student t test를 사용하기 위해서는 별도로 계산을 해야 하지만, 아마도 그렇게 하는 경우는 거의 없을 것입니다.
각 통계적 방법에 대해서 더 자세한 설명을 알고 싶다면 아래 위키피디아 항목을 참고하면 도움이 될 것입니다.
참고
댓글
댓글 쓰기