Research/Science & Mathmatics
T-Test에 대한 이해
IMCOMKING
2024. 2. 2. 16:41
scikit learn에는 두가지 종류의 t-test가 구현되어 있다.
하나는 ttest_ind이고, 다른하나는 ttest_rel이다.
전자는 두 종류의 sample들이 완전히 독립적으로 추출되었을 때를 가정하고, 후자의 경우 그 반대를 의미한다.
T-test의 구체적인 계산 과정은 아래와 같다.
즉, 각 분포에서 뽑은 sample들의 차이들의 평균을 구해서 빼주고, 그리고 분모에 해당하는 모집단의 분산은 직접 구할수가 없기 때문에, 각 sample들의 분산을 구한다음 합쳐서 사용하는 방식으로 계산이 된다.
그리고 이렇게 구한 t value는 t분포를 이용해서 p-value로 변환할 수 있고, 이 p-value는 분포가 서로 다를 확률을 나타낸다. 아래 사이트에서 실제로 값을 넣어서 p-value를 구해볼 수 있다.
https://www.socscistatistics.com/pvalues/tdistribution.aspx#google_vignette