본문 바로가기
Research/Science & Mathmatics

T-Test에 대한 이해

by IMCOMKING 2024. 2. 2.

 

 

 

scikit learn에는 두가지 종류의 t-test가 구현되어 있다.

하나는 ttest_ind이고, 다른하나는 ttest_rel이다.

 

전자는 두 종류의 sample들이 완전히 독립적으로 추출되었을 때를 가정하고, 후자의 경우 그 반대를 의미한다.

 

 

T-test의 구체적인 계산 과정은 아래와 같다.

https://diseny.tistory.com/entry/t-test-%EB%B0%91%EB%B0%94%EB%8B%A5%EB%B6%80%ED%84%B0-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0

 

 

즉, 각 분포에서 뽑은 sample들의 차이들의 평균을 구해서 빼주고, 그리고 분모에 해당하는 모집단의 분산은 직접 구할수가 없기 때문에, 각 sample들의 분산을 구한다음 합쳐서 사용하는 방식으로 계산이 된다. 

 

 

그리고 이렇게 구한 t value는 t분포를 이용해서 p-value로 변환할 수 있고, 이 p-value는 분포가 서로 다를 확률을 나타낸다. 아래 사이트에서 실제로 값을 넣어서 p-value를 구해볼 수 있다.
https://www.socscistatistics.com/pvalues/tdistribution.aspx#google_vignette

 

 

 

 

 

 

 

 

댓글