scikit learn에는 두가지 종류의 t-test가 구현되어 있다.
하나는 ttest_ind이고, 다른하나는 ttest_rel이다.
전자는 두 종류의 sample들이 완전히 독립적으로 추출되었을 때를 가정하고, 후자의 경우 그 반대를 의미한다.
T-test의 구체적인 계산 과정은 아래와 같다.
즉, 각 분포에서 뽑은 sample들의 차이들의 평균을 구해서 빼주고, 그리고 분모에 해당하는 모집단의 분산은 직접 구할수가 없기 때문에, 각 sample들의 분산을 구한다음 합쳐서 사용하는 방식으로 계산이 된다.
그리고 이렇게 구한 t value는 t분포를 이용해서 p-value로 변환할 수 있고, 이 p-value는 분포가 서로 다를 확률을 나타낸다. 아래 사이트에서 실제로 값을 넣어서 p-value를 구해볼 수 있다.
https://www.socscistatistics.com/pvalues/tdistribution.aspx#google_vignette
'Research > Science & Mathmatics' 카테고리의 다른 글
확률 통계에서 분포에 대해 말하는 모드(Mode)란 (0) | 2023.08.21 |
---|---|
CCA(Canonical Correlation Analysis) (0) | 2023.03.21 |
소리에 대한 사람의 인지적인 특성 (0) | 2021.01.07 |
레이더와 라이다 (0) | 2020.07.21 |
신경과학의 원리 1 수업 - Chapter 1. The Brain and Behavior (0) | 2016.09.19 |
댓글