Nominal : 각 데이터마다 Label이 정해져 있는 것 (Name) / Classification 문제
ex) 어떤 (R,G,B) 값으로 구성된 색상을 보고, 이건 무슨색이다라고 이름을 맞추는 것
Ordinal : 어떤 데이터를 보고 랭킹을 정하는 것 (Order) / Regression 문제, 그러나 각 랭킹 사이의 거리가 일정하지 않을 수 있음. (즉 1등하고 2등하고의 실제 맞은 점수 차이는 엄청 작을 수도 있다는 것)
ex) 영화 10개를 보고, 1~10등 까지 정하는 것. (이 때 1등과 2등은 근소한 차이일 수 있음)
Interval : 어떤 데이터를 보고 자유롭게 평점을 정하는 것 / Regression 문제. Ordinal에서 보다 거리 정보를 고려한 것
ex) 영화를 보고 0.0 ~ 10.0 까지 점수를 매기는 것 (당연히 점수 간의 거리에 의미가 있음)
Ratio : 어떤 데이터의 정확한 값을 정하는 것 / Regression 문제. Interval에서 한발 더 나아가 정확한 실수 값을 찾는 것.
Real world를 정확하게 반영하려는 것이나, 현실적으로 불가능에 가까움
ex) 공채에 찍힌 두 점사이의 거리를 오차없이 정확하게 측정하는 것. (자로 재는 것은 결국 쟤는 사람에 따라 오차가 생기므로 Interval임.)
http://www.csse.monash.edu.au/~smarkham/resources/scaling.htm#nominal
'Research > Machine Learning' 카테고리의 다른 글
Gaussian Distribution, Gaussian Mixture Model (0) | 2014.06.11 |
---|---|
Clustering, GMM, K-means, EM, DBSCAN (0) | 2014.06.11 |
거리, Distance (0) | 2014.06.11 |
ROC curve, ROC_AUC, PR_AUC, 민감도, 특이도 (15) | 2014.06.11 |
조건부 독립과 응용 (0) | 2014.06.06 |
댓글