본문 바로가기
Research/Machine Learning

Nominal, Ordinal, Interval, Ratio

by IMCOMKING 2014. 6. 11.

Nominal : 각 데이터마다 Label이 정해져 있는 것 (Name) / Classification 문제

ex) 어떤 (R,G,B) 값으로 구성된 색상을 보고, 이건 무슨색이다라고 이름을 맞추는 것


Ordinal : 어떤 데이터를 보고 랭킹을 정하는 것 (Order) / Regression 문제, 그러나 각 랭킹 사이의 거리가 일정하지 않을 수 있음. (즉 1등하고 2등하고의 실제 맞은 점수 차이는 엄청 작을 수도 있다는 것)
ex) 영화 10개를 보고, 1~10등 까지 정하는 것. (이 때 1등과 2등은 근소한 차이일 수 있음)


Interval : 어떤 데이터를 보고 자유롭게 평점을 정하는 것 / Regression 문제. Ordinal에서 보다 거리 정보를 고려한 것
ex) 영화를 보고 0.0 ~ 10.0 까지 점수를 매기는 것 (당연히 점수 간의 거리에 의미가 있음)


Ratio : 어떤 데이터의 정확한 값을 정하는 것 / Regression 문제. Interval에서 한발 더 나아가 정확한 실수 값을 찾는 것.
Real world를 정확하게 반영하려는 것이나, 현실적으로 불가능에 가까움
ex) 공채에 찍힌 두 점사이의 거리를 오차없이 정확하게 측정하는 것. (자로 재는 것은 결국 쟤는 사람에 따라 오차가 생기므로 Interval임.)


http://www.csse.monash.edu.au/~smarkham/resources/scaling.htm#nominal

http://kin.naver.com/qna/detail.nhn?d1id=11&dirId=1113&docId=118003841&qb=bm9taW5hbCBvcmRpbmFsIGludGVydmFsIHJhdGlv&enc=utf8&section=kin&rank=1&search_sort=0&spq=0&pid=SZmuhspySo8sssNqthdsssssss4-460664&sid=VEg-nHJvLDQAADpYHGQ

'Research > Machine Learning' 카테고리의 다른 글

Gaussian Distribution, Gaussian Mixture Model  (0) 2014.06.11
Clustering, GMM, K-means, EM, DBSCAN  (0) 2014.06.11
거리, Distance  (0) 2014.06.11
ROC curve, ROC_AUC, PR_AUC, 민감도, 특이도  (15) 2014.06.11
조건부 독립과 응용  (0) 2014.06.06

댓글