본문 바로가기

연구/실험, 분석5

CNN, Spectrogram 을 CNN으로 학습 CNN(Convolutional Neural Network)model.add(Convolution2D(96, 1, 11, 11, subsample=(4, 4))) number_of_filter / stack_size / row / column size_of_filter / convolution_size(subsample)즉 96개의 피쳐를 추출하는, 11*11*3 사이즈의 filter를 만들것임. 이 filter는 (4,4)간격을 가지며 convolution함stack이란 : 일반 이미지는 (R,G,B)형태의 3차원 vector로 데이터가 구성되어 있음. 따라서 stack_size가 3이어야만 돌아감. 즉 r평면, g평면, b평면이 3층으로 쌓여 있는 3차원 매트릭스임.그래서 이 filter하나에는 11.. 2015. 4. 22.
Fourier Transform, Power Spectrum, MFCC 소리: 바람과 같이 그냥 공기(매질)가 움직이는 것은 소리가 아니다. 공기에 주기적으로 진동이 발생해야만이 소리란 정보가된다. 즉 공기를 매질로하는 파동정보가 바로 소리이다. 이때 파동의 진동수가 작으면 낮은 에너지를 가진 저음이고, 진동수가 크면 많은 에너지를 가진 고음이다. 마이크 녹음과정: 마이크의 떨림판을 소리가 부딪혀와서 떨리게 한, 떨림판의 진동폭을 전기적으로 변환해서(발전기의 원리와 동일) +-로 기록한 소리파동에대한 정보이다. 단, 떨림판을 진동시켜서 발생한 전기는 analog signal이기 때문에 이를 digital signal로 변환해서 사용한다. 이 과정에서 sampling이 필요하다. (스피커: 위의 과정을 정반대로 수행하는 것.) Wav 파일: 소리 파동의 높이 값(float형).. 2015. 4. 22.
공분산, 상관계수, 왜도, 첨도 Variance: 편차제곱의 평균 == X제곱의 평균 - X평균의 제곱 즉 편차의 정도를 제곱내서 측정하는 것.(제곱을 안하면 부호가 양수와 음수가 있어서 평균내면 항상 0이 됨) Covariance: X편차 * Y편차 = XY의 평균 - X평균Y평균 두 편차 random variable가 같이 변하는 방향성이 있는지 측정또는 N차원 공간 상에서, 각각의 차원들이 서로 상관성을 갖는지를 측정하는 것임. 즉 어떤 dim과 어떤 dim은 서로 100%의 상관성을 갖는다라고 하면, 이 dim은 하나로 합쳐질 수 있는 것임. 왜도 (Skewness) : 이 분포가, 좌우로 얼마나 치우쳐져 있는가를 나타낸다. 첨도 (Kurtosis) : 이 분포가 얼마나 뾰족한가를 나타낸다. (컬토시스 -> 칼의 뾰족함) 공분산.. 2014. 6. 11.
ROC curve, AUC, 민감도, 특이도, PR_AUC ROC curve (Receiver Operating Characteristic curve) : FPR과 TPR을 각각 x,y축으로 놓은 그래프. ROC curve는 X,Y가 둘다 [0,1]의 범위이고, (0,0) 에서 (1,1)을 잇는 곡선이다. - ROC 커브는 그 면적이 1에 가까울수록 (즉 왼쪽위 꼭지점에 다가갈수록) 좋은 성능이다. 그리고 이 면적은 항상 0.5~1의 범위를 갖는다.(0.5이면 랜덤에 가까운 성능, 1이면 최고의 성능)TPR : True Positive Rate (=민감도, true accept rate) 1인 케이스에 대해 1로 잘 예측한 비율.(암환자를 진찰해서 암이라고 진단 함)FPR : False Positive Rate (=1-특이도, false accept rate) .. 2014. 6. 11.
Regression 모델의 성능 평가, 회귀분석 결과 확인 # 회기 분석 결과상관계수(Correlation coefficient): 두 변수간의 연관된 정도를 나타냄. # 모델의 성능 평가다음 둘다 오차율을 나타내는 값임.(둘다 오차의 정도에대한 값이므로, 당연히 0에 가까울수록 좋음)Root Mean Square Error (RMSE) : 편차 제곱의 평균에 루트를 씌운 값.이걸 기준으로 성능을 올리면, 이는 표준편차를 기준으로 하기때문에, 큰 에러를 최대한 줄이는 방향으로 학습을 함.-> ex) 정답이 9인 경우 9, 9, 6, 9 보다 8, 8, 8 ,8 를 좋게 평가 Mean absolute error (MAE) : 편차에 절대값을 씌운것의 평균단순 편차의 절대값의 평균임. 그러므로 RMSE와 달리 작은 에러에 더 민감함.-> ex) 정답이 9인 경우 8.. 2014. 5. 16.