본문 바로가기

전체보기205

조건부 독립과 응용 무조건 독립 (Unconditional independence) : P(A,B) = P(A)*P(B), A⊥B 으로 표기 우리가 일반적으로 말하는 독립. A와 B 사건은 어떠한 상황에서도 서로 독립이다. 그러나 이러한 예는 실제 세계에서는 그다지 존재하지 않는다. 조건부 독립 (Conditional independence) : P(A,B|C) = P(A|C)*P(B|C) , (AㅛB)|C 으로 표기 조건부 독립. A와 B 사건은, C사건 하에서는 서로 독립이다. 줄여서 CI라고도 한다.(다른 D사건의 전제하에해서는 독립일 수도, 아닐 수도 있다.) 이때 그냥 A와B는 서로 독립이 아님. 왜냐하면 서로 C를 통한 연관성이 있기때문. 그러나 C가 일어난 상황에서는 A,B를 서로 독립이다. 왜냐하면 모든 연관.. 2014. 6. 6.
Overfitting, Underfitting, Cross-validation Overfitting (과적합) : training 데이터 셋에 대해서는 매우 높은 성능을 보이지만, 학습할 때 사용되지 않은 test 데이터 셋에 대해서는 정확도가 떨어지는 문제.Underfitting : training 데이터를 충분히 학습하지 못하여, test 데이터 뿐만 아니라, training 데이터에서 조차도 성능이 낮은 문제. K-Fold Cross-validation (교차검증, 교차타당화) : 전체 데이터 셋에서 training과 test 성능을 통계적으로 타당하게 측정하는 방법. 전체 데이터를 랜덤하게 나누어 K 등분을 하고, K개 중 1번 째 데이터를 test 셋으로, 나머지 전부를 training 셋으로 사용하여 학습한 모델의 성능을 측정한다. 그다음 다시 K개중 2번 째 데이터를 .. 2014. 6. 6.
Linearity, Non-Linearity, Linear Regression, Logistic Regression Linearity (선형성) : 두개의 벡터스페이스가 오직 덧셈의 관계로만 있는 것. 즉 독립변수X들간에 서로 상관관계가 없다.y=ax1+bx2+...+e (그래서 보통 y=XT+E 로 표현.) 여기서 XT는 x변수들의 매트릭스임. 정의: f(a*x1 + b*x2)=a*f(x1) +b*f(x2) 를 만족하는 함수 f를 선형함수라고 한다. Ex) 여러개의 x 변수들끼리의 관계가 선형적인 것 (덧셈 관계) (어떤 건물에 방이 10개있다면 전체 건물의 가격은 방1에서 방10까지의 가격의 합과 비례한다.(덧셈 관계)) - 선형함수: f(x+y) = f(x)+f(y) 를 만족하고, 동시에 f(ax) = af(x)를 만족하는 함수 f를 선형함수라고 한다. https://en.wikipedia.org/wiki/Lin.. 2014. 6. 6.
Parametric vs Non-parametric 차이점 구분하기"Unlike a parametric model, where the number of parameters stay fixed with respect to the size of the data.In nonparametric models, the number of parameters grows with the number of data points."https://stats.stackexchange.com/questions/46588/why-are-gaussian-process-models-called-non-parametric 즉, 파라미터의 개수를 정확히 셀 수 없는 경우에 논파라메트릭이라고 한다. # Parametric Model : 데이터가 특정한 모델을 따른다고 가정하고, 그것의 고정.. 2014. 6. 5.
K-Nearest Neighbors, IB1, IBk K-nearest neighbors : Machine Learning 중 가장 간단한 방법, base line으로도 쓰이며 유클리드 거리에 기반하여 가장 가까운 k개의 instance를 같은 클래스로 묶어서 분류하거나 클러스터링하는 알고리즘이다.단점-> 계산량이많고, 메모리가 많이 필요하다. 노이즈에 약하다, 고차원에서 성능이 좋지 않다.(고차원에서 유클리드 거리를 측정하면, 매우 값이 크게 나오기 때문에 nearest neighbor라고 하기 어렵다는 것 같음.)장점-> 정확도가 높다. ex) 테스트케이스가 주어짐. K=1이라면, 가장 근접한 1개의 점을 찾아서, 그것과 동일한 레이블을 다는 것.(보로노이 테셀레이션) K=10이라면, 가장 근접한 10개의 점을 찾아서, 그중에서 가장 많은 것의 레이블을.. 2014. 6. 4.
[톰캣] 리눅스 톰캣 재시작 cd tomcat/bin/ 이동하면 tomcat 실행 파일이 존재합니다. ./shutdown.sh 2014. 5. 18.
[HTML] onsubmit onsubmit 을 이용해 폼체크를 하신후 submit을 하실거면 onsubmit="return formck();" 이렇게 해주셔야 onsubmit에서 true일시 submit을 false 일시 submit을 안날리게되요 ㅋ[출처] [javascript]form에서 onsubmit return false가 먹히지 않을때 에러 해결|작성자 써니 http://les2575.blog.me/70158666668 onsubmit의 의미 -> submit버튼을 누르기전에 특정 일을 처리하며, true일때만 submit을한다 2014. 5. 18.
Regression 모델의 성능 평가, 회귀분석 결과 확인 # 회기 분석 결과상관계수(Correlation coefficient): 두 변수간의 연관된 정도를 나타냄. # 모델의 성능 평가다음 둘다 오차율을 나타내는 값임.(둘다 오차의 정도에대한 값이므로, 당연히 0에 가까울수록 좋음)Root Mean Square Error (RMSE) : 편차 제곱의 평균에 루트를 씌운 값.이걸 기준으로 성능을 올리면, 이는 표준편차를 기준으로 하기때문에, 큰 에러를 최대한 줄이는 방향으로 학습을 함.-> ex) 정답이 9인 경우 9, 9, 6, 9 보다 8, 8, 8 ,8 를 좋게 평가 Mean absolute error (MAE) : 편차에 절대값을 씌운것의 평균단순 편차의 절대값의 평균임. 그러므로 RMSE와 달리 작은 에러에 더 민감함.-> ex) 정답이 9인 경우 8.. 2014. 5. 16.
세션 한글 정보 처리 http://blog.naver.com/gdrtlee?Redirect=Log&logNo=100131252789 보는것 처럼, post로 전송하고 서블릿에서는 req.setCharacterEncoding("utf8");resp.setContentType("text/html; charset=utf8");JSP에서는 (기능은 똑같음) 2014. 5. 13.
SQL COUNT와 실행결과 resultset SELECT COUNT(num) AS total_num FROM tableCOUNT는 해당 컬럼의 전체 개수를 구해줌. AS 변수명을 사용하면 결과값을 해당 변수에 저장가능. http://blog.naver.com/makand123?Redirect=Log&logNo=30176890950 sql 실행결과는 resultset에 저장되며, next를 한번해줘야 처음결과가나옴.http://www.javacool.net/_cool/api_doc/kor_jdk11api/java.sql.ResultSet_dsc.htm 2014. 5. 8.
Git 사용방법 # git을 공부하기에 좋은 최적의 입문 자료 https://git-scm.com/book/ko/v2/%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0-%EB%B2%84%EC%A0%84-%EA%B4%80%EB%A6%AC%EB%9E%80%3F# Git의 기본 매커니즘. 아래의 그림이 전체 아키텍처를 전부 설명해준다. git은 svn과 달리 local repo와 remote repo가 구분되어 있어서 매우 편리한 분산 버전 관리 시스템이다.# 일단 git commit으로 로컬에 저장해놓은 데이터는 완벽히 보존된다! 내가 겪은 버그는 ipython의 자동저장기능 때문에, git checkout으로 이동 중 과거에 켜둔 웹이 최신버전에 자동저장되면서 마치 데이터가 사라진것 처럼 보이는 현상이었음.. 2014. 5. 7.
Mysql 테이블 복사 * 구조 복사Create Table new_table like old_table 특징 : 기존 테이블의 설정 그대로 복사 된다. 참고 ==> 큐브리드의 경우 복사하고자 하는 기존 테이블에 'Primary Key' 또는 'auto_increment' 가 설정 되어 있으면 복사 할 수 없음. 응용 ==> Create Table IF NOT EXISTS new_table like old_table (new_table 이 없으면 복사) * 구조와 데이터 복사Create Table new_table ( select * from old_table ) 특징 : 테이블의 구조와 함께 데이터도 함께 복사가 된다. 주의 ==> 큐브리드의 경우와 같이 기존 테이블에 'Primary Key' 또는 'auto_increment.. 2014. 5. 7.
세션과 쿠키 세션과 쿠키 둘다 안드로이드 프리퍼런스처럼 key값과 내용물을 묶어서 보관하는 것.다만 쿠키는 웹브라우저에 저장, 세션은 웹서버쪽에 저장함.사용법도 거의 유사함. 쿠키는 보안이 필요 없는 데이터를 저장하는게 좋고, 세션은 보안이 중요한 데이터를 저장하는게 좋음. 그리고 세션은 같은 웹디렉토리안에있는 웹컴포넌트끼리는 데이터공유가 가능. 쿠키는 웹브라우저 및 기타 다른프로그램에서도 접근가능. http://rooney-textcube.blogspot.kr/2009/08/jsp-%EC%84%B8%EC%85%98%EC%9D%84-%EC%9D%B4%EC%9A%A9%ED%95%B4%EC%84%9C-%EB%A1%9C%EA%B7%B8%EC%9D%B8%EC%83%81%ED%83%9C-%EC%9C%A0%EC%A7%80.html 2014. 5. 7.
JSP 와 서블릿에서의 클래스 멤버 변수 servlet의 경우는 WAS가 기동시 servlet 인스턴스 하나만 생성하여 모든 worker thread가 공용으로 사용하기 때문에 위와 같은 현상이 발생합니다. 전역변수(정확히는 클래스의 member 변수) 역시 인스턴스 별로 관리가 되기 때문에 위 코드는, wait 수행 전 worker thread들이 str 변수 값을 계속 덮어쓰기 때문에 발생하는 현상입니다. JSP 같은 경우는 기본적으로 servlet과 같이 취급되나, JSP 파일 내에 기술된 기본적인 모든 변수들이 local 변수로 취급되므로 상대적으로 servlet보다는 안전합니다. 그러므로 servlet 사용시 전역변수 및 member 변수는 모든 요청이 공통으로 사용해야 하는 read only 성격의 데이터만을 사용하는 것이 안전하며,.. 2014. 5. 6.
HTML 레퍼런스 # Youtube iframe 삽입 시 가운데 정렬하기 https://stackoverflow.com/questions/8366957/how-to-center-an-iframe-horizontally http://www.w3schools.com/tags/default.asp - div 태그란음.. 웹표준이 중요해지면서 출력하는 모든 태그를 통합해버린 녀석이 div인듯.원래는 레이어?같은 용도였으나, 그림도넣고 글도넣고 테이블처럼 할수도있고 무궁무진한듯.http://gskool.tistory.com/43http://xxwony.egloos.com/55671http://www.everdevel.com/kr/main/main.php - Table / thead tbody tfoothttp://blog.nave.. 2014. 5. 6.
JSP,javascript 페이지 이동하기,타이머 사용하기 - JSP 페이지 이동1. pageContext.forward : 이녀석은 원래 웹서버가 내부 자원을 호출할 때 사용. 그래서 내부 데이터를 파라미터 객체로 공유가능함. 대신 외부 url접근 불가 2. response.sendRedirect : 웹브라우저에게 요청하여 외부에서 리다이렉팅. 따라서 밖에있는 웹서버 또한 접근이 가능. 단, 외부용인만큼 url인코딩으로 데이터를 넘겨야함. (그리고 원래 URL변경시 쓰던녀석이라 url흔적을 남기지 않음.) -경로/로 시작하면 URL을 처음부터 인식그렇지 않으면 현재위치에서 상대적인 URL로 인식 ex) /sp/dao/SignDao -> ULR 절대 경로 dao/SignDao -> 현재 위치에서 다음 경로를 덧붙임 getRealPath("파일명") : 해당파일의.. 2014. 5. 5.
DB 기초 지식 릴레이션 = 테이블 : 엑셀에서의 한 시트라고 보면됨튜플 = 레코드 = 로우 : 즉 한 행에 있는 데이터 한줄을 가리킴.어트리뷰트 = 컬럼 : 한 렬, 즉 세로 한줄이 데이터를 가리킴.카디널리티 = 튜플(레코드)의 개수디그리 = 어트리뷰스(컬럼)의 개수 기본키 : 해당 테이블에서의 데이터들을 참조할 때 쓰여야하는 값. 한마디로 테이블에서 검색을 수행하고자 할 때 주로 사용되는 INDEX 같은 녀석. 그러므로 당연히 유니크한 단 1개의 컬럼만 지정가능함. 그러면 서치수행속도가 현저이 빨라짐. AUTO_INCREMENT는 MySQL의 특징 중의 하나이다. 레코드를 삽입할 때마다 컬럼의 값을 자동으로 하나 씩 증가시켜 준다. 예를 들어 마지막 레코드의 No가 10이었으면 그 다음 레코드를 삽입할 때 자동으로 .. 2014. 5. 5.
[신경 과학] 기초가되는 자료 다음 블로그에서 옛기억을 떠올리며 신경과학의 기초를 복습함.http://www.mind21.net/2.htm 뉴런은 세포분열을 하지않는다고 알려져있었으나, 최근에 성인에게서도 신경줄기세포가 발견되었다고함. 즉 계속 증가한다.한 뉴런은 3만개의 뉴런으로부터 정보를 받아 다른 1만개의 뉴런에게 전달한다고함.. 미쳤네; 규모가..뉴런은 수상돌기(dendrites)와 축삭돌기(axon)이 존재하며, 수상돌기는 다른뉴런으로부터 정보를 입력받는 인풋, 축삭돌기는 다른 뉴런에게 정보를 전달하는 아웃풋을 담당한다. 그리고 이 가운데에는 신경세포체가 있다.(몸통역할, 가운데 핵이 있음)이 뉴런과 뉴런의 사이를 Synapse라고하며, 고등생물은 화학적인, 신경 전달 물질을 사용해 신호를 전달(속도가 느리나 더 진화됬다고함.. 2014. 5. 2.
스프링 예제들 + SQL 기본 스프링을 하루에 꼬박 꼬박 2시간씩 공부하기로 했다. 안그랬다가는 바쁜 대학원 삶에 그대로 치여버릴 것 같았다.스프링 예제를 열심히 찾아보았다. 스프링 예제http://kimseunghyun76.tistory.com/search/%EA%B2%8C%EC%8B%9C%ED%8C%90http://java-school.net/spring/list1.phphttp://blog.naver.com/PostView.nhn?blogId=duarlcjf&logNo=110183020718 오오 다음 블로그에서 SQL의 기본을 익힘(글쓴이에게 무한한 감사를..)http://killmewild.blog.me/30098553354 다음은 위 블로그를 보고 정리한 SQL 기본 내용이다.-------시작메뉴, Mysql server .. 2014. 4. 30.
[스프링 소개] STS, Maven, Git hub 요즈음 스프링으로 간단한 웹사이트를 개발하려고 공부중이다.무려 7만원 어치의 토비의 스프링을 1,2 권 모두 구입하였으나.. 다소 원론적, 이론적인 이야기가 너무 많아 재미가 없다. 꾹 참고 보려했으나 나는 실제로 경험해보고 부딪혀 보면서 무언가 배우는 스타일이라 맞지 않았다. 그래서 작년에 창업 할 때 동료 프로그래머가 만든 게임 운영툴 소스를 분석하여 공부를 하고 있는데, 너무 다양한 기술들이 적용되어 분석이 쉽지 않다. 로그인 관련된 부분을 아이에 Spring_security라는 녀석이 통째로 담당하더라.. 일단 나는 웹을 php이후로 거의 처음 해보는 지라 아주 초보적인 내용을 적어보겠다.Spring은 대한민국 전자 정부 표준 프레임워크이며, 실제로 자바기반의 웹 개발 프레임워크중 세계적으로 제일.. 2014. 4. 28.