Paper Review(논문이야기)/관련 개념 정리
-
[TIL] Confustion Matrix, ROC, AUCPaper Review(논문이야기)/관련 개념 정리 2025. 3. 15. 20:28
Confusion Matrix란 claassfication 문제에 있어서 여러 지표를 알려주는 가장 근간이 되는 지표이다. 본 글에서는 binary classiifiication에 집중하여 내용을 작성한다. 본 자료는 KAIST 이종석 교수님의 제조인공지능 강의노트를 기반으로 작성되었고, 이미지 및 자료의 출처는 이를 따릅니다. 우선 다음을 가정하자. 우리는 기본적으로 postve class, 양성 샘플에 더 집중할 것이다. 이는 다음과 같다. – Minority class (or positive(+) class): with fewer instances– Majority class (or negative(−) class): with more instances 예를 들면 베터리 제조 공정에서 불량품을 ..
-
[Kernel][미완] Reproducing Kernel Hilbert Space (RKHS)Paper Review(논문이야기)/관련 개념 정리 2025. 3. 14. 15:40
[아직 미완... 한번 더 내용을 정리해서 올릴 예정임] Kernel에 관하여 우선 간단히 정리하고 이후에 RKHS 커널에 관해서 자세히 알아보자. 커널은 우선 SVM과 같은 알고리즘에서 중요한 역할을 하는 함수로, 데이터를 고차원 Feature map으로 맵핑시켜서 선형분할 가능하게 만들어준다.추가 참고자료: http://www.gatsby.ucl.ac.uk/~gretton/coursefiles/lecture4_introToRKHS.pdf대부분의 Lemma의 참고자료 Kernel저차원 입력 데이터를 고차원 특징 공간으로 매핑하여, 저차원에서는 보지 못했던, 학습하지 못했던 패턴을 파악하도록하는 함수이다. 다시 말해 비선형 데이터를 고차원에 맵핑시켜 선형적으로도 학습 가능하게 한 것이다. 이는 Co..
-
[Stat][검정] 순열 검정(Permutation test)Paper Review(논문이야기)/관련 개념 정리 2025. 3. 13. 20:12
비모수 검정 관련 방법들을 보다가 Below Permutation null ~, 이라는 말이 너무 많이 나와서 한번 정리해본다. 본 내용은 https://angeloyeo.github.io/2021/10/28/permutation_test.html 공돌이의 수학노트의 내용을 기반으로 작성되었습니다. 대부분의 그림자료 또한 해당 블로그의 자료임을 밝힙니다. 우선 Permutation test에 관해 알아보자. Permutaion test순열검정법(permuation test)은 두 개 이상의 표본을 함께 결합하여 관측값들을 무작위로 재표본으로 추출하고 이를 이용하여 가설 검정을 진행하는 방법을 말한다. 이때 재표본 추출(resampling)은 비복원 방식으로 진행한다....? 조금 더 알아보자. 두 ..
-
[Time Series][Change point Detection] CUSUM methodPaper Review(논문이야기)/관련 개념 정리 2025. 2. 9. 23:52
CUSUM에 관한 내용을 최근 읽었던 논문에서 기초하고 있는 방법인만큼 해당 내용을 보다 상세히 작성하여보았다. 대부분은 https://zephyrus1111.tistory.com/400 에서 기초하여 작성함을 밝힌다 - 문제정의 CUSUM 알고리즘이 풀고자하는 문제는 시계열내에 급격한 변경점이 없다는 귀무가설(H0)과 하나의 변경점이 있다는 대립가설 Ha을 세우고 이 중 어떤것을 선택해야하는지에 관한 문제이다. 먼저 시계열 데이터 Xt가 있다고 하자(t는 1부터 k까지 존재), 각가은 IID 조건을 따르고 해당 확률분포의 확률밀도함수를 p(x)라 하자. Change point dection은 시계열 데이터에서 변화가 생겼을 경우에 해당하는 시점 tc를 찾는 알고리즘이기에 θ">θ(확률..
-
[Time Series] Change point DetectionPaper Review(논문이야기)/관련 개념 정리 2025. 2. 3. 20:39
Change Point Detection(CPD)은 시계열 데이터에서 데이터의 특성이 급격하게 변화하는 지점을 찾아내는 기법으로, 이는 데이터의 평균, 분산, 분포 등의 통계적 특성이 변화하는 시점을 탐지하는 것을 목표로 한다(분류를 위한 label이 주어지는 경우도 있음)후행연구로 시계열의 의미론적 분석, Event 탐지, 이상치 탐지로 이어질 수 있다. Change Point Detection Change Point는 데이터를 표현하는 모델의 매개변수가 갑자기 변하는 지점을 의미하며 CPD는 크게 두 가지 방식으로 나눌 수 있다. 온라인 방식: 실시간으로 들어오는 데이터 스트림에서 변화를 감지(or 예측), Anomaly or Event Detection이라고도 불림오프라인 방식: 과거의 전체 데..