Paper Review(논문이야기)
-
[Finance][Time series] Unsupervised Change Point Detection and Trend Prediction for Financial Time-Series Using a New CUSUM-Based Approach(IEEE 2022)Paper Review(논문이야기) 2025. 2. 17. 16:42
https://ieeexplore.ieee.org/document/9741807/ Unsupervised Change Point Detection and Trend Prediction for Financial Time-Series Using a New CUSUM-Based ApproachThe aim of this research is to propose a binary segmentation algorithm to detect the change points in financial time-series based on the Iterative Cumulative Sum of Squares (ICSS). The proposed algorithm, entitled KW-ICSS, utilizes the n..
-
[Time Series][Change point Detection] CUSUM methodPaper Review(논문이야기)/관련 개념 정리 2025. 2. 9. 23:52
CUSUM에 관한 내용을 최근 읽었던 논문에서 기초하고 있는 방법인만큼 해당 내용을 보다 상세히 작성하여보았다. 대부분은 https://zephyrus1111.tistory.com/400 에서 기초하여 작성함을 밝힌다 - 문제정의 CUSUM 알고리즘이 풀고자하는 문제는 시계열내에 급격한 변경점이 없다는 귀무가설(H0)과 하나의 변경점이 있다는 대립가설 Ha을 세우고 이 중 어떤것을 선택해야하는지에 관한 문제이다. 먼저 시계열 데이터 Xt가 있다고 하자(t는 1부터 k까지 존재), 각가은 IID 조건을 따르고 해당 확률분포의 확률밀도함수를 p(x)라 하자. Change point dection은 시계열 데이터에서 변화가 생겼을 경우에 해당하는 시점 tc를 찾는 알고리즘이기에 θ">θ(확률..
-
[Time Series] Change point DetectionPaper Review(논문이야기)/관련 개념 정리 2025. 2. 3. 20:39
Change Point Detection(CPD)은 시계열 데이터에서 데이터의 특성이 급격하게 변화하는 지점을 찾아내는 기법으로, 이는 데이터의 평균, 분산, 분포 등의 통계적 특성이 변화하는 시점을 탐지하는 것을 목표로 한다(분류를 위한 label이 주어지는 경우도 있음)후행연구로 시계열의 의미론적 분석, Event 탐지, 이상치 탐지로 이어질 수 있다. Change Point Detection Change Point는 데이터를 표현하는 모델의 매개변수가 갑자기 변하는 지점을 의미하며 CPD는 크게 두 가지 방식으로 나눌 수 있다. 온라인 방식: 실시간으로 들어오는 데이터 스트림에서 변화를 감지(or 예측), Anomaly or Event Detection이라고도 불림오프라인 방식: 과거의 전체 데..
-
[DFL] Decision-Focused Learning: Through the Lens of Learning to Rank( ICML 2022, Mandi et al.)Paper Review(논문이야기) 2024. 7. 17. 16:30
Decision Focused learning 문제를 해결하기 위해 다양한 접근법이 도출되는 것 같다. 대다수 accpet된 논문들의 경우 loss function이나 방법론을 정말 획기적..? 혹은 다른 필드에서 쓰이는 방법들을 잘 변형해서 적용하는데, 이정돈 해야 탑티어 논문인가...? 싶기도 하다. 이번 논문은 LTR에서 사용되던 방법을 이용해서 DFL문제를 풀겠다는 요지의 논문이다. 간단히 요약하면 1. Feasible solution들의 집합 v를 S라는 부분집합을 통해 대체한다(S는 기존의 F.S와 확률적으로 추가된다) - 선행논문 중 하나인 Mumba et.al 방법론 2. objective function을 통해 S를 정렬하고, 이를 실제값을 이용한 정렬된 S와 비교해 ranking los..
-
[Journal of Protfolio management]The Gerber Statistic: A RobustCo-Movement Measure for PortfolioOptimization(Sander Gerber et al.)Paper Review(논문이야기) 2024. 7. 10. 18:04
Harry M. Markowitz, 즉, 그 마코위츠 포트폴리오의 그분이 저자로 함께 작성한 자료이다(엄밀히 말하 논문..?은 아닌거 같다)글의 요지는 기존의 공분산 행렬 추정을 더 robust한 방법으로 변경해야한다..!이며 즉, 실제 시장에는 noise가 많이 껴져있는 상태이기에 기존 방법으로 공분산 추정이 너무 오염된 상태라는 것 같다.이를 위해 Gerber statisitc을 도입하는데(본 논문의 주저자의 이름) 자세한 건 아래에 설명한다. Introduction & Problem포트폴리오 구성(Markowitz 1952, 1059)은 자산 수익률 간의 공분산 행렬에 크게 의존하며, 종종 smaple covariance 자체가 실제 공분산 행렬의 추정치로 이용된다(Jobson and Korkie..
-
[Quantative Finance 2020]Index tracking through deep latent representation learning(Kim&Kim)Paper Review(논문이야기) 2024. 7. 5. 14:56
https://doi.org/10.1080/14697688.2019.1683599 본 논문에서는 Index tracking을 위해 Stack AutoEncoder를 이용하여 벤치마크지수의 추즉오류를 최소화한다. S&P 500, FTSE 100 및 HSI index에 방법론을 적용한다. 인덱스 펀드를 만들거나 할 때 보통 인덱스를 구성하는 모든 종목을 가지고 구성하게 되면, rebalancing 시 큰 Transaction cost나 complexity 우려가 있다. 그렇기에 종목을 구성하는 일부 종목을 가지고 가중치를 조절하여 해당 index를 잘 tracking 하는 portfolio를 만드는 것이 Index Tracking이 목표이다.기존에는 주로 optimization approach를 중심으로 연..
-
[DSL]TaskMet: Task-Driven Metric Learning for Model Learning(NeuIPS 2023) -1Paper Review(논문이야기) 2024. 7. 4. 11:27
https://arxiv.org/abs/2312.05250 TaskMet: Task-Driven Metric Learning for Model LearningDeep learning models are often deployed in downstream tasks that the training procedure may not be aware of. For example, models solely trained to achieve accurate predictions may struggle to perform well on downstream tasks because seemingly small predictarxiv.org 이전 DSL 개론(?) 리뷰에서 정리한바와 같이 Predict-optimize ..
-
[Time-series] A Time Series Is Worth 64 Words: Long-Term Forecasting With Transformers (ICLR 2023, PatchTST)Paper Review(논문이야기) 2024. 4. 25. 09:18
https://arxiv.org/abs/2211.14730 A Time Series is Worth 64 Words: Long-term Forecasting with TransformersWe propose an efficient design of Transformer-based models for multivariate time series forecasting and self-supervised representation learning. It is based on two key components: (i) segmentation of time series into subseries-level patches which are servearxiv.org논문코드: https://github.com/yuq..