분류 전체보기
-
[Time-series] A Time Series Is Worth 64 Words: Long-Term Forecasting With Transformers (ICLR 2023, PatchTST)Paper Review(논문이야기) 2024. 4. 25. 09:18
https://arxiv.org/abs/2211.14730 A Time Series is Worth 64 Words: Long-term Forecasting with TransformersWe propose an efficient design of Transformer-based models for multivariate time series forecasting and self-supervised representation learning. It is based on two key components: (i) segmentation of time series into subseries-level patches which are servearxiv.org논문코드: https://github.com/yuq..
-
[Time-series] Long term time-series forecasting 연구동향ML&DL 이야기/ML 2024. 4. 6. 14:23
본 내용은 장기 시계열 예측 연구 동향 영상(https://www.youtube.com/watch?v=GeWsvyEe0h8)을 참고하여 작성하였습니다. What is LTSF? Longeterm time series forcasting은 time series forcasting 과제 중에서도 장기적인 동향을 예측하는 task로 보통 장기라 하면 96 step에서 부터 많게는 720 step까지를 말한다. DataSet for Time series 시계열에서 사용되는 dataset은 대부분 공개된 dataset으로 dataset마다 특성이 존재한다. 즉, 어떤 시계열 데이터는 계졀성이 뚜렷하고, 어떤 것은 매우 불규칙한 등 다양한 특성의 시계열 data에 모델이 잘 적합한지를 보고자 함이다. 벤치마크로 사..
-
[ML] Decision Tree, 의사결정트리ML&DL 이야기 2024. 4. 3. 20:55
Decision Tree는 의사결정트리라고도 불리며 흔한 White box 계열의 모델이기에 실무에서 많이 쓰이는 모델 중 하나이다. 정의는 아래와 같다. 기계학습(machine learning) 중 지도학습(supervised learning)의 한 종류로 의사 결정규칙(decision rule)을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 예측(prediction) 혹은 분류(classification)을 수행하는 방법. 모형의 구조가 tree 형태를 지니기에 Decision tree라고 불린다. 위 그림은 Decision tree의 예시이다. 보면 특정 질문에 따라 기준을 세우고, 그 기준에 따라 그룹을 분할 하는 것을 알 수 있다. 한번의 분기 때 마다 변수 영역은 두개로 구분되며, 해..
-
[Applied Data Analytics] Pickle? CSV? 데이터 파일의 형식에 관해전공&대외활동 이야기/전공 프로젝트 모음 2024. 3. 31. 17:18
응용데이터애널리틱스 과목을 들으면서 교수님께서 데이터 파일을 pickle로 전달해주신다고 말씀해주셨다..! CSV를 주로 많이 사용하는데, 실무에서는 Pickle를 더 많이 사용한다고 말씀해주셔서 관련 내용을 간단히 정리해보기로 하였다. Pickle File: 자료형을 변환 없이 그대로 파일로 저장하자 pickle 파일은 파이썬에서 객체를 직렬화(serialization)하여 저장하기 위한 바이너리 형식의 파일이다. Serialization: 직렬화는 객체를 파일에 저장하거나 네트워크를 통해 전송하기 위해 객체를 byte stream으로 변환하는 과정을 말한다. 이를 통해 파이썬에서 생성된 모든 객체를 저장하고, 파이썬 데이터 유형을 유지한 형태로 파일을 전달할 수 있다. 또한 바이너리 형식이기에 효율적..
-
[Finance, Naver D2] 금융과 딥러닝 - 금융 영역에서의 딥러닝은 어떻게 다른가?(문효준 (크래프트테크놀로지스))ML&DL 이야기/기타 2024. 3. 31. 11:22
https://www.youtube.com/watch?v=dB8cpsnZ5FA&t=646s 금융관련 프로젝트를 하며 NAVER D2에서 금융데이터의 특성에 관해 잘 정리해둔 영상이 있어서 이를 정리하게 되었다. 사용된 자료들은 모두 영상에서 발췌하였다. 금융 + 딥러닝 = ? 금융데이터에는 다른 데이터와 다른 다양한 특성들이 있어서 딥러닝 접목이 힘들다고 말씀해주신다. 그 특성과 이에 맞는 크래프트 테크놀로지에서 해결한 방법을 소개해주신다 문제점1 : 시계열 feature의 Noise 일반적으로 주가모델링은 흔히 말하는 기하브라운모형을 가정한다. 이는 AR(1)과 매우 유사하기에 편의를 위해 AR(1)을 통해 주가의 정보를 표현하면 아래와 같다(차분을 통해 정보와 노이즈를 표시해보자) 문제는 입실론, 즉..
-
[Colab] 패키지 영구 설치하기 & 문제점개발 이야기/TIL 2024. 3. 27. 00:53
최근 colab pro를 사용하고 있는데, 매번 pip를 하다 보니 당연하게도 컴퓨팅 용량을 너무 많이 잡아먹어서..! 찾아보고 작성하게 되었다. 본 내용은 아래 링크를 기반으로 작성하였다. https://dacon.io/codeshare/4200 [Tip] Colab에 영구적으로 패키지 설치하기! dacon.io Google colab에서 작업하면 정말 좋은 환경을 이용가능하고, pre-built된 library가 일부 있지만, 때로는 몇몇 라이브러리 및 패키지는 !pip install를 이용하여 업그레이드 혹은 설치해줄 필요가 있다. 이를 위해 링크를 연결하여 원본파일을 직접 사용하는 것과 같은 효과를 내는 심볼릭 링크를 이용하여 해당 위치에 패키지를 설치하고 이용해보려고 한다. 심볼릭 링크 연결하기..
-
[Time-series] Are Transformers Effective for Time Series Forecasting? (AAAI 2023, Ailing Zeng et al.)Paper Review(논문이야기) 2024. 3. 26. 15:36
https://arxiv.org/abs/2205.13504 Are Transformers Effective for Time Series Forecasting? Recently, there has been a surge of Transformer-based solutions for the long-term time series forecasting (LTSF) task. Despite the growing performance over the past few years, we question the validity of this line of research in this work. Specifically, Tr arxiv.org 논문코드: https://github.com/cure-lab/LTSF-Lin..
-
[Time-series] Time-series Analysis, 시계열 알아보기ML&DL 이야기/ML 2024. 3. 22. 17:29
시계열..? 통계부터 시작하자 시계열 머신러닝, 딥러닝 방법론들이 최근 많이 화재가 되고 있지만 실무적 관점에서는 여전히 통계적 기반의 시계열 분석은 주요한 위치를 차지하고 있으며, 사실 딥러닝, 머신러닝 기법들 또한 해당 방법론을 기반으로 발전된 것들이 많다. 또한 통계학적 방법론의 가장 큰 장점은 바로 설명력을 기반으로 신뢰성을 가진다는 것이다. Alieen Nielsen의 저서 Practical Time Series Analysis을 인용하면 산업용 시계열 분석은 위험이 낮은 분야에 적용하려고 노력합니다. 광고나 미디어 상품의 출시에 따른 이익을 예측하는 문제에서는 예측의 완전한 검증이 크게 중요하지 않습니다…….(중략)… 통계가 위험이 높은 예측에서 보다 근본적인 역할을 할 수 있기를 바랍니다. ..