이번에 NUS MMRL에서 파견연구를 하게되면서 가장 먼저 읽어보라고 하신 CLIP 논문에 대해 리뷰해보겠다. 논문을 이해하는데에 참고한 블로그와 영상들이다.https://greeksharifa.github.io/computer%20vision/2021/12/19/CLIP/ Python, Machine & Deep LearningPython, Machine Learning & Deep Learninggreeksharifa.github.iohttps://youtu.be/HkkaKI6NN-8?si=UvXCdFFS9hEYwwYy 논문 링크 : https://arxiv.org/abs/2103.00020 Learning Transferable Visual Models From Natural Language Sup..
이번 BITAmin 시계열 프로젝트에서 강화학습을 이용한 주식 실시간 트레이딩을 진행하게 되었는데, 프로젝트를 본격적으로 시작하기 전에 공부했던 강화학습의 개념에 대해 정리하고 가고자 한다. 강화학습은 마르코프 의사결정 과정에 학습에 개념을 넣은 것인데, 이번 포스팅에서는 강화학습 뿐만 아니라 많은 모델들의 기본이 되기도 하는 마르코프 의사 결정 과정에 대해 정리해보고자 한다. 먼저,강화학습이란,머신러닝의 한 종류로, 어떠한 환경에서 어떠한 행동을 했을 때 그것이 잘 된 행동인지 잘못된 행동인지를 나중에 판단하고 보상 (또는 벌칙)을 줌으로써 반복을 통해 스스로 학습하게 하는 분야이다. 그림을 보면 알 수 있듯이 강화학습의 두 가지 구성요소는 환경과 에이전트이다.에이전트 : 특정환경에서 행동을 결정..
[데이터사이언스캡스톤디자인] 수업에서 sLLM을 활용하여 법률 상담 챗봇을 만드는 프로젝트를 진행중이다.모델 구현을 어떤 방식으로 할까 고민해보았을 때, 카카오톡 챗봇에 우리가 개발한 모델을 연결하는 것이 사용자들에게 가장 접근성이 좋을 것 같아 카카오톡 채널에 연결을 시도하였다. 하지만.. 쉽지 않았다ㅎ일단 나는 flask나.. 웹이나 서버쪽 수업을 들은 적이 없어서 더 어렵기도 했고, 카카오톡 챗봇 만든 사례들을 찾아보면 대부분 시나리오 형식으로 특정 input을 지정해주는 경우가 많았는데, 우리는 그렇게 특정 질문만을 정해서 받을 것이 아니었기 때문에.. 그래서 대안책으로 생각한게 요즘 새로 나온 Langserve나 모델 구현 및 데모에 많이 쓰는 Streamlit인데,이 두 방법을 사용해서 구현해..
저번 포스팅에서 [Time Series Forecasting (TSF) Using Various Deep Learning Models] 논문 소개 및 사용할 딥러닝 모델 프레임워크를 소개하였다. https://y8jinn.tistory.com/69 [Paper Review] Time Series Forecasting (TSF) Using Various Deep Learning Models (1)목차 Ⅰ. Introduction Ⅱ. Methodology Ⅲ. Deep Learning Frameworks 논문의 목적 time series 데이터에 대해 RNN, LSTM, GRU, Transformer 4개의 모델들을 학습 및 평가하여 비교한다. 각 모델들의 강점과 약점을 평가한y8jinn.tistory.c..
목차 Ⅰ. Introduction Ⅱ. Methodology Ⅲ. Deep Learning Frameworks 논문의 목적 time series 데이터에 대해 RNN, LSTM, GRU, Transformer 4개의 모델들을 학습 및 평가하여 비교한다. 각 모델들의 강점과 약점을 평가한다. w, k의 영향력을 정확도 측면에서 이해해본다. Ⅰ. Introduction Time Series Forecasting (TSF)는 과거의 observations로부터 미래 시점의 예측 변수 분포를 예측하는 문제이다. traditional models linear : ARMA (stationary일 경우), ARIMA (non-stationary일 경우 차분을 해서 데이터가 정상성을 가질 수 있게) non-linear..
이번에 데이터사이언스 캡스톤 디자인을 하면서 LLM을 사용하게 되었는데, LLM에 외부 데이터 소스를 연동하는 방법으로 RAG를 주로 쓰게 될 것 같아 관련 내용을 공부하고 정리해보았다. LLM에 외부 데이터 소스 연동하는 이유? ex) 2021 data 가지고 있고, 이를 통해 LLM 학습 시킬 때, 아무리 성능이 좋은 모델이더라도 2022년 정보 등등 학습과정에서 보여주지 않은 정보들에 대해서는 제대로 답변할 수 없음 LLM에 외부 데이터 소스를 연동하는 법 LLM에 학습과정에 포함되지 않은 지식을 주입하는 방법은 크게 2가지이다. 1. Fine-tuning : 새로운 지식에 관한 텍스트 데이터 소스를 이용해서 LLM의 파라미터를 fine-tuning 함. 새로운 데이터 모아서 -> 기존의 pre-t..