본문 바로가기

Sentiment Analysis4

BERT (2) 저번에 BERT를 시도했는데 정확도가 너무 낮았던 문제가 있었다.그래서 추가적으로 알아보았고, finBERT를 알게되었다.원래 기존 BERT는 긍정, 부정 등 감성분석을 말한다. 근데 finBERT는 금융 즉, 경제를 위해 만들어진 모델이다. https://www.kaggle.com/code/nlpquant/finbert-ext FinBERT-EXTExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com코드는 여기에 나오는 코드를 전부 가져다 썼다.여기서 나와 다른 점은 Sentences_50Agree 데이터를 쓰는 것이 아닌 Sentences_AllAgree.. 2023. 5. 24.
Bert (1) 논문의 주요 포인트는 뉴스 감성분석이다.현재 NBC 뉴스와 NYT 뉴스를 NLTK와 TextBlob으로 감성분석해 생성한 점수를 변수로 사용하고 있다.분석 방법에 따라 점수가 다르고, 그에 따른 예측 결과도 달라지므로 여러가지 감성분석을 시도하려고 노력하고 있다.그 중 가장 욕심이 나고 주의깊게 보았던 것이 Bert이다.Bert는 transpormer 계열 중 하나로 구글에서 만든 사전훈련 모델이다.Bert에 대한 설명은https://wikidocs.net/115055 17-02 버트(Bidirectional Encoder Representations from Transformers, BERT)* 트랜스포머 챕터에 대한 사전 이해가 필요합니다. ![](https://wikidocs.net/images/p.. 2023. 5. 7.
논문 리뷰 2. Stock Price Movement Prediction Using Sentiment Analysis and CandleStick Chart Representation(1) 논문 명 : Stock Price Movement Prediction Using Sentiment Analysis and CandleStick Chart Representation. 2021 저자 : Trang-Thi Ho, Yennun Huang 분류분석을 이용해 주가예측을 시작한 후 두번째 논문 리뷰이다. 두번째라고 해서 논문을 두 개만 읽은 것은 아니고 읽는 것에 그치지 않고 재현을 해보는 논문이 두번째인 것이다. Fake 논문, 모델을 친절하게 알려주지 않은 논문들이 많아서 읽은 모든 논문을 재현해보는 것은 불가능했다. 이 논문을 재현해보기 전에 다른 논문을 재현하다가 재현을 하기에는 정보가 너무 부족하다 느껴 잠시 멈추고 이 논문을 재현하게 되었다. 교수님께서 컨펌하시기에 R code가 편하기 .. 2023. 2. 21.
news data preprocessing code modification Python 코드를 R 코드로 변경한 후 교수님과 면담을 했다.고쳐야할 점은 두가지였다.1. for문을 되도록 사용하지 말 것2. 여러번 재사용을 하는 경우를 제외하고는 함수를 만들지말고 임의의 함수를 사용할 것    (수정 전)수집한 news data 중 날짜가 없거나 수집 날짜 기준에 맞지않은 경우 NA로 데이터를 변경하였고, 리스트 중 NA인 경우는 제거하는 코드를 생성하였다.k=1 for(i in 1:length(news_data)){ if(length(is.na(news_data[[k]]))==1 ){ if(is.na(news_data[[k]])){ news_data[[k]]=NULL }else{k=k+1} }else{k=k+1} } (수정 후)new.. 2023. 1. 15.