본문 바로가기

전체 글21

논문 리뷰 1. Stock Market Forecasting Using Machine Learning Algorithms 논문 명 : Stock Market Forecasting Using Machine Learning Algorithms, 2012 저자 : Shunrong Shen, Haomiao Jiang, Tongda Zhang 논문 방향이 딥러닝을 이용해 주가를 예측하던 것에서 분류분석을 이용해 주가의 흐름을 예측하는 것으로 변경된 후 첫 논문 리뷰이다. 논문을 해석해보고 code를 이용해 논문을 재현해본다. 데이터 : NASDAQ, DJIA, S&P 500, Nikkei 225, Hang Seng index, FTSE100, DAX, ASX, EUR, AUD, JPY, USD, Silver, Platinum, Oil, Gold의 주가 데이터 수집 기간 : 2000-01-04 ~ 2012-10-25 이 논문은 US의.. 2023. 2. 8.
Collect New york times news headlines using r API를 이용하면 news data를 쉽게 얻을 수 있다.New york times의 news는 API를 제공하므로 API를 이용해 headline과 그 외의 변수들을 수집하는 방법을 소개한다. 먼저, https://developer.nytimes.com 이 링크에 들어가 Get Started 부분을 클릭하면 데이터를 수집하는 방법을 소개하고 있다.이해하기 어렵다면 이 블로그 내용을 따라오면 된다. 1. 회원가입링크를 들어가보면 우측 상단에 sign in 이라는 부분을 찾아 클릭한다.그 후, Create an account 를 클릭한 후 계정을 생성하면 된다. 2. 로그인계정이 생성되었으면 계정을 생성한 email과 password를 이용하여 로그인을 한다. 3. key 생성로그인을 하면 우측 상단에 계.. 2023. 2. 1.
news data preprocessing code modification Python 코드를 R 코드로 변경한 후 교수님과 면담을 했다.고쳐야할 점은 두가지였다.1. for문을 되도록 사용하지 말 것2. 여러번 재사용을 하는 경우를 제외하고는 함수를 만들지말고 임의의 함수를 사용할 것    (수정 전)수집한 news data 중 날짜가 없거나 수집 날짜 기준에 맞지않은 경우 NA로 데이터를 변경하였고, 리스트 중 NA인 경우는 제거하는 코드를 생성하였다.k=1 for(i in 1:length(news_data)){ if(length(is.na(news_data[[k]]))==1 ){ if(is.na(news_data[[k]])){ news_data[[k]]=NULL }else{k=k+1} }else{k=k+1} } (수정 후)new.. 2023. 1. 15.