본문 바로가기

금융 및 데이터

(7)
[Python] FinanceDataReader 데이터 Mysql DB에 적재하기 주가 데이터를 가져오기에 가장 좋은 라이브러리는 Financedatareader 같습니다. (+종목 코드 리스트만 가져오기 위해 Pykrx도 사용했습니다.) https://github.com/financedata-org/FinanceDataReader GitHub - financedata-org/FinanceDataReader: Financial data reader Financial data reader. Contribute to financedata-org/FinanceDataReader development by creating an account on GitHub. github.com https://github.com/sharebook-kr/pykrx GitHub - sharebook-kr/pyk..
[R] 데이터 분석 코딩 기술통계 다음과 같은 excel 파일이 있을 때 이런 식으로 분포를 구할 수 있다. 또 이런 식으로 상관관계와 분산, 표준편차를 구할 수 있다. 데이터 편집 그룹별 평균 구하기 : 성별로 월급 데이터와 경력별 월급이 있습니다. 이 기준으로 평균 월급을 구함 우선 열 이름이 한글이기 때문에 영어로 바꾸어준다. tapply : sex 를 기준으로 salary의 mean을 구한다. melt : 데이터 프레임의 행열을 바꾼다. salary 가 2000000보다 높은 사람만 추출하라 이상치 찾기와 제거하기 이와 같은 데이터 프레임이 있을 때 우선 boxplot으로 시각화를 해본다. boxplot(DF$age) 아웃라이어가 존재하는 것을 확인할 수 있다. IQR 함수는 3분위 값에서 1분위 값을 차감한 값이다. 즉..
Harry Markowitz의 포트폴리오 이론과 효율적 투자선 현대 포트폴리오 이론 (Modern Portfolio Theory 이하 MPT) 포트폴리오 이론은 해리 마코위츠에 의해 체계화된 이론으로 자산을 분산 투자하여 포트폴리오를 만들게 되면 분산투자 전보다 위험을 감소시킬 수 있다는 이론이다. - Wikipedia 지배원리와 효율적투자선 '계란을 한 바구니에 담지 마라'라는 말을 들어보셨을 겁니다. 한 바구니에 담긴 계란은 떨어지게 되면 다 같이 떨어지기 때문에 여러 바구니에 나눠 담아 리스크를 분산하라는 의미로 쓰입니다. 포트폴리오 이론과 함께 지배원리라는 것을 알아야 합니다. 지배원리는 시장에 존재하는 무수히 많은 자산을 조합하면, 수많은 포트폴리오를 만들 수 있고 이러한 포트폴리오들 중에서 동일한 위험을 지녔으나 기대수익이 높거나, 동일한 기대수익을 가져..
[Python] 뉴스 감성지수 분류 모델 https://sieon-dev.tistory.com/4 [Python] 포트폴리오 최적화 서비스 제공과 텍스트마이닝을 사용한 금융 데이터 분석 해외의 포트폴리오 최적화 및 백테스트 사이트인 PortfolioVisualizer의 국내화 버전으로 개발하였습니다. 개인의 포트폴리오 최적화와 백테스트 기능을 제공하고 텍스트마이닝을 사용하여 시장, 기 sieon-dev.tistory.com 위 사이트를 개발할 때 사용한 감성지수 분류 모델에 대해 기록을 남겨볼까 합니다. Preview 사실 처음에는 뉴스 데이터를 활용하여 다음날의 주가를 예측하는 모델을 만들고 싶었지만 다양한 방법들을 시도하여도 예측 정확도가 60%대 밖에 나오지 않아 차라리 감성지수를 예측하는 모델을 설계하는 방향으로 바꿨습니다. 감성지수는 ..
Swap curve & Curve fitting UFEA 활동했을 당시 교재와 진행한 과제에 대한 기록입니다. 교재 : [John C Hull]Options, Futures, and other derivatives 9th 5.4 Interest Rate Swaps 금리 스왑은 현대 금융시장 중 장외 파생상품 시장에서 독보적이게 되었다. 2008년 12월, 국제청산은행(Bank of international Settlements)에 따르면 금리 스왑 시장은 8조 달러, 선도거래 870억 달러, OTC 옵션 1.1조 달러 거래되었다. 미국 국채는 5.9조 달러 거래된 것을 보면 어느 정도 감이 올 것이다. 이번 절에서는 plain vanilla 금리 스왑에 대해 알아보고자 한다. Definition of A plain vanilla fixed-for-fl..
[Python] Random Forest 모델 기반 변수 중요도 산출하기 Random Forest 가 어떤 모델인지 궁금하신 분은 잘 정리된 블로그 링크를 남겨두었으니 참고하시길 바랍니다. https://eunsukimme.github.io/ml/2019/11/26/Random-Forest/ Random Forest(랜덤 포레스트) 개념 정리 Decision Tree는 overfitting될 가능성이 높다는 약점을 가지고 있습니다. 가지치기를 통해 트리의 최대 높이를 설정해 줄 수 있지만 이로써는 overfitting을 충분히 해결할 수 없습니다. 그러므로 좀더 일 eunsukimme.github.io 아래의 코드는 실제 서비스 하고 있는 프로젝트에서 사용하고 있는 코드입니다. [Python] 포트폴리오 최적화 서비스 제공과 텍스트마이닝을 사용한 금융 데이터 분석 해외의 포트..
[Python] 주식 종목 수익률 산출하기 FinanceDataReader 라이브러리 사용법 https://financedata.github.io/posts/finance-data-reader-users-guide.html FinanceDataReader 사용자 안내서 FinanceDataReader 사용자 안내서 financedata.github.io import FinanceDataReader as fdr df = fdr.DataReader('139480', '2018').resample('M').first() df.pct_change()['Close'].mean() resample() 메서드는 데이터프레임의 DatetimeIndex나 Datetime type을 가지고 있는 컬럼을 지정해준 기간 단위로 편집해줍니다. first() 는 이름만 ..