데이터수집
-
[데이터수집] 로또번호 전송봇 만들기Python/웹스크래핑.데이터수집 2021. 1. 4. 15:37
매주 토요일 저녁 8시 47분마다 동행복권 사이트(dhlottery.co.kr/common.do?method=main)에서 해당 주차 당첨번호를 확인 후 전송하는 텔레그램봇 작성 당첨번호 확인이 지연될 경우, 완료될 때까지 5분 단위로 재실행하고, 재시도하겠다는 메시지를 보낸다. 로또사이트는 참으로 친절해서 아래 url 정보만 있으면 번호를 바로 조회할 수 있다. url = 'https://dhlottery.co.kr/gameResult.do?method=byWin&drwNo=' + 회차정보 이제 매주의 회차 정보를 구하면 된다. 로또 추첨은 매주 1회 진행하고, 그때마다 1회차씩 증가하므로 처음 시작한 1회(2002. 12. 07.) 기준으로 몇주가 지나갔는가를 계산하면 된다. 조회 대상 날짜에서 시작..
-
[Summary] 텔레그램봇: 채권모니터링 ReviewPython/텔레그램봇:채권모니터링 2020. 12. 31. 19:54
언어 python3.7 이용한 python 라이브러리 os, time, datetime, requests, pandas, xlrd [, bs4, telegram] 상세 내용 증권시장 거래시간의 특정 시점에, 한국거래소에서 채권거래 호가 정보를 수집 후, 한국은행 API로 비교 기준인 최신의 채권 수익률을 확인(xml/json)하여, 전처리(null 데이터를 제외하고, 잔존기간을 일자로 환산, 투자등급/잔존기간/수익률 기준으로 필터링)한 다음, 텔레그램 메신저를 통해 적당한 메시지 포맷으로 전송한다. 여기서 증권시장 거래시간의 특정 시점이란 10시, 12시, 2시 30분, 3시 31분(종가) 처럼 특정 시간을 말한다. 또한 휴장일 정보를 확인(download/view)하여, 익일이 휴장일인 경우 건너뛸 수..
-
[데이터수집] 내일은 휴장일? 한국거래소 확인 (1) downloadPython/텔레그램봇:채권모니터링 2020. 12. 23. 17:16
봇을 돌리려면 오늘 휴장인지 정보가 필요하다. 해당 정보는 한국거래소 - MarketData - 시장정보 - 시장동향 - 증시일정 - 휴장일에서 1) 엑셀파일로 다운로드 후 확인 2) 조회 방식으로 확인 2가지 방법으로 확인이 가능하다. 엑셀파일 다운로드의 경우 채권정보를 가져왔던 방식과 동일하게 OTP 발급 스크립트를 추가해 처리하면 된다. 먼저 엑셀파일로 확인해본다. 실패한 엑셀파일 1차 시도 이쪽을 참고했다: nbviewer.jupyter.org/urls/financedata.github.io/posts/pandas-market-days-krx.ipynb 위 블로그에서는 OTP 발급절차 없이 바로 url로 접속해서 데이터를 확보했다. 바로 접속한 url은 이렇다: marketdata.krx.co.k..