-
Pandas 기초 - shape, indexing, columns, head생활코딩/머신러닝야학 2020. 8. 14. 16:02
[강의 출처] opentutorials.org/module/4966/28971
(프로그래밍에서) 변수: 데이터를 담고 있는 그릇
(표에서) 변수: Column
-날짜에 따라서 관측값이 변경될 수 있기 때문.
날짜 요일 온도 판매량 2020.1.3 금 20 40 2020.1.4 토 21 42 2020.1.5 일 22 44 위의 표에서 '온도' 컬럼값에 따라 '판매량' 값이 바뀌기 때문에,
온도는 독립변수(원인), 판매량은 종속변수(결과).
import pandas as pd # 파일로부터 데이터 읽어오기 파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv' 레모네이드 = pd.read_csv(파일경로) print(레모네이드) """ 온도 판매량 0 20 40 1 21 42 2 22 44 3 23 46 4 24 48 5 25 50 """ # 데이터의 모양확인 - shape print(레모네이드.shape) # (6, 2) # (row, column) # 데이터 칼럼이름 확인 - columns print(레모네이드.columns) # Index(['온도', '판매량'], dtype='object') # 독립변수와 종속변수 분리 - indexing 독립 = 레모네이드[['온도']] 종속 = 레모네이드[['판매량']] print(독립.shape, 종속.shape) # (6, 1) (6, 1) # 데이터 확인 - head 레모네이드.head() # DataFrame의 처음 n(=5)줄 출력
'생활코딩 > 머신러닝야학' 카테고리의 다른 글
Tensorflow - 데이터 타입과 N/A값 (전처리 Tip) (0) 2020.08.19 Tensorflow - 히든레이어와 인공신경망 (0) 2020.08.19 Tensorflow - 분류모델, 원핫인코딩, Softmax(아이리스 품종 분류) (0) 2020.08.18 Tensorflow - 딥러닝 모델과 퍼셉트론(보스턴 집값 예측) (0) 2020.08.17 Tensorflow - 지도학습 순서(레모네이드 판매 예측) (0) 2020.08.14