생활코딩/머신러닝야학

Pandas 기초 - shape, indexing, columns, head

hayjo 2020. 8. 14. 16:02

[강의 출처] opentutorials.org/module/4966/28971


 

 

(프로그래밍에서) 변수: 데이터를 담고 있는 그릇

(표에서) 변수: Column

    -날짜에 따라서 관측값이 변경될 수 있기 때문.

날짜 요일 온도 판매량
2020.1.3 20 40
2020.1.4 21 42
2020.1.5 22 44

위의 표에서 '온도' 컬럼값에 따라 '판매량' 값이 바뀌기 때문에,

온도는 독립변수(원인), 판매량은 종속변수(결과).

 

import pandas as pd

# 파일로부터 데이터 읽어오기
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv'
레모네이드 = pd.read_csv(파일경로)
print(레모네이드)
"""
   온도  판매량
0  20   40
1  21   42
2  22   44
3  23   46
4  24   48
5  25   50
"""

# 데이터의 모양확인 - shape
print(레모네이드.shape) # (6, 2) # (row, column)

# 데이터 칼럼이름 확인 - columns
print(레모네이드.columns) # Index(['온도', '판매량'], dtype='object')

# 독립변수와 종속변수 분리 - indexing
독립 = 레모네이드[['온도']]
종속 = 레모네이드[['판매량']]
print(독립.shape, 종속.shape) # (6, 1) (6, 1)

# 데이터 확인 - head
레모네이드.head() # DataFrame의 처음 n(=5)줄 출력