본문으로 바로가기

[pandas] DataFrame 데이터 살펴보기

category AI/데이터분석 2020. 2. 15. 00:10
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

 

 

 

 

DataFrame

Series가 1차원이라면 DataFrame은 2차원으로 확대된 버전.

Excel spreadsheet 이라고 생각하면 이해하기 쉬움.

2차원이기 때문에 인덱스가 row, column 으로 구성됨.

row : 각 개별 데이터

column : 개별 속성

Data Analysis, Machine Learning에서 data 변형을 위해 가장 많이 사용.

 

 

위와 같이 read_csv로 불러오면 DataFrame이 생성된다.

 

 


head, tail

데이터의 일부(처음 혹은 마지막부터)를 간단히 보기 위한 함수

기본 default 개수는 5개.

 

 

 


DataFrame 데이터 파악하기

shape : 속성 (row, column)

describe( ) : 숫자형 데이터의 통계치 계산

info( ) : 데이터 타입, 각 아이템의 개수 등 출력

 

 

shape

shape 으로 row, column 개수를 알 수 있다.

 


describe( )

숫자형 데이터의 경우 개수, 평균 등을 보여준다.

 

 


info( )

각 개별 속성들에 대한 정보를 보여준다.

각 속성들이 몇개의 데이터를 가지고 있는지, 타입은 무엇인지를 알려준다.

 

 

 

 

 

 

위 내용은 fastcampus 강의 내용을 정리한 것입니다.