336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.
DataFrame
Series가 1차원이라면 DataFrame은 2차원으로 확대된 버전.
Excel spreadsheet 이라고 생각하면 이해하기 쉬움.
2차원이기 때문에 인덱스가 row, column 으로 구성됨.
row : 각 개별 데이터
column : 개별 속성
Data Analysis, Machine Learning에서 data 변형을 위해 가장 많이 사용.
위와 같이 read_csv로 불러오면 DataFrame이 생성된다.
head, tail
데이터의 일부(처음 혹은 마지막부터)를 간단히 보기 위한 함수
기본 default 개수는 5개.
DataFrame 데이터 파악하기
shape : 속성 (row, column)
describe( ) : 숫자형 데이터의 통계치 계산
info( ) : 데이터 타입, 각 아이템의 개수 등 출력
shape
shape 으로 row, column 개수를 알 수 있다.
describe( )
숫자형 데이터의 경우 개수, 평균 등을 보여준다.
info( )
각 개별 속성들에 대한 정보를 보여준다.
각 속성들이 몇개의 데이터를 가지고 있는지, 타입은 무엇인지를 알려준다.
위 내용은 fastcampus 강의 내용을 정리한 것입니다.
'AI > 데이터분석' 카테고리의 다른 글
[pandas] DataFrame 데이터 생성하기 (0) | 2020.02.17 |
---|---|
[pandas] DataFrame 구조 이해하기 (0) | 2020.02.15 |
[pandas] Series 데이터 변경 & 슬라이싱 (0) | 2020.02.14 |
[pandas] Series 데이터 Boolean Selection (0) | 2020.02.14 |
[pandas] series 데이터 연산하기 (0) | 2020.01.30 |