[pandas] DataFrame 범주형 데이터 전처리 (one-hot encoding)
One-hot encoding 범주형 데이터는 분석 단계에서 계산이 어렵기 때문에 숫자형으로 변경이 필요함. 범주형 데이터의 각 범주(category)를 column 레벨로 변경 해당 범주에 해당하면 1, 아니면 0으로 채우는 인코딩 기법 pandas.get_dummies 함수 사용 drop_first : 첫번째 카테고리 값은 사용하지 않음. 전체 데이터에 대해서 pd.get_dummies를 적용시키면 기본적으로 숫자형이 아닌 모든 컬럼들에 대해서 원핫인코딩(one-hot encoding)을 진행한다. pd.get_dummies( data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, d..