본문으로 바로가기

[sklearn] train, test set 분할

category AI/Tip 2020. 2. 16. 15:57
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

 

 

 

 

학습 데이터 셋(train dataset), 검증 데이터 셋(test/validation dataset)을 분할하는 법.

 

from sklearn.model_selection import train_test_split

x = x_data # target이 없는 값.
y = target

train_x, test_x, train_y, test_y = train_test_split(x, y, train_size=0.7, test_size=0.3)

 

분할 결과가 항상 같길 바란다면 train_test_split 함수에 random_state 파라미터로 값을 전달해주면 된다.

 

 

실행해서 확인하면 다음과 같이 잘 분할된것을 확인할 수 있다.