336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.
학습 데이터 셋(train dataset), 검증 데이터 셋(test/validation dataset)을 분할하는 법.
from sklearn.model_selection import train_test_split
x = x_data # target이 없는 값.
y = target
train_x, test_x, train_y, test_y = train_test_split(x, y, train_size=0.7, test_size=0.3)
분할 결과가 항상 같길 바란다면 train_test_split 함수에 random_state 파라미터로 값을 전달해주면 된다.
실행해서 확인하면 다음과 같이 잘 분할된것을 확인할 수 있다.
'AI > Tip' 카테고리의 다른 글
우분투 서버 초기 설정 (0) | 2020.02.25 |
---|---|
zsh: command not found: python3 (0) | 2020.02.17 |
GPU로 학습한 체크포인트 CPU에서 적용하기 (pytorch) (2) | 2020.02.13 |
tensor 차원 늘리기 & channel 추가 (0) | 2020.02.06 |
docker ssh 설치 및 sublimetext sftp & filezilla 연결하기 (0) | 2020.01.16 |