[개념정리] 과적합이란?
과적합이란? 과적합이라는 용어는 통계학이나 기계학습에서 주로 쓰이며, 과거데이터를 통해 모델을 세운다면 자주 마주하게 되는 문제입니다. 다른 중요한 통계적 개념들과도 밀접하게 연관되어 있는 것들이 많아 매우 중요한 개념이죠. 과적합은 모델이 실제 변수들 간의 관계보다는 과거 학습데이터 (training data)의 노이즈를 설명하게 되는 경우를 표현할 때 쓰입니다. 즉, 모델이 과거의 데이터를 너무 과하게 설명한 나머지 실제 변수들 간의 관계를 잘못 설명하게 되는 경우입니다. 이러한 모델은 이미 학습한 데이터는 잘 설명하는 것처럼 보이지만 아직 학습하지 않은 데이터에 대해서는 제대로 설명하지 못합니다. 마치 암기식으로 공부하여 시험문제를 잘 못 푸는 것처럼 말이죠. 잘 와 닿지 않을 수도 있겠지만, 모델..