본문으로 바로가기

평균, 편차, 분산, 표준편차, 공분산

category AI/확률과통계 2019. 12. 11. 10:59
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.







평균 (mean)


: 평균값, 다 더해서 그 개수로 나눠줌.






편차 (deviation)


: 평균값으로부터의 차이.

: 그러나 합계가 0임. --> 평균값을 기준으로 차이를 계산했기 때문.

: 고로 합계를 이용하여 흩어진 정도를 파악할 수 없음.






분산 (variance)


: 흩어진 정도를 파악하고자하니 편차는 합계가 0이라 이용할 수 없음..

: 대신 편차에서 부호를 없애고 사용하기 위해 제곱을 하고 다시 평균을 냄.






표준편차 (standard deviation)


: 분산(variance)는 단위도 함께 제곱되면서 그 의미가 애매해지는데 이를 위해 분산(variance)의 제곱근인 표준편차를 사용함.







공분산 (covariance)


: 위에서 봤던 분산과 표준편차들은 하나의 변수를 위한 값이었음.

: 공분산은 서로 다른 두 변수 사이의 관계를 보기 위함

: 두 변수가 서로 다른 단위를 사용하더라도 신경쓰지않고 구하면 됨. --> 애초에 서로 다른 데이터 간 관계를 표현하는 지표를 사용했기 때문.

: 공분산의 절대값 크기는 아무런 의미가 없음!!!!




: X의 평균 ,   : Y의 평균


  • Cov(X, Y) > 0 : 양의 관계에 있다고 표현. --> 어느 하나가 증가하면 다른 하나도 증가함
  • Cov(X, Y) < 0 : 음의 관계에 있다고 표현. --> 어느 하나가 증가하면 다른 하나는 감소함
  • Cov(X, Y) = 0 : 선형관계 없음