336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.
평균 (mean)
: 평균값, 다 더해서 그 개수로 나눠줌.
편차 (deviation)
: 평균값으로부터의 차이.
: 그러나 합계가 0임. --> 평균값을 기준으로 차이를 계산했기 때문.
: 고로 합계를 이용하여 흩어진 정도를 파악할 수 없음.
분산 (variance)
: 흩어진 정도를 파악하고자하니 편차는 합계가 0이라 이용할 수 없음..
: 대신 편차에서 부호를 없애고 사용하기 위해 제곱을 하고 다시 평균을 냄.
표준편차 (standard deviation)
: 분산(variance)는 단위도 함께 제곱되면서 그 의미가 애매해지는데 이를 위해 분산(variance)의 제곱근인 표준편차를 사용함.
공분산 (covariance)
: 위에서 봤던 분산과 표준편차들은 하나의 변수를 위한 값이었음.
: 공분산은 서로 다른 두 변수 사이의 관계를 보기 위함.
: 두 변수가 서로 다른 단위를 사용하더라도 신경쓰지않고 구하면 됨. --> 애초에 서로 다른 데이터 간 관계를 표현하는 지표를 사용했기 때문.
: 공분산의 절대값 크기는 아무런 의미가 없음!!!!
: X의 평균 , : Y의 평균
- Cov(X, Y) > 0 : 양의 관계에 있다고 표현. --> 어느 하나가 증가하면 다른 하나도 증가함
- Cov(X, Y) < 0 : 음의 관계에 있다고 표현. --> 어느 하나가 증가하면 다른 하나는 감소함
- Cov(X, Y) = 0 : 선형관계 없음
'AI > 확률과통계' 카테고리의 다른 글
[확률및통계] 7강 여러가지 이산확률분포 (0) | 2019.11.27 |
---|---|
[확률및통계] 6강 조건부 평균 (0) | 2019.11.18 |
[확률및통계] 5강 확률변수의 평균과 분산 (0) | 2019.11.18 |
[확률및통계] 4강 연속확률변수 (0) | 2019.11.11 |
[확률및통계] 3강 확률변수(random variable)의 정의, 이산확률변수 (0) | 2019.11.08 |