728x90

전체 데이터를 대표적인 하나의 값으로 표현하는 값을 대푯값이라고 합니다.

 

대푯값에는 계산을 통해 결정하는 산술평균, 기하평균, 조화평균, 평방평균, 가중평균 등이 있습니다. 

 

계산을 통하지 않는 대푯값으로는 위치에 따라 대푯값으로 의미를 부여하는 중위수, 최빈수 등이 있습니다. 

 

 

평방평균(Quadratic Mean)

평방평균은 각 데이터들을 제곱하여 합한 후, 데이터의 개수로 나누고, 제곱근을 통하여 구합니다. 

제곱근을 하는 이유는 데이터를 제곱하였으므로, 이를 원래의 수준으로 되돌리기 위해서입니다. 

조건식을 통하여 각 데이터들의 제곱을 구할 수 있습니다.  여기서 조건식은 [x **2 for x in data] 입니다.

 

data에서 하나씩 뽑은 데이터를 x라 하고, x를 제곱(**)한 후,

sum 함수를 통해 각각의 값을 모두 더하고, 

len 함수를 통해  데이터의 개수로 나누어 주고,

numpy의 sqrt 함수를 통해 제곱근을 구해도 결과는 동일합니다.

평방평균은 데이터에 이상치가 포함되어 있다는 것을 보여주기 위해 활용됩니다. 

 

평방평균은 대표값으로 활용되는 경우는 많지 않으나,

산술평균과 기하평균과 함께 기술되어,

이상치가 데이터에 포함되어 있음을 내포되어 있다는 사실을 알려줍니다.

반응형

+ Recent posts