728x90

전체 데이터를 대표적인 하나의 값으로 표현하는 값을 대푯값이라고 합니다.

 

대푯값에는 계산을 통해 결정하는 산술평균, 기하평균, 조화평균, 평방평균, 가중평균 등이 있습니다. 

 

계산을 통하지 않는 대푯값으로는 위치에 따라 대푯값으로 의미를 부여하는 중위수, 최빈수 등이 있습니다. 

 

 

가중평균(Weighted Mean)

각 데이터별로 중요한 정도가 다른 경우에, 각 데이터에 가중치를 곱한 후,

가중치가 부여된 데이터들을 합하고,

가중치의 합으로 나누어 줍니다. 

 

일반적으로 가중치의 합은 확률의 합인 1이나, 특정 배율로 정하는 경우도 있으므로, 

가중치의 합이 언제나 1이라고는 할 수 없습니다. 

조건식을 통하여 각 데이터와 가중치의 곱셉을 할 수도 있습니다. 

여기서 조건식은 [data[i] * weight[i] for i in range(len(data)] 입니다.

 

우선 len 함수를 통해 데이터의 개수를 구한 후,

range함수를 통해 0부터 1, 2, 3과 같은 정수를 만들어서 하나씩 데이터를 가져올 준비를 합니다. 

range함수 안에 데이터의 개수인 4가 들어갔으므로 0을 포함하는 4개의 정수를 가져옵니다. 

즉 0, 1, 2, 3을 가져옵니다.

 

data[i]와 weight[i]는 data[0], weight[0]이 되고, 

data에서 첫번째 값인 10과 weight에서 첫번째 값인 0.1을 가져와서 곱셈(*)을 합니다. 

sum 함수를 통해 위에서 나온 데이터값을 모두 더해주고,

sum 함수를 통해 구한 가중치의 합으로 나눠주게 됩니다. 

 

가중평균은 자료값별로 중요도를 알고 있거나,

각 자료별로 중요도를 달리하여 평균을 산출할 때 대푯값으로 활용됩니다. 

반응형

+ Recent posts