주요 확률분포 중 아직 다루지 않은 분포는 카이제곱분포, t분포, F분포입니다.
이제까지 다룬
이산형 확률분포인 베르누이 시행, 이항분포, 포아송분포, 기하분포, 음이항분포, 초기하분포와
연속형 확률분포인 균등분포, 정규분포, 표준정규분포, 지수분포, 감마분포는
모두 현실세계를 표현하기 위한 확률분포입니다.
앞으로 다룰 확률분포인 카이제곱분포, t분포, F분포는
모두 일정한 규칙에 따라 검정을 하기위한 확률분포입니다.
통계적 가설을 검정하고, 검증된 가설은
통계적으로 유의미한 가설이 되며, 진리에 다가가기 위한 열쇠가 됩니다.
이중 카이제곱분포는 t분포와 F분포의 기반이 되는 분포입니다.
카이제곱분포로 가는 시리즈는 다음과 같이 구성됩니다.
1. 카이제곱분포로 가는 모평균
2. 카이제곱분포로 가는 모분산
3. 카이제곱분포로 가는 표본평균 분포의 평균
4. 카이제곱분포로 가는 표본평균 분포의 분산
5. 카이제곱분포로 가는 표본분산 분포의 평균
6. 카이제곱분포로 가는 표본분산 분포의 분산
7. 카이제곱분포
오늘은 카이제곱분포로 가는 모평균에 대해서입니다.
통계자료를 조사하기 위한 목적은 모집단의 분포를 알기위해서 입니다.
모집단은 우리가 알고자 하는 대상 전체입니다.
예를 들어 우리가 통계초등학교의 2학년 4반 학생의 키와 몸무게를 조사합니다.
2학년 4반 전원이 결석없이 모두 출석하여 키와 몸무게를 재었습니다.
이 경우 우리는 알고자 했던 대상 전체인 2학년 4반이 모집단이며,
우리는 모집단에 대한 자료를 획득하였습니다.
그러나 우리나라에 거주하는 7세 전원의 키와 몸무게를 일시에 측정하는 것은 불가능합니다.
이 경우 우리가 알고자 하는 대상 전체인 우리나라에 거주하는 7세 전체가 모집단이며,
우리는 모집단에 대한 전체 자료를 획득하기는 어렵습니다.
따라서 그 일부만을 조사하여, 모집단의 분포를 추측하고자 합니다.
모집단의 분포 역시 정확하게 추측하는 것은 쉽지 않습니다.
다만 정규분포와 같이 특정 분포를 따른 다는 가정 하에,
모집단의 분포에서 기대되는 값인 모평균과,
그 모평균을 기준으로 범위를 보여주는 모분산에 대해서 추측해볼 수는 있습니다.
모집단(Population)의 특성을 나타내는 값을 모수(Parameter)라고 하며,
대표적으로 모평균과 모분산이 있습니다.
모평균과 모분산은 일반적으로 그리스 문자로 표현합니다.
모평균을 영어발음 그대로 표기시에는 뮤라고 하며,
영어에서 평균을 뜻하는 mean의 첫번째 글자인 m의 그리스 소문자에서 왔습니다.
모분산은 모표준편차의 제곱입니다.
모표준편차는 영어발음 그대로 표기시에는 시그마라고 하며,
영어에서 표준편차를 뜻하는 standard deviation의 첫글자인 s의 그리스 소문자에서 왔습니다.
모분산을 영어발음 그대로 읽을 때에는 sigma squared라고 읽으며,
시그마 제곱이라고도 말합니다.
모평균은 우리가 알고있는 산술평균과 동일합니다.
우리가 알고자 하는 대상의 모든 자료값들을 더한 후 자료값의 갯수로 나누면 됩니다.
우리는 통계초등학교 2학년 4반 학생들의 키를 알고자 합니다.
자료는 numpy를 활용하여 임의로 생성하겠습니다.
np.random.seed(1)를 통해 임의로 값들을 생성시마다 변경되지 않도록 고정하였습니다.
np.random.normal을 통해 정규분포를 따르는 자료인 normal_distribution을 생성하였습니다.
첫번째 인자는 평균이 130cm를 뜻하며,
두번째 인자는 표준편차는 10cm을 뜻하며,
세번째 인자는 24명의 자료를 뜻합니다.
24명의 키를 모두 더한 후, 자료값의 갯수로 나눠주면 평균이 나옵니다.
numpy의 mean을 활용해도 결과는 동일합니다.
정리하면,
우리가 알고자 하는 집단 전체를 모집단이라고 하며,
그 모집단의 평균이 모평균이며, 수학기호로 µ 라고 표기합니다.
다음은 카이제곱분포로 가는 모분산입니다.
'확률분포 > 연속형 확률분포' 카테고리의 다른 글
[python/파이썬] 카이제곱분포로 가는 표본분산 분포의 평균 (0) | 2023.02.02 |
---|---|
[python/파이썬] 카이제곱분포로 가는 표본평균 분포의 분산 (0) | 2023.02.01 |
[python/파이썬] 카이제곱분포로 가는 표본평균 분포의 평균 (0) | 2023.01.31 |
[python/파이썬] 카이제곱분포로 가는 모분산 (0) | 2023.01.30 |
[python/파이썬] 감마분포 (0) | 2023.01.21 |
[python/파이썬] 지수분포 (0) | 2023.01.18 |
[python/파이썬] 정규분포 (0) | 2023.01.18 |
[python/파이썬] 균등분포(균일분포) (1) | 2023.01.18 |