기초통계

[통계학의 이해] 16. 신뢰구간의 이해 -2

2023. 9. 26. 16:34

📌 본 포스팅은 통계교육원(https://sti.kostat.go.kr/)

 이러닝 교육과정  '통계학의 이해(2023)' 강의에 대한 복습 기록입니다.

 모든 내용은 강의 교안을 기준으로 작성했으며 원본 자료는 하단 통계교육원 - 교육과정 - 이러닝 - '통계학의 이해'  교육 수강을 통해 무료로 열람 가능하고 교육자료는 저작권자의 동의 없이 무단 복제 및 배포할 수 없습니다.


🎯 

모평균 및 모비율의 신뢰구간을 구하는 방법 알기

모비율 추정에서 표본 크기를 결정하는 방법 알기

 

💡 

1. 모평균에 대한 신뢰구간

2. 모비율에 관한 신뢰구간

3. 모비율의 추정에서 표본의 크기 결정

 

📖 모평균, 모비율, 중심극한정리, 오차의 한계


1. 모평균에 관한 신뢰구간

평균이 μ , 분산이 σ² 인 임의의 모집단에서

크기가 X₁, X₂, X₃, X ₄ .. Xn 을 추출해서 모평균 μ 의 신뢰구간을 구하는 방법

 

모집단 분포에서 모집단이 '정규분포라는 아무런 가정이 없다'면

이러한 경우 중심극한정리를 이용해서 표본평균의 분포가 근사적으로 정규분포를 따른다는 사실을 이용해서 신뢰구간을 구할 수 있다.

 

# 중심극한정리

평균 μ , 분산 σ² 인 모집단에서 크기 n인  랜덤표본  X₁, X₂, X₃, X ₄ .. Xn 의 표본평균 X bar는 표본 크기 n 이 충분히 클 때 근사적으로 정규분포 N( μ , σ² / n ) 을 따른다. 
따라서 X bar를 표준화 시킨 Z = ( Xbar - μ ) /  ( σ / √n ) 은 근사적으로 표준정규분포 N (0, 1) 를 따른다.

 

모집단의 분포가 정규분포가 아닌 임의 분포(분산을 모름)라도 n 이 충분히 크면 아래와 같이 표본평균은 근사적으로 정규분포를 따른다.

따라서 100 ( 1 - σ ) % 의 모평균 μ 의 신뢰구간은 다음과 같이 유도할 수 있다.

 

# 100 ( 1 - σ ) % 의 모평균 μ 의 근사 신뢰구간


2. 모비율에 관한 신뢰구간

# 100 ( 1 - σ ) % 모비율 p의 근사 신뢰구간

 

· p는 사건에 대한 성공확률이고 표본비율  x/n 는 p의 추정량이다.

  (즉, n은 표본의 크기, x는 n개 중 어떤 속성의 수(표본에서의 사건 발생확률)


3. 모비율 추정에서 표본의 크기 결정

 모비율 추정문제에서 주어진 신뢰수준 하에서 오차의 한계를 e 이하로 하기 위해 표본의 크기를 결정해야한다.

 

· e : 최대허용오차

· ( 1-α ) : 신뢰수준(신뢰계수)

·  오차한계 :

 

그렇다면 신뢰구간 유도과정과 비슷하게 아래와 같이 표본의 크기를 구하는 식을 유도해볼 수 있지만

위 식은 모르는 모수 p를 포함하고 있기 때문에 사용할 수 없다.

 

따라서  아래 세가지 방법으로 표본 크기를 결정할 수 있다.

 

1. 이전 조사, 연구에서 사용한 p* 사용 (과거 p에 대한 정보가 있을 때)

 

2. 소표본으로 p를 추저한 추정치 p^ 을 사용해서 n을 계산 후, 필요한 표본 더 추출

 

3. 표준오차 최대값을 사용

    즉 p(1-p) ≤ 0.5(1-0.5) 을 사용해서 n을 계산

 · 과거의 정보가 없다면 이 방법을 가장 많이 사용한다.