- 구간추정
- 점추정에서는 관심이 있는 모수 $\theta$의 참값 $\theta_0$에 대한 추정으로 통계량 $\hat \theta$를 사용했지만 실제로 $\hat \theta$이 $\theta_0$일 확률은 아주 낮다. $\hat \theta$이 연속형 분포를 따른다면 $P(\hat \theta = \theta_0) = 0$이다.
- 따라서 모수 $\theta$를 추정하기 위해 참값이 포함될 것이라 예상되는 구간을 제시하는 것을 구간추정 (interval estimation) 이라고 한다.
- 참값이 포함될 확률에 따라 추정하는 참값의 하한값과 상한값으로 이루어진 구간을 신뢰구간 (confidence interval)이라고 한다.
- 신뢰구간
- 주어진 확률 $1 - \alpha$에 대하여 $P(\hat \theta_L < \theta < \hat \theta_U) = 1 - \alpha$를 만족하는 구간 $(\hat \theta_L, \hat \theta_U)$를 모수 $\theta$에 대한 $100(1 - \alpha)%$ 신뢰구간이라고 한다.
- 즉, 신뢰구간에서는 $\theta$를 포함할 확률이 $1 - \alpha$이고 이 확률을 신뢰수준 (confidence level) 또는 신뢰도 (confidence coefficient) 라고 한다.
- $\alpha$는 주로 $0.1, 0.05, 0.01$을 사용한다.
- 모평균의 신뢰구간 - 모분산이 알려진 경우
- $X_1, X_2, \cdots, X_n$을 평균이 $\mu$, 분산이 $\sigma^2$인 모집단으로부터 얻은 확률표본이라고 하고 모집단이 정규모집단 또는 비정규모집단에서 대표본인 경우에 모평균 $\mu$의 $100(1 - \alpha)%$의 신뢰구간은 다음과 같다. 여기서 $z_{\alpha / 2}$는 $N(0, 1)$에서 오른쪽 바깥 면적이 $\alpha / 2$인 $z$값이다. $$ \left(\overline{X} - z_{\alpha / 2} \frac{\sigma}{\sqrt{n}}, ~~\overline{X} + z_{\alpha / 2} \frac{\sigma}{\sqrt{n}}\right) $$
- $\pm$를 사용하여 다음과 같이 표현하기도 하며 여기서 $z_{\alpha / 2} \frac{\sigma}{\sqrt{n}}$를 오차한계라고 부른다. $$ \overline{X} \pm z_{\alpha / 2} \frac{\sigma}{\sqrt{n}} $$
- 모집단이 정규모집단이면 $\overline{X} \sim N(\mu, \frac{\sigma^2}{n})$이다. \\ (Ch4 정규분포의 결합, Ch6 표본평균의 분포)
- 모집단이 비정규모집단이고 대표본이면 $\overline{X} \sim N(\mu, \frac{\sigma^2}{n})$이다. (Ch7 중심극한정리)
- 따라서 $Z = \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \sim N(0, 1)$이므로 다음 식이 성립한다. $$ P(-z_{\alpha / 2} < Z < z_{\alpha / 2}) = P(-z_{\alpha / 2} < \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} < z_{\alpha / 2}) = 1 - \alpha$$
- 위 식을 $\mu$에 관하여 정리하면 다음 식을 얻는다. $$ P\left(\overline{X} - z_{\alpha / 2} \frac{\sigma}{\sqrt{n}} < \mu < \overline{X} + z_{\alpha / 2} \frac{\sigma}{\sqrt{n}}\right) = 1 - \alpha $$
더보기
Examples
- 모집단 $N(\mu, 5^2)$으로부터 크기가 100인 표본을 추출하여 계산된 표본평균이 $\overline{x} = 10$이라고 할 때 모평균 $\mu$의 $90\%$ 신뢰구간을 구하시오. 여기서 $z_{0.05} = 1.64$를 사용하시오. \begin{equation*}
\begin{aligned}
\overline{x} \pm z_{\alpha / 2} \frac{\sigma}{\sqrt{n}}
& = 10 \pm 1.64 \frac{5}{\sqrt{100}} \\
& = 10 \pm \frac{1.64}{2} \\
& = 10 \pm 0.82
\end{aligned}
\end{equation*}
$$ \therefore ~~~ \mu \text{의 90% 신뢰구간} = (9.18, ~ 10.82) $$
- 모평균의 신뢰구간 - 모분산이 알려지지 않은 경우
- $X_1, X_2, \cdots, X_n$을 평균이 $\mu$인 정규모집단으로부터 얻은 확률표본인 경우에 모평균 $\mu$의 $100(1 - \alpha)%$의 신뢰구간은 다음과 같다. 여기서 $S^2$은 표본분산, $t_{\alpha / 2}(n - 1)$는 $t(n - 1)$에서 오른쪽 바깥 면적이 $\alpha / 2$인 $t$값이다.$$ \left(\overline{X} - t_{\alpha / 2}(n - 1) \frac{S}{\sqrt{n}}, ~~\overline{X} + t_{\alpha / 2}(n - 1) \frac{S}{\sqrt{n}}\right) $$
- $\pm$를 사용하여 다음과 같이 표현하기도 하며 여기서 $t_{\alpha / 2}(n - 1) \frac{S}{\sqrt{n}}$를 오차한계라고 부른다. $$ \overline{X} \pm t_{\alpha / 2}(n - 1) \frac{S}{\sqrt{n}} $$
- 모집단이 정규모집단이면 $T = \frac{\overline{X} - \mu}{S / \sqrt{n}} \sim t(n - 1)$이다. (Ch6 표본분산의 분포)
- 따라서 다음 식이 성립한다. $$ P(-t_{\alpha / 2}(n - 1) < T = \frac{\overline{X} - \mu}{S / \sqrt{n}} < t_{\alpha / 2}(n - 1)) = 1 - \alpha$$
- 위 식을 $\mu$에 관하여 정리하면 다음 식을 얻는다. $$ P\left(\overline{X} - t_{\alpha / 2}(n - 1) \frac{S}{\sqrt{n}} < \mu < \overline{X} + t_{\alpha / 2}(n - 1) \frac{S}{\sqrt{n}}\right) = 1 - \alpha $$
더보기
Examples
- 평균이 $\mu$인 정규모집단으로부터 크기가 100인 표본을 추출하여 계산된 표본평균이 $\overline{x} = 10$, 표본분산이 $s^2 = 25$라고 할 때 모평균 $\mu$의 $95%$ 신뢰구간을 구하시오. 여기서 $t_{0.025}(99) = 1.98$을 사용하시오. \begin{equation*}
\begin{aligned}
\overline{x} \pm t_{\alpha / 2}(n - 1) \frac{s}{\sqrt{n}}
& = 10 \pm 1.98 \frac{5}{\sqrt{100}} \\
& = 10 \pm \frac{1.98}{2} \\
& = 10 \pm 0.99
\end{aligned}
\end{equation*}
$$ \therefore ~~~ \mu \text{의 95% 신뢰구간} = (9.01, ~ 10.99) $$
- 모평균의 신뢰구간 - 모분산이 알려지지 않은 경우 2
- $X_1, X_2, \cdots, X_n$을 평균이 $\mu$인 모집단으로부터 얻은 확률표본이라고 하고 대표본인 경우에 모평균 $\mu$의 $100(1 - \alpha)%$의 신뢰구간은 다음과 같다. 여기서 $S^2$은 표본분산, $z_{\alpha / 2}$는 $N(0, 1)$에서 오른쪽 바깥 면적이 $\alpha / 2$인 $z$값이다. $$ \left(\overline{X} - z_{\alpha / 2} \frac{S}{\sqrt{n}}, ~~\overline{X} + z_{\alpha / 2} \frac{S}{\sqrt{n}}\right) $$
- $\pm$를 사용하여 다음과 같이 표현하기도 하며 여기서 $z_{\alpha / 2} \frac{S}{\sqrt{n}}$를 오차한계라고 부른다. $$ \overline{X} \pm z_{\alpha / 2} \frac{S}{\sqrt{n}} $$
- 이런 신뢰구간을 \textbf{대표본 신뢰구간}이라고 부른다.
- 대표본이면 $\overline{X} \sim N(\mu, \frac{S^2}{n})$이다. (중심극한정리)
- 따라서 $Z = \frac{\overline{X} - \mu}{S / \sqrt{n}} \sim N(0, 1)$이므로 다음 식이 성립한다. $$ P(-z_{\alpha / 2} < Z < z_{\alpha / 2}) = P(-z_{\alpha / 2} < \frac{\overline{X} - \mu}{S / \sqrt{n}} < z_{\alpha / 2}) = 1 - \alpha$$
- 위 식을 $\mu$에 관하여 정리하면 다음 식을 얻는다. $$ P\left(\overline{X} - z_{\alpha / 2} \frac{S}{\sqrt{n}} < \mu < \overline{X} + z_{\alpha / 2} \frac{S}{\sqrt{n}}\right) = 1 - \alpha $$
더보기
Examples
- 평균이 $\mu$인 모집단으로부터 크기가 100인 표본을 추출하여 계산된 표본평균이 $\overline{x} = 10$, 표본분산이 $s^2 = 25$라고 할 때 모평균 $\mu$의 $95%$ 신뢰구간을 구하시오. 여기서 $z_{0.025} = 1.96$을 사용하시오. \begin{equation*}
\begin{aligned}
\overline{x} \pm z_{\alpha / 2} \frac{s}{\sqrt{n}}
& = 10 \pm 1.96 \frac{5}{\sqrt{100}} \\
& = 10 \pm \frac{1.96}{2} \\
& = 10 \pm 0.98
\end{aligned}
\end{equation*}
$$ \therefore ~~~ \mu \text{의 95% 신뢰구간} = (9.02, ~ 10.98) $$
- 모분산의 신뢰구간
- $X_1, X_2, \cdots, X_n$을 분산이 $\sigma^2$인 정규모집단으로부터 얻은 확률표본인 경우에 모분산 $\sigma^2$의 $100(1 - \alpha)%$의 신뢰구간은 다음과 같다. 여기서 $S^2$은 표본분산 $\chi^2_{\alpha / 2}(n - 1)$은 $\chi^2(n - 1)$에서 오른쪽 바깥 면적이 $\alpha / 2$인 $\chi^2$값이다. $$ \left(\frac{(n - 1)S^2}{\chi^2_{\alpha / 2}(n - 1)}, ~~ \frac{(n - 1)S^2}{\chi^2_{1 - \alpha / 2}(n - 1)}\right) $$
- 모집단이 정규모집단이면 $V = \frac{(n - 1)S^2}{\sigma^2} \sim \chi^2(n - 1)$이다. (Ch6 표본분산의 분포)
- 따라서 다음 식이 성립한다. $$ P(\chi^2_{1 - \alpha / 2}(n - 1) < V = \frac{(n - 1)S^2}{\sigma^2} < \chi^2_{\alpha / 2}(n - 1)) = 1 - \alpha$$
- 위 식을 $\sigma^2$에 관하여 정리하면 다음 식을 얻는다. $$ P\left(\frac{(n - 1)S^2}{\chi^2_{\alpha / 2}(n - 1)} < \sigma^2 < \frac{(n - 1)S^2}{\chi^2_{1 - \alpha / 2}(n - 1)}\right) = 1 - \alpha $$
더보기
Examples
- 정규모집단으로부터 크기가 9인 표본을 추출하여 계산된 표본분산이 $s^2 = 25$라고 할 때 모분산 $\sigma^2$의 $90%$ 신뢰구간을 구하시오. 여기서 $\chi^2_{0.05}(8) = 15.5, \chi^2_{0.95}(8) = 2.7$을 사용하시오. \begin{equation*}
\small
\begin{aligned}
\left(\frac{(n - 1)s^2}{\chi^2_{\alpha / 2}(n - 1)}, ~~ \frac{(n - 1)s^2}{\chi^2_{1 - \alpha / 2}(n - 1)}\right)
& = \left(\frac{8 \cdot 25}{15.5}, ~~ \frac{8 \cdot 25}{2.7}\right) \\
& = (12.9, 74.1)
\end{aligned}
\end{equation*}
$$ \therefore ~~~ \sigma^2 \text{의 90% 신뢰구간} = (12.9, 74.1) $$
- 모비율의 신뢰구간
- $X_1, X_2, \cdots, X_n$을 모수가 $p$인 $B(1, p)$로부터 얻은 확률표본인 경우에 모비율 $p$의 $100(1 - \alpha)\%$의 신뢰구간은 다음과 같다. 여기서 $\hat p$은 표본비율, $z_{\alpha / 2}$는 $N(0, 1)$에서 오른쪽 바깥 면적이 $\alpha / 2$인 $z$값이다. $$ \left(\hat p - z_{\alpha / 2} \sqrt{\frac{\hat p (1 - \hat p)}{n}}, ~~ \hat p + z_{\alpha / 2} \sqrt{\frac{\hat p (1 - \hat p)}{n}}\right) $$
- $\pm$를 사용하여 다음과 같이 표현하기도 하며 여기서 $z_{\alpha / 2} \sqrt{\frac{\hat p (1 - \hat p)}{n}}$를 오차한계라고 부른다. $$ \hat p \pm z_{\alpha / 2} \sqrt{\frac{\hat p (1 - \hat p)}{n}} $$
- 주로 $n - \sum^n_{i = 1} X_i \ge 5,~~ \sum^n_{i = 1} X_i \ge 5$인 경우에 적합하다.
- 이항분포의 성질에 의해 $X = \sum^n_{i = 1} X_i \sim B(n, p)$이고 $n$이 충분히 크면 $\hat p = \frac{X}{n} \sim N(p, \frac{p(1 - p)}{n})$이다. (Ch4 이항분포의 정규근사)
- 따라서 $ Z = \frac{p - \hat p}{\sqrt{p(1 - p) / n}} \sim N(0, 1)$이므로 다음 식이 성립한다. $$ P(-z_{\alpha / 2} < Z = \frac{p - \hat p}{\sqrt{p(1 - p) / n}} < z_{\alpha / 2}) = 1 - \alpha$$
- 위 식을 $p$에 관하여 정리하면 다음 식을 얻는다. $$ P\left(\hat p - z_{\alpha / 2} \sqrt{\frac{\hat p (1 - \hat p)}{n}} < p < \hat p + z_{\alpha / 2} \sqrt{\frac{\hat p (1 - \hat p)}{n}}\right) = 1 - \alpha $$
더보기
Examples
- 어떤 후보의 지지율 $p$를 조사하기 위해 크기가 100인 표본을 추출하여 조사한 결과 80명이 지지함을 선택했을때 모비율 $p$의 $95%$ 신뢰구간을 구하시오. 여기서 $z_{0.025} = 1.96$을 사용하시오. \begin{equation*}
\begin{aligned}
\hat p \pm z_{\alpha / 2} \sqrt{\frac{\hat p (1 - \hat p)}{n}}
& = 0.8 \pm 1.96 \sqrt{\frac{(0.8)(0.2)}{100}} \\
& = 0.8 \pm (1.96)(0.04) \\
& = 0.8 \pm 0.08
\end{aligned}
\end{equation*}
$$ \therefore ~~~ p \text{의 95% 신뢰구간} = (0.72, 0.88) $$
'Lecture > Elementary Stat' 카테고리의 다른 글
10. 단일 표본에 대한 가설의 검정 (Hypothesis tests for One sample) (0) | 2023.02.10 |
---|---|
9. 순서통계량과 표본의 크기 (Order statistics and Sample size) (0) | 2023.01.30 |
7. 점추정 (Point estimation) (0) | 2023.01.26 |
6. 표본의 분포 (Sampling distribution) (0) | 2023.01.17 |
5. 이변량 분포 (Bivariate distribution) (0) | 2023.01.16 |