통계학

Lecture/Elementary Stat

11. 두 표본에 대한 가설의 검정 (Hypothesis tests for Two sample)

두 모집단의 비교 통계적 실험에서는 두개 이상의 모집단에 대한 모수의 비교가 필요한 경우가 있다. 이때의 표본은 모집단 간의 관계에 대해 다음과 같이 구분된다. 독립표본 (dependent sample)은 서로 다른 두 집단에서 독립적으로 추출한 표본을 의미한다. 대응표본 (paired sample)은 동일한 집단에서 실험 조건을 달리하였거나 사전과 사후로 구분하여 추출한 표본을 의미한다. 독립표본에서는 집단의 크기가 달라도 되며 대응표본에서는 집단의 크기가 같아야 한다. 독립표본의 표본평균과 표본분산 두 모집단의 모평균에 대한 추정과 검정을 위해 모평균이 $\mu_1$, 모분산이 $\sigma^2_1$인 모집단 1에서 크기가 $n_1$인 확률표본 $X_1, \cdots, X_{n_1}$을 추출하고 모평..

Lecture/Elementary Stat

10. 단일 표본에 대한 가설의 검정 (Hypothesis tests for One sample)

가설검정 통계적 가설검정 (hypothesis testing)은 분포나 모수에 대한 추정에 대해 통계적 가설 (statistical hypothesis)을 정하여 확률적으로 이것의 옳고 그름을 판단하는 것을 의미한다. 주로 새로운 주장을 기존에 알던 사실과 대비하여 어느것이 더 맞는지 판단한다. 지금까지 옳은 것으로 알고 있는 기존의 사실을 귀무가설 (null hypothesis, $H_0$)이라고 하고 표본으로부터 얻은 증거에 근거하여 입증하고자 하는 새로운 주장을 대립가설 (alternative hypothesis, $H_1$)이라고 한다. 모수에 대한 가설 일반적으로 모수 $\theta$에 대한 가설검정에서 대립가설 $H_1$의 형태는 크게 다음 세 가지로 구분된다. $\theta > \theta_..

Lecture/Elementary Stat

9. 순서통계량과 표본의 크기 (Order statistics and Sample size)

순서통계량 $X_1, X_2, \cdots, X_n$을 $-\infty \le a < b \le \infty$에 대해 받침 (support) $S = (a, b)$를 갖는 pdf $f(x)$에 대한 확률분포에서 추출한 확률표본이라고 하고 $Y_1$을 $X_i$ 중 가장 작은 것, $Y_2$를 $X_i$ 중 두번째로 작은 것, 그리고 $Y_n$을 $X_i$ 중 가장 큰 것이라고 하면 $Y_i$는 $X_1, X_2, \cdots, X_n$의 $i$번째 순서통계량 (order statistics) 이라고 한다. 받침은 공역에서 pdf가 양의 확률을 갖는 점들의 부분집합이다. 순서통계량 $Y_i$는 $Y_1 < Y_2 < \cdots < Y_n$을 만족하며 오름차순으로 배열된 $X_1, X_2, \cdots, ..

Lecture/Elementary Stat

8. 구간추정 (Interval estimation)

구간추정 점추정에서는 관심이 있는 모수 $\theta$의 참값 $\theta_0$에 대한 추정으로 통계량 $\hat \theta$를 사용했지만 실제로 $\hat \theta$이 $\theta_0$일 확률은 아주 낮다. $\hat \theta$이 연속형 분포를 따른다면 $P(\hat \theta = \theta_0) = 0$이다. 따라서 모수 $\theta$를 추정하기 위해 참값이 포함될 것이라 예상되는 구간을 제시하는 것을 구간추정 (interval estimation) 이라고 한다. 참값이 포함될 확률에 따라 추정하는 참값의 하한값과 상한값으로 이루어진 구간을 신뢰구간 (confidence interval)이라고 한다. 신뢰구간 주어진 확률 $1 - \alpha$에 대하여 $P(\hat \theta_L..

Lecture/Elementary Stat

7. 점추정 (Point estimation)

추정 통계적 추론 (statistical inference)은 고려중인 모집단으로부터 추출한 표본을 기초로 하여 모집단의 분포나 모수를 추정 (estimation)하고 검정 (test)하는 것을 의미한다. 모수에 관한 추정 형태는 크게 모수의 참값으로 추측되는 하나의 값을 구하는 점추정 (point estimation)과 모수의 참값을 포함할 것이라고 추측되는 구간을 구하는 구간추정 (interval estimation)으로 나뉜다. 점추정 점추정에서 관심이 있는 모수 $\theta$가 가질 수 있는 모든 값들의 집합을 모수공간 (parameter space)이라고 한다. 모수 $\theta$를 추정하기 위해 사용되는 통계량을 점추정량 (point estimator) 또는 추정량 (estimator)이라..

Lecture/Elementary Stat

6. 표본의 분포 (Sampling distribution)

모집단과 표본 모집단 (population)이란 어떤 정보의 대상이 되는 전체 집단을 의미한다. 모집단의 크기 (population size)는 모집단에서 관측 가능한 수를 나타낸다. 표본 (sample)이란 모집단으로부터 추출된 부분집합을 의미한다. 표본의 크기 (sample size)는 표본에서 관측 가능한 수를 나타낸다. 모수와 통계량 모수 (parameter)란 모집단의 특성을 나타내는 수치화된 값을 의미한다. 통계량 (statistics)이란 추출된 표본의 특성을 포함하여 모수를 추론하기 위한 수치이다. 표본 분포 (sampling distribution)란 통계량의 확률분포를 지칭한다. 통계적 추론 전형적인 통계 문제는 확률변수 $X$에 관심이 있으나 그 확률변수의 pdf $f_X(x)$를 모..

Lecture/Elementary Stat

5. 이변량 분포 (Bivariate distribution)

Review - 결합확률밀도함수 두 연속확률변수 $X$, $Y$와 평면상의 임의의 영역 $(x, y) \in A \times B$에 대해, 다음 식을 만족하는 $f(x, y)$가 존재하면 $f(x, y)$를 $X$와 $Y$의 결합확률밀도함수 (joint pdf)라고 한다. $$ P((x, y) \in A \times B) = \int_A \int_B f(x, y) dxdy, $$ 여기서 모든 $(x, y)$에 대해 $f(x, y) \geq 0$ 이고 $\int^\infty_{-\infty} \int^\infty_{-\infty} f(x, y) dxdy = 1$이 된다. 더보기 Examples 확률변수 $X$와 $Y$의 결합확률밀도함수가 다음과 같을 때 $c$를 구하시오. $$ f(x, y) = \bigg..

Lecture/Elementary Stat

4. 연속형 분포 (Continuous distribution)

연속형 분포 1 - 균일분포 확률변수 $X$가 구간 $[a, b]$ 상에 균일하게 분포되어 있고 다음의 확률밀도함수를 가지면 균일분포 (Uniform distribution)라고 한다. $$ f_X(x) = \bigg\{\begin{array}{lr} \frac{1}{b - a}, & a \le x \le b \\ 0, & \text{otherwise} \end{array} $$ '$X$는 구간 $[a, b]$ 상에서 균일분포를 따른다'고 하고 $X \sim U(a, b)$로 표기한다. 균일분포의 평균은 $E(X) = \frac{a + b}{2}$이고 분산은 $Var(X) = \frac{(b - a)^2}{12}$이다. 균일분포의 누적분포함수는 $F_X(X) = \frac{x - a}{b - a}, a ..

Lecture/Elementary Stat

3. 이산형 분포 (Discrete distribution)

이산형 분포 1 - 베르누이분포 베르누이 (Bernoulli) 시행은 통계적 시행 (trial)에서 결과가 오직 두 가지 (success & failure, S & F)만 가지는 시행을 지칭한다. 성공 확률이 $p$인 베르누이 시행에서 확률변수 $X$가 0 또는 1의 결과값을 취하고 다음의 확률질량함수를 가지면 베르누이분포 (Bernoulli distribution)라고 한다. $$ P(X = x) = \bigg\{\begin{array}{lr} p, & x = 1 \\ 1 - p, & x = 0 \end{array} $$ '$X$는 모수 (parameter)가 $p > 0$인 베르누이분포를 따른다'고 하고 $X \sim B(1, p)$로 표기한다. 이산형 분포 2 - 이항분포 모수 $p$를 갖는 베르누..

Lecture/Elementary Stat

2. 확률변수와 확률분포 (Random variable and Probability distribution)

확률변수 확률변수 (random variable)란 실험의 각 결과, 즉 근원사건에 실수값을 대응시키는 함수 (실함수, real-valued function)를 의미한다. $$ X : \Omega \rightarrow \mathbb{R} $$ 확률변수 $X$가 가지는 실수값들의 집합 $\Omega_X$을 공역(codomain)이라고 한다. $\Omega_X$가 유한집합이거나 셀 수 있는 집합이면 $X$를 이산확률변수 (discrete random variable)라고 하고 $\Omega_X$가 연속적인 값을 갖고 셀 수 없는 집합이면 $X$를 연속확률변수 (continuous random variable)라고 한다. 더보기 Examples 두 개의 주사위를 동시에 던지는 실험 나온 숫자의 합을 확률변수 ..

repaired_stat
'통계학' 태그의 글 목록