[ QA ]

다변량 표준정규분포 표본공간에서 원점에서 평균점까지 거리는 자유도가 1인 카이분포인가?

목차

네, 그렇습니다.

다변량 표준정규분포 표본공간에서 표본평균점은 (1, 1, …, 1) 방향 직선 위에 존재합니다.

원점에서 표본평균점까지의 거리(norm), $\|\mathbf{M}\|$는 자유도가 1인 카이분포를 가집니다. 

$$\|\mathbf{M}\| = \sqrt{n}\, |\bar{Y}| \sim |Z|$$

$$\|\mathbf{M}\| \sim \chi_{1}$$

1. 다변량 표준정규분포 표본공간에서 평균점

표본의 원소가 표준정규분포를 나타내면, 표본공간 $\mathbb{R}^n$에 확률을 부여하여 다변량 표준정규분포로 표현할 수 있습니다.

표본의 원소가 독립인 표본의 크기 $n$을 차원으로 하는 표본공간에서 평균벡터는 아래처럼 정의됩니다.

$$\mathbf{M} = (\bar{Y},\, \bar{Y},\, \ldots,\, \bar{Y})^{\top} \in \mathbb{R}^{n}$$

원점에서 평균점까지를 평균벡터로 표현할 수 있습니다. 평균벡터는 모든 성분이 동일하므로

$$\mathbf{M} = (\bar{Y}, \bar{Y}, \ldots, \bar{Y})^{\top}$$

평균벡터의 크기(norm)는 다음과 같습니다.

$$\|\mathbf{M}\|
= \sqrt{\bar{Y}^{2} + \bar{Y}^{2} + \cdots + \bar{Y}^{2}}
= \sqrt{n\,\bar{Y}^{2}}
= \sqrt{n}\,|\bar{Y}|$$

표본평균을 분포로 표현하면

$$\bar{Y} \sim N(0, \dfrac{1}{n})$$

정규화(normalizing)하면

$$\sqrt{n}\,\bar{Y} \sim N(0,1)$$

거리로 표현하면

$$\|\mathbf{M}\| = \left|\sqrt{n}\,\bar{Y}\,\right| \sim |Z|$$

따라서, 원점에서 평균까지의 거리는 자유도 1인 카이분포입니다.

$$\|\mathbf{M}\| \sim \chi_{1}$$

2. 다변량표준정규분포 표본공간 시각화

다변량 표준정규분포의 표본공간은 확률밀도의 등고선으로 표현할 수 있습니다. 확률밀도의 등고선은 구체를 나타냅니다.

Figure 1. 3차원 표본공간과 다변량표준정규분포 확률공간에서의 평균점과 표본점