[ QA ]

다변량 표준정규분포 표본공간에서 원점에서 평균점까지 거리는 자유도가 1인 카이분포인가?

목차

네, 그렇습니다.

다변량 표준정규분포 표본공간에서 평균점은 (1, 1, …, 1) 방향 직선 위에 존재합니다.

원점에서 평균점까지의 거리(norm) $\|M\|$는 자유도가 1인 카이분포를 가집니다. 

$$\|M\| = \sqrt{n}\, |\bar{X}| \sim |Z|$$

$$\|M\| \sim \chi_{1}$$

1. 다변량 표준정규분포 표본공간에서 평균점

표본의 원소가 표준정규분포를 나타내면, 표본공간 $\mathbb{R}^n$에 확률을 부여하여 다변량 표준정규분포로 표현할 수 있습니다.

표본의 원소가 독립인 표본의 크기 n을 차원으로 하는 표본공간에서 평균벡터는 아래처럼 정의됩니다.

$$M = (\bar{X},\, \bar{X},\, \ldots,\, \bar{X}) \in \mathbb{R}^{n}$$

원점에서 평균점까지를 평균벡터로 표현할 수 있습니다. 평균벡터는 모든 성분이 동일하므로

$$M = (\bar{X}, \bar{X}, \ldots, \bar{X})$$

평균벡터의 크기(norm)는 다음과 같습니다.

$$\|M\|
= \sqrt{\bar{X}^{2} + \bar{X}^{2} + \cdots + \bar{X}^{2}}
= \sqrt{n\,\bar{X}^{2}}
= \sqrt{n}\,|\bar{X}|$$

표본평균을 분포로 표현하면

$$\bar{X} \sim N(0, 1/n)$$

정규화(normalizing)하면

$$\sqrt{n}\,\bar{X} \sim N(0,1)$$

거리로 표현하면

$$\|M\| = \left|\sqrt{n}\,\bar{X}\,\right| \sim |Z|$$

따라서, 원점에서 평균까지의 거리는 자유도 1인 카이분포입니다.

$$\|M\| \sim \chi_{1}$$

2. 다변량표준정규분포 표본공간 시각화

다변량 표준정규분포의 표본공간은 확률밀도의 등고선으로 표현할 수 있습니다. 확률밀도의 등고선은 구체를 나타냅니다.

Figure 1. 3차원 표본공간과 다변량표준정규분포 확률공간에서의 평균점과 표본점