데이터가 정규분포로부터 생성된다고 가정합니다.
$$Y \sim \mathcal{N}(\mu, \sigma^2)$$
이 함수가 바로 확률적 구조입니다. 즉, 데이터가 어떤 확률로 생성되는지를 정의합니다.
$$f(y \mid \mu, \sigma^2)
= \frac{1}{\sqrt{2\pi\sigma^2}}
\exp\!\left[-\frac{(y – \mu)^2}{2\sigma^2}\right]$$
이제 실제로 다음과 같이 관측된 데이터가 있다고 하면,
$$y_1, y_2, \dots, y_n$$
이들은 모두 독립적으로 동일한 분포(i.i.d.)를 따른다고 가정합니다.
$$y_i \sim \mathcal{N}(\mu, \sigma^2), \quad i = 1, \dots, n$$
즉, 각 데이터 동일한 모수 $\mu$와 $\sigma^2$을 가지는 정규분포로부터 추출됩니다.