概率模型

维基百科,自由的百科全书
跳转至: 导航搜索

概率模型Statistical Model,也稱為Probabilistic Model)是用来描述不同随机变量之间关系的数学模型,通常情况下刻画了一个或多个随机变量之间的相互非确定性概率关系。从数学上讲,该模型通常被表达为(Y,P),其中Y是观测集合用来描述可能的观测结果,PY对应的概率分布函数集合。若使用概率模型,一般而言需假设存在一个确定的分布P生成观测数据Y。因此通常使用统计推断的办法确定集合P中谁是数据产生的原因。

大多数统计检验都可以被理解为一种概率模型。 例如,一个比较两组数据均值的学生t检验可以被认为是对该概率模型参数是否为0的检测。此外,检验与模型的另一个共同点则是两者都需要提出假设并且误差在模型中常被假设为正态分布。

定义[编辑]

概率模型\mathcal{P}是一个概率分布函数密度函数的集合。可分为参数模型,无参数和半参数模型。

参数模型是一组由有限维参数构成的分布集合\mathcal{P}=\{\mathbb{P}_{\theta} : \theta \in \Theta\}。其中\theta 是参数,而\Theta \subseteq \mathbb{R}^d是其可行欧几里得子空间。概率模型可被用来描述一组可产生已知采样数据的分布集合。例如,假设数据产生于唯一参数的高斯分布,则我们可假设该概率模型为\mathcal{P}=\{\mathbb{P}(x; \mu, \sigma) = \frac{1}{\sqrt{2 \pi} \sigma} \exp\left\{ -\frac{1}{2\sigma^2}(x-\mu)^2\right\} : \mu \in \mathbb{R}, \sigma > 0\}

无参数模型则是一组由无限维参数构成的概率分布函数集合,可被表示为\mathcal{P}=\{\text{all distributions}\}

相比于无参数模型和参数模型,半参数模型也由无限维参数构成,但其在分布函数空间内并不紧密。例如,一组混叠的高斯模型。确切的说,如果d是参数的维度,n是数据点的大小,如果随着d \rightarrow \inftyn \rightarrow \inftyd/n \rightarrow 0,则我们称之为半参数模型。