最大似然参数学习
统计学习是智能体利用统计学的方法进行学习。机器学习(Machine Learning)的算法大多建立在数理统计和概率论的基础上,其中最大似然参数学习就是统计学习中的一种主要参数学习算法,是利用统计学的极大似然估计的方法确定要学习的参数。
基本信息
- 中文名
最大似然参数学习
- 外文名
Maximum Likelihood Parameter Learning
- 关键词
机器学习 最大似然估计 参数学习
基本内容
在人工智能领域中,智能体可以通过概率理论以及决策理论来处理不确定性问题,但是首先它们必须根据经验学习关于世界的概率理论。机器学习的过程就是从样本空间寻找拟合函数的过程。拟合函数的形式多种多样,当一个拟合函数的基本模型定下后,就需要通过样本空间的大量样本来调整拟合函数模型的一些参数定形,主要包括参数学习算法,使之能够进行更加准确的拟合。
首先可以定义几个符号用于参数学习算法的推导及应用:
1. θ为参数向量(θ0,θ1,θ2,…,θn),用来定形我们选择的模型。
2. y为函数输出
3. x为函数输入向量
最大似然估计法
对于未知的概率密度函数,需要用已知的数据估计潜在的概率密度函数。最大似然估计法(the Principle of Maximum Likelihood )由高斯和费希尔先后提出,是被使用最广泛的一种参数估计方法,该方法建立的依据是直观的最大似然原理。极大似然原理是样本所展现的状态便是所有可能状态中出现概率最大的状态。
假设一个试验有若干个可能结果A1,A2,A3,…,An,若一次实验的结果是Ai发生,则自然认为Ai在所有可能结果中发生的概率最大,当总体X的未知参数θ待估时,应用这一原理,对X的样本(X1,X2,…,Xn)做一次观测实验,得到样本观察值(x1,x2,…,xn)为此一次试验结果,那么参数θ的估计值应该取为使得这一结果发生的概率为最大才合理,这就是最大似然估计法的基本思想。
最大似然估计参数学习
已知某个随机样本满足某种概率分布,但是其中具体的参数未知,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,因此不会再去选择其他小概率的样本,所以就将此参数作为估计的真实值。
最大似然参数学习方法的步骤如下:
1. 写出数据的似然表达式,它是待学习参数的一个函数。
2. 对每个参数的对数似然进行求导。
3. 找到满足导数为0的对应参数值。
应用分析EM算法
机器学习参数学习的思想为,假设估计两个参数A、B,初始状态下二者均未知,默认条件为若知道A的信息则可以得到B的信息,反之也成立。可考虑首先赋予A某种初值,以此得到B的估计值,再从B的当前值出发,重新估计A的取值,并将这个过程一直持续到收敛为止。
利用最大似然算法估计未知概率分布函数的参数,机器学习算法中的EM(Expectation Maximization)是非常有效的方法。由于概率分布函数的隐含变量未知,可以先给这个分布设定一个初始值,然后求这个隐含变量的期望,当成是这个隐含变量的已知值,接下来就可以用最大似然求解那个分布的参数。这个参数比随机的参数更能表达真实的分布,再通过这个参数确定的分布去求这个隐含变量的期望,再最大化,就能得到另一个更优的参数。