第28卷第3期 201 1年06月 工 程 数 学 学 报 vo1.28 No.3 June 201 1 CHINESE JOURNAL OF ENGINEERING MATHEMATICS 文章 ̄:1005—3o85(2o11)o3—0285-08 一种基于密度核估计的最大熵方法 刘钰 ,韩峰 ,王玉恒 ,乔登江 ,一,王建国 ,。 f1一西北核技术研究所,西安710024; 2一上海华东师范大学,上海200062;3一西安交通大学,西安710049) 摘要:针对未知概率分布类型的测量数据,采用最大熵方法可以确定被测量含有最少人为主观假设的概 率分布.但经典最大熵方法由于其密度函数的数学形式导致全局优化难度较大,计算结果难以满 足概率密度函数基本性质,需要截断及归一才能使用.本文通过引入概率密度核估计方法,对最 大熵方法进行了改进,简化了计算过程,并证明了改进后计算结果能够满足概率密度函数基本性 质,最后通过算例说明了该方法的有效性. 关键词:测量数据;最大熵方法;密度核估计;概率分布估计 分类号:AMS(20001 62F15 中图分类号:O212.1 文献标识码:A 1 引言 最大熵方法MEM(Maximum Entropy Method)是Jaynes于1957年提出的一种可处理不完 全信息的方法,利用信息论中熵的概念来尽量避免主观因素对推断的影响_1.对于只有测量数据 1J的情况,如果没有充足的理由认为其服从某种概率分布,则可通过最大熵方法确定出其最不带 倾向性的分布形式及参数【2】,且运用最大熵原理得到的密度函数是被测量的最小偏差估计_3.3j 经典最大熵方法利用拉格朗日乘子法导出了概率密度函数估计的解析形式,并构造优化问 题.但该估计的解析形式对优化求解产生了一定制约,计算结果难以满足概率密度函数的基本 性质,甚至存在不严格可积的现象,这时往往需要截断及归一处理后才能使用.本文提出了一 种结合密度函数核估计的最大熵方法,该方法利用密度核估计函数能够收敛于任何复杂密度函 数的性质,对上述优化问题进行了重新描述,在熵值最大意义下给出了满足约束条件的被测量 密度函数估计,能够避免经典最大熵方法存在的问题. 2 最大熵方法基本原理及问题 最大熵方法是按最大熵原理求解不适定问题的方法【4,引.具体地,随机变量 的概率密度函 数p(x)的信息熵可定义为 )一 p( n ) 收稿日期:2009—09—24.作者简介:刘钰(1982年11YJit),男,硕士,助理研究员.研究方向:武器系统评估技术 工 程 数 学 学 报 第28卷 】;( )=exp( 0+∑ t ), (3) =一. ㈥ 卜一m, ㈣ 3 基于密度核估计的最大熵方法 在符合最大熵方法思想的情况下,被测量的概率密度估计 ( ),如果能够满足密度函数的 般性质: ,+o。 一1)p(x) 0, 2) /p(x)dx=1, oo 则可以显著减少截断误差.通过引入密度函数核估计方法,这种设想即可实现.密度核估计方 法可以较好地应用于规则分布或不规则分布,单峰或多峰分布的估计,而且只要样本容量足够 大,总可以保证以任意精度收敛于任何复杂的未知密度[8.8] 第3期 刘钰,等:一种基于密度核估计的最大熵方法 287 (a)概率密度函数左侧不可积情况 (b)概率密度函数右侧不可积情况 图1:3阶矩最大熵密度函数 3.1密度函数核估计基本原理 设 ( )为R上的一个给定的概率密度函数,则 礼 Q ( )] 称为总体密度p(x)的一个核估计【 ], (u)为核函数(也称为窗函数),扎为核函数的数量,ht> 0为窗宽,at是每个核函数的权重【。,加],且0<OLi<l,∑ t=1,i:1,2,…,n. 因为核函数 f )为概率密度函数,则满足: ,+。。 1) (钆) 0, 2) / K(u)du=1, 一 显然,在K(u)≥0的下,自然能保证 x)的非负性,而且可以证明 州一 t ( ) 去 ( )出 i c (x)dx=1, t , c7 故P x)满足归一化条件,即: ,十o。 1)Pn( ) 0, 2) / J—O0 这就证明了 ( )是一个合理的概率密度函数,满足了作为总体密度p( )估计的基本条件[引. 3.2基于密度核估计的最大熵方法 根据最大熵方法的思想,将核估计概率密度函数P x)取符合约束条件且信息熵值最大的状 态,则 卜 ( )].1n( t ( ) ㈣ 288 工 程 数 学 学 报 第28卷 令P x)的信息熵达到最大,则优化问题为 max H(p ) s.t.XiPn(9) ( )d : , :1 .,m, 其中 为第i阶原点矩的值,m为最高阶矩的阶数. 本文将这样构造的最大熵方法称为密度核估计最大熵方法KDE-MEM fKernel Density Estimate—Maximum Entropy Method).由于概率密度函数P x)的性质,保证了目标函数在 积分域上的收敛性,解决了函数不严格可积的问题. KDE-MEM方法需求解的问题是约束非线性最优化问题,这可以选择序列二次规划 法fSQP)[n],其优化计算过程可以通过Matlab优化工具箱编程实现,计算中有两点需要 注意: 1)为了用数值方法计算出(8)式的积分,必须设置所求积分函数的上下界,一般可由样本 分散范围确定; 2)理论上核函数个数n取值越大,密度函数逼近效果越好.但同时仡的取值越大,算法复 杂度也越高. 4 数值算例 为了验证密度核估计最大熵方法的有效性,以下以两种典型分布为总体进行抽样,使用密 度核估计最大熵方法进行分布估计,并将验证结果与经典最大熵方法进行对比分析. 4.1对数正态分布 对数正态分布的概率密度函数为 pLⅣ( 其中 >0,一OO< <OO, >0. e一 取 :0.5, =0.25,通过计算机从对数正态分布LN(O.5,0.25)中抽样,样本容量为200, 具体数据从略,根据这些数据计算其前4阶样本原点矩为 =1.6975,M2=3.0686,M3= 5.8923.M4=11.999. 使用密度核估计最大熵方法方法,选定正态窗函数 ( )= 1 e-考 ,则总体密度函数的 核估计为 n . 1(1nx-itt)0一 p ) OZi[ e一 r]j 扎 为了保证在优化过程中,1>OLi>0,i=1,2,…,n,且E Oti=1,可以作如下变换 i=1 exp 8t t ——一, ∑exp t:1 其中 ∈R,这样既满足了 t的条件,也使得优化参数的取值空间变为实数空间,更利于计 第3期 刘钰,等:一种基于密度核估计的最大熵方法 289 算.所以总体密度函数I?OLN(X)的核估计变换为 i=1 ∑exp LV ‘ex p ̄iO-i 『 e一 ]取佗=3,则p礼x)共包含9个参数,积分区间选取[0,4】,其各参数优化的结果见表1,残 差平方和R=3.727×i0 2.经典最大熵方法的参数优化结果见表2,残差平方和R: 8.4217×10~8. 表1:对数正态分布下密度核估计最大熵方法参数优化结果 表2:对数正态分布下经典最大熵方法参数优化结果 根据这些参数值,可以给出密度核估计最大熵方法得到的密度函数与LN(O.5,0.25)理论分 布的图像,并与经典最大熵密度函数进行对比,见图2.通过观察图像可以看出,经典最大熵 方法的计算结果在右侧拖尾处出现不可积情况.而最大熵密度核估计分布与理论分布更为接 近,且满足概率密度函数基本性质. 图2:对数正态密度函数及其估计函数图比较 4.2 WeibuU分布 Weibull 布的概率密度函数为pw(x)=ba-bxb-1e一(詈) ,其中X>0,a>0,b>0. 取a=3,b=6,通过计算机从分布Weibull(3,6)中抽样,样本容量为200,根据这些数 据计算其前4阶样本原点矩为 :2.7830,M2=8.0352,M3=23.9185,Ma=73.0769.密 290 工 程 数 学 学 报 第28卷 度核估计最大熵方法仍选定正态窗函数,取n=3,积分区间选取『0,51,其各参数优化的结 果见表3,残差平方和R=6.352×10_10.经典最大熵方法的参数优化结果见表4,残差平方 口R=2.45×10—7. 同样可以给出密度核估计最大熵方法得到的密度函数与Weibull(3,6)理论分布的图像,并 与经典最大熵密度函数进行对比,具体见图3.通过观察图像可以看出,密度核估计最大熵方 法分布与理论分布更为接近. 表3:Weibul1分布下密度核估计最大熵方法参数优化结果 表4:Weibul1分布下经典最大熵方法参数优化结果 图3:Weibull密度函数及其估计函数图 5 实例 器件MKJ911(FPGA)和28C256(E PROM)在受到7辐射时失效样本容量分别为6和5. 实验结果表明,这两种器件的失效规律一般遵循对数正态分布,根据失效样本不难估计出对数 正态失效分布的参数 和 ,见表5. 表5: 两种器件失效分布的参数估计 第3期 刘钰,等:一种基于密度核估计的最大熵方法 291 同时根据失效样本,使用本文方法可以得到器件的KDE—MEM失效分布估计.将两种失效 分布进行对比,如图4所示. 观察图4可以发现,在不加入任何主观信息的情况下,器件的最大熵分布估计基本能够符 合其失效规律.基于失效分布可以估计其失效阈值及方差,将两种失效分布下估计得到的失效 阈值及方差进行比较,结果见表6. (a)MKJ91 1(FPGA) (b)28C256(E2PROM) 图4: 两种器件的对数正态及KDE.MEM失效分布 表6: 两种器件的失效阈值及方差估计 6 讨论与分析 上节中的算例验证了密度核估计最大熵方法的有效性.我们可将两种方法对比分析的结果 总结如下: 1)核估计 ( )本身满足密度函数的基本性质,优化结果不存在不可积的情况,不需要进 行截断就可以直接使用; 2)在给定样本矩情况下,仅使用3个核函数的核估计,优化结果已经具有较高的精度.可 以根据需要,通过增加核函数的数量来进一步提高计算精度. 本文通过改进经典最大熵方法,得到了满足密度函数基本性质的计算结果,使最大熵方法 的适用性得到了进一步提高. 292 工 程 数 学 学 报 第28卷 圳 参考文献: f11 Jaynes E T.Information theory and statistical mechanics[J1.The Physical Review,1957,106(4):620—630 f21吴乃龙,袁素云.最大熵方法【M】.湖南:湖南科学技术出版社,1991 Ⅵ,u N L,Yuan S Y.Maximum Entropy Method[M1.Hunan:Hunan Science and Technology Press,1991 『31林洪桦.现代测量误差分析及数据处理fJ_.计量技术,1997,2:39—44 Lin H H.Modern analysis of measure error and data processing[J1.Measurement Technique,1997,2:39—44 『41陈希孺,等.非参数统计方法[M].上海:上海科学技术出版社,1989:283—296 Chen X R,et a1.Nonparametric Statistical Method[M】.Shanghai:Shanghai Science and Technology Press, 1989:283—296 f5]詹昊克,姜礼平,苑秉成.最大熵先验下成败型产品成功率的鉴定试验方案[J].工程数学学报,2005,22(4): 653—658 Zhan H K,Jiang L P,Yuan B C.Reliability qualification test in binomial case based oil maximum—entropy priors[J1.Chinese Journal of Engineering Mathematics,2005,22(4):653—658 王中宇.测量不确定度的非统计理论fM1.北京:国防工业出版社,2000 Wang z Y.Non-statistical Theory in Measurement Uncertainty[M].Beijing:National Defeuce Industry Press,2000 朱坚民,等.基于最大熵方法的测量结果估计及测量不确定度评定『J-.电测与仪表,2005,42(8):5-8 Zhu J M,et a1.Study Oil evaluation of measurement result and uncertainty based on maximum entropy method[J].Electrical Measurement and Instrumentation,2005,42(8):5-8 Parzen E.On estimation of a probability density function and model[J].Annals of Mathematical Statistics, 1962,33(7):316—327 边肇祺,张学工.模式识别fM1.北京:清华大学出版社,2000 Bian Z Q,Zhang x G.Pattern Recognition[M].Beijing:Tsinghua University Press,2000 郭照庄,等.变窗宽密度核估计的构造及均方相合性『J_.佳木斯大学学报(自然科学版),2006,24(3):423—425 Guo Z Z,et a1.Structure and consistence of the variable bandwidth for kernel density estimation[J].Journal of Jiamusi University(Natural Science Edition),2006,24(3):423—425 简金宝,罗慕华.一般约束最优化超线性与二次收敛的SQP拟可行方法『J-.工程数学学报,2004,21(4):526—530 Jian J B,Luo M H.An SQP quasi—feasible algorithm with superlinear and quadratic convergence or fgeneral constrained optimization[J1.Chinese Journal of Engineering Mathematics,2004,21(4):526—530 A New Maximum Entropy Method Based on Kernel Density Estimate LIU Yu ,HAN Feng ,WANG Yu—heng ,QIAO Deng—jiang ,一,WANG Jian—guo '。 (1一Northwest Institute of Nuclear Technology,Xi’an 710024; 2一East China Normal University,Shanghai 200062;3一Xi’an Jiaotong University,Xi’an 710049) Abstract:For the measurement data with unknown probability distribution,it has been proved that the probability distribution determined by the maximum entropy method(MEM)is a reasonable distri— bution with the least assumption.But the result of MEM is not always consistent with the properties of a probability density,the resulting truncation and normalization of the result would reduce the ac— curacy of MEM.A new method based on the maximum entropy principle which combines with kernel density estimate of a probability density is proposed.The estimate given by the new method is totally consistent with the properties of a probability density.The validity and accuracy of the new method are illustrated through examples. Keywords:measurement data;maximum entropy method;kernel density estimate;distribution esti— mate Received:24 Sep 2009. Accepted:O1 Dec 2010