一种尺度参数的确定方法

2012-01-09 03:05任艳艳
关键词:密度估计参数估计小波

任艳艳

(山西大学 数学科学学院,山西 太原 030006)

一种尺度参数的确定方法

任艳艳

(山西大学 数学科学学院,山西 太原 030006)

密度函数的小波估计中,尺度参数的选择是最关键的问题,如果尺度参数选择大小,则受噪声影响比较大.如果尺度参数选择过大,虽然密度函数估计较好,但密度估计的曲线大幅振荡.通过在多维空间中,基于小波的多分辨分析理论对多变量密度函数进行的小波估计,提出了利用Fisher信息来确定尺度参数的新方法.

Fisher信息;尺度参数;小波;密度估计

0 引言

概率密度函数包含了一个随机变量的全部信息,概率密度估计是统计学习中的一个核心问题,知晓了密度函数就可以解决几乎所有统计学中的问题.参数估计是对分布中未知参数进行估计,估计参数从而确定密度.但事实上,很多数据的分布无法事先假定,这使得非参数估计的方法得到了广泛应用,非参数估计是不对参数作假定或不考虑原总体分布时进行统计检验和判断分析的方法.非参数估计的方法许多,如直方图估计,Rosenblatt估计[1],Parzen核估计[2],最近邻估计[3]等,随着小波理论的日益完善,密度函数的小波估计得到了更多的重视.

小波分析理论的核心部分是多分辨分析,多分辨分析是构造小波基的基本构架,也是信号在小波基下进行分解和重构的基本理论保证.利用多分辨分析,可以将一个复杂函数分解成几个简单函数分别讨论.这时函数由一个近似粗糙部分和一系列细节组成,其中粗糙部分对应于信号的低频部分,细节部分对应于信号的高频部分,且高频成分是分层的,是在不同分辨率下产生的,由多分辨子空间的Riesz基导入尺度基,又由尺度基产生小波基.按照多分辨分析,尺度函数是整个框架的生成元,它生成整个框架,也生成小波函数.只要构造了尺度函数,小波函数就可以求出,所以尺度参数的选择是个重要也是难于抉择的问题,在求d处的近似密度时,尺度参数控制着不同距离的样本点对该点密度的影响程度,尺度参数选择对密度曲线的边界影响很大.参数太小随机干扰增大降低了估计的准确性,参数太大则函数突变点所对应的小波变换的模极大值的幅度衰减得比较厉害,这将使函数的突变特征不明显甚至消失,所以选择参数至关重要.利用Daubechies迭代方法[4]可以得到一个尺度函数族,但是比较复杂.t参数Bursa-Wolf转换模型法,需要假设尺度参数空间各向同向,解出的尺度参数值为各个轴度参数的综合平均,不够精确.本文基于多变量密度函数提供了一种较为有效的确定尺度参数的方法.

1 多分辨分析和小波

称空间L2(Rd)中的一列闭子空间V j,j∈Z为L2(Rd)的一个多分辨分析[2],若:

2 多变量密度函数的小波估计

{X i}为平稳随机过程,令X j=(X j+1,…,X j+d),f(x)为联合密度函数,假设f∈L2(Rd),则f(x)的小波展开式[1]为:

由于上述密度函数的小波估计可能出现负值或在Rd上积分不为1,Pinheiro和Vidakovic(1997)[5]将小波估计应用到密度的平方根

3 利用Fisher信息确定尺度参数

Fisher信息表示了样本向量所包含的关于参数信息的多少,F越大,参数的不确定性越小.Fisher信息通过区分一个函数与它经过小变换以后的结果,可以判断函数的粗糙程度,且通过一个小变换以后函数的信息不变.

假设多变量密度函数f(x)绝对连续,f(x)的Fisher信息函数[6]定义为根据求导算子的小波表示,可以得到密度函数线性估计导函数的小波估计,从而确定只依赖于尺度参数的Fisher信息函数的小波估计.

在尺度j下,T j为T的渐进算子,系数{al}在Beylkin(1992)文章中列出,由密度估计的线性估计(4),得T^f的一个小波估计:

证明 该结论为 Huber(1974)一个定理[6]的特例.

[1]Emanuel Parzen.On estimation of density function and mode[J].The Annals of Mathematical Statistics,1962,33(3):1 065-1 076

[2]Murray Rosenblatt.Remarks on some nonparametric estimate of a density function[J].The Annals of Mathematical Statistics,1956,27(3):832-837

[3]Loftsgaarden D O,Quesenberry C P.A nonparametric estimate of a multivariate density function[J].The Annals of Mathematical Statistics,1965,36(3):1 049-1 051

[4]Cheong Y W,Lee Y M,Ra K H,et al.Wavelet-Galerkin scheme of time-dependent inhomogeneous electro-magnetic problems[J].IEEE Microwave and Guided Wave Letters,1999,9(8):297-299

[5]Pinheiro A,Vidakovic B.Estimating the square root of density via compactly supported wavelets[J].Computational Statistics and Data Analysis,1997,25:399-415

[6]Huber P J.Fisher information and spline interpolation[J].The Annals of Statistics,1974,2:1 029-1 034

[7]G Beylkin.On the representation of operates in bases of compactly supported wavelets[J].Siam J.Numer.Anal,1992,6:1 718

A Measure Method to Determine the Parameters

Ren Yanyan
(School of Mathematical Science,Shanxi University,Taiyuan 030006,China)

The scale parameter selection is the key problem in wavelet estimators of density function.Small values of this parameter lead to the estimators not so accurate due to the influences of noise while large values lead to the wavelet estimation curve which is greatly oscillation.Based on wavelet multiresolution analysis and the wavelets estimators of the multivariate density function,a new method to confirm the scale parameter by Fisher information is proposed.

Fisher information;scale parameter;wavelets;density estimators

王映苗】

1672-2027(2012)01-0081-03

O212.7

A

2011-09-15

任艳艳(1986-),女,山西柳林人,山西大学数学科学学院在读硕士研究生,主要从事时间序列分析的研究.

猜你喜欢
密度估计参数估计小波
面向鱼眼图像的人群密度估计
基于多小波变换和奇异值分解的声发射信号降噪方法
基于新型DFrFT的LFM信号参数估计算法
构造Daubechies小波的一些注记
误差分布未知下时空模型的自适应非参数估计
基于MATLAB 的核密度估计研究
一种基于改进Unet的虾苗密度估计方法
基于自适应带宽核密度估计的载荷外推方法研究
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
基于MATLAB的小波降噪研究