`
highsky
  • 浏览: 269176 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

模式分类笔记 -- 高斯函数

阅读更多

一点题外内容:假设检验方法的用处在于让我们知道在观测到目前样本的情况下,除了初始假设之外,是否还有更加可能的某种其它原因。

 

零假设就是一个随机判定规则- 即选择一个样本,就根据某个先验概率P把它归为一个类别,如果一种候选规则同随机判定规则有显著差别,就说它是有用的。

 

空间的线性变换—例如平移(移动原点),旋转,反射,拉伸压缩 ,或者这些的组合;还有其它的变换—可以通过它们在向量上的作用来可视化。

------------------------------

提及高斯函数,不得不提及其产生于的随机误差理论。

 

随机 误差的概念最先有伽利略在《关于两个主要世界系统的对话》中提出,在他的设想里,误差分布函数f(x)满足关于y轴对称,且随|x|的增加而递减。在勒让德的理论中,通常的算术平均值是方程组的未知数为一个时的特例,但这只是代数意义上的算术平均值的优良性,后来辛普森((Thomas Simpso)在《在应用天文学中取若干观测平均值的好处》中第一次从概率的角度严格证明算术平均的优良性(当时只是基于一种简单的误差分布假设)。

 

拉普拉斯直接考虑误差理论的基本问题,取怎样的分布为误差分布,以及在确定误差分布后,如何根据未知量的测量结果来估计其值。拉普拉斯给出与伽利略的随机误差相似的误差分布条件。

1. f(x) = f(-x), x是误差值

2. x->无穷,f(x)->0

3. f(x)的全定义域积分等于1

有很多函数满足这三条性质,为确定其一,他做了如下推理,条件2表明,曲线f(x)随着x(x>0)的增加越来越平缓,因而其下降率 -f'(x)也应随x的增加而下降,设-f‘(x) = mf(x), x>=0,m>0且为常数,可解得f(x) = ce^-mx由f(x) = -f(x), f(x) = ce^mx,x<0.再由f(x)积分=1,得c=m/2,f(x)=m/2*e^-m|x|.

 

拉普拉斯在得到误差密度函数后,就希望去通过能利用这个函数去估计真值。但是在当时的数学发展情况,我们现在熟知的点估计方法,矩法估计和似然估计都没有,拉普拉斯在他的“不充分推理”原则的基础上,得到是十分复杂的方程,不可能有实际的应用价值,他自己也认识到那个问题。

 

 

高斯在研究误差理论的时候,以及其简短的手法,推导出了正态分布密度函数:

假设x的误差分布函数为f(x)

L(X) = L(X; x1,x2...xn)= f(x1-X)f(x2-X)..f(xn-X)

 

这个过程中,高斯有两点创新:

1。 不采取贝叶斯式的推理方法,而是把使上式达到最大值的X = X(x1, x2,..xn)作为 X 的估计。

2。把问题倒过来,先承认算术平均是X应取的估计,然后再去找f(x)迎合这一点,即使算术平均是那个使上式子达到最大值。(算术平均是一个经历千百年考验的方法,故此一个一般方法如果是合理的,他应该在重复测量的情况下导出算术平均,因为最小二乘法具有这一特性,使我们对其合理性增添了信心,哈哈。高斯在研究测量误差的时候顺便也导出了最小二乘法)

 

对上式L(x)两边求对数,记 X 为算术平均。

记g(x) = f'(x)/f(x), 当我们取n = 2时,那么X应满足g(x1 - X ) + g(x2 - X ) = 0, 因为x1 - X = X - x2 , 所以g(-x) = - g(x), g(0) = 0.

现在令n=m+1,而

x1 = x2 =... xm= -x;

xm+1 = mx;

X = 0, g(mx) = mg(x). 假定g连续,不难推出g(x) = cx.因为g'(mx) = g'(x). 接下来显然g‘(x)=c .后面不难解得f(x)=Me^cx^2,f(x)积分为1, c便为一负数,记c为-1/h^2.正态分布的形式就不难求解了。

----------在20091104又发现上面记号里有些许错误,修正及修改衔接描述 

 

这里可以看作必要性 的推导,虽然不知道高斯是不是这样推导的(根本搜不到相应的资料,要么可能有用的就是收费的,跑了上海书城一趟有用的东西也没翻到,都知道的东西你写本书我也写本书。还有人发表的文章上用的记号都似不对的,看得我郁闷了一个星期,直让我怀疑,是我太笨还是这东西太神秘)。

 

其实正态分布函数并不是首先来源高斯,只是首先被高斯用于误差分析领域,才慢慢发挥出巨大的作用,e这个东西在数学上很奇妙哈,我想这与三角函数,无穷级数,欧拉等等的研究的很有关系。

 

顺藤摸瓜的看了不少东西,到后来却发现没什么好写的 。顺便再说点,为什么高斯函数的曲线叫钟形曲线,首先有人研究命名了钟形曲面,记得外国的教堂的钟和旅馆里的服务台上的小铃铛吧,后来才有钟形曲线。

 

-------------------------------

两个高斯函数的卷积仍然是一个高斯函数,也就是说两个正态随机变量的和(z=x+y) 还是服从正态分布。卷积是其中一个函数翻转并平移后与另一个函数的乘积对于平移量的积分。

 

卷积最初为研究信号的零状态响应而来,有人说相关和卷积很像,的确,但他们又是两个完全不同的概念。相关最早是用来概率论中描述随机变量之间关系的概念,如相关系数。实际上信号一般是一个随机过程,为了实现信号的检测、识别与提取,经常要了解两个信号的相似性,或一个信号经过一段延迟后自身的相似性。但相关系数有缺陷,因为分子是两个信号的内积,如sinx和cosx,从波形上看只是相位不同,而相关系数为零(因为正弦和余弦正交),因此引进相关函数,将原来两函数直接内积改为一个函数和另一个函数的延迟作内积,所以和卷积公式很像,但其中每个量的物理意义是不同的。

 

--------------------

卷积如果再拓展一下:卷积的结果定义了一个新函数,这点在核函数里有充分体现,由卷积得到的函数f*g 一般要比fg 都光滑。特别当g 为具有紧致集(对应的空间稠密)的光滑函数,f 为局部可积时,它们的卷积f * g 也是光滑函数。利用这一性质,对于任意的可积函数f,都可以简单地构造出一列逼近于fs,这种方法称为函数的光滑化或正则化。卷积的概念还可以推广到数列、测度(为了积分推广)以及广义函数上去。

-------------------Added at 2009-03-31

 

服从多元正态分布的数据样本趋向于聚集在均值向量周围,形成一个以协方差矩阵的各本征向量为主轴的椭球形云团。二元的分布密度函数对应于代数里的二次型,因为它还是正态分布,所以它是一个“馒头山”,只有一个峰。这样研究极值就有意义了。

 

分享到:
评论
2 楼 highsky 2009-04-17  
再次看到记录上海书城那段文字,自己都想笑笑。本想删点现在觉得幼稚的言语的,呵呵,转念就觉得千万不能删,正是它们让这篇博客丰富了记录生活作用和信息。

当我再次回到这篇文章时,定还会有新感受,会心一笑。

1 楼 highsky 2008-10-26  
呵呵,更新了一下,修正了一点以前不充分的结论,在----之间。

相关推荐

Global site tag (gtag.js) - Google Analytics