`
highsky
  • 浏览: 269147 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

模式分类笔记 -- 统计学习(2)

阅读更多

任意一个拥有n个变量的boolean function可以被一个r(r<n)阶的PTG来实现。具体细节现在不看,不然又扯出来一大堆东西。PTG来解决问题看成是多个LTG的组合,只不过输入被扩展了。


在典型的boolean function的时候,当变量数又比较小,可以用K-map来进行简单有效的分析,挖出可行的LTG组合形式。

 

 

Function Counting Theorem:位于general position的m个点能被线性二分的情况的数目

Function counting theorem


我们以Points in General Position的概念出发,来对这个问题来进行说明。
在一个d维空间的m个点中,如果不存在d+1个点同处在d-1维的超平面 上,那么我们认为这m个点处在General Position上,此时m>d。例如三点不共线。
如果m<d, 那么就变成没有m-2维的超平面包含这m个点,意义不大,且又没法感受,因为超过了三维空间就没法用立体图形表示了。说到底,回到线性代数的表示方式:也就是(m>n时)。
linear independent

general position在定理证明里是充要条件,当然它也有表述问题时其优秀的特性,例如m个随机点位于Gerneral position的概率是接近1的:)


现在我们来证明一下这个定理:
设m点集X={x1, x2, ..xm}实数域d维空间,记C(m, d)为完成{X+,X-}分离出来的线性二分的数目,X+表明在分隔超平面正侧。其实我们这里讨论的是没有标记过的点,就如非监督学习一样,只是考察能不能把它们分开,是能够完成可分的任务的所有可行情况的数目。


考虑一个新点,xm+1, 记x‘ = {x1, x2, ..xm,xm+1},这m+1个点同样要满足general position的条件,那么可以存在一些通过xm+1的超平面可以完成对X的划分,记这种划分的数目为D。对于D中的每一种情况,将会有两个新的划分出现,{X+, X- U {Xm+1}}和{X+ U {Xm+1}, X-}。
这是因为对于处于general position的情况下,D中的那个分隔超平面可以移动无限小的距离而不影响到分隔的结果{X+, X-}。因此对于D中每个旧的分隔情况,会增加出一个新的来 :C(m+1, d)=C(m, d) - D + 2D = C(m, d) + D.

然而D=C(m, d-1),因为限制了超平面必须通过一点其实就使得问题等价于d-1维度的问题 。C(m+1, d) = C(m, d) + C(m, d-1)。
这样的迭代关系 ,我们可以解得Function counting theorem proof
C(1, n) = 2,因为一个点只可能有两种划分情况,既而更加简化,在m<d+1时,更加简单:

simple format

一个单独n-input LTG可以完成对处于general position上的m个点划分的概率是:

 

线性二分概率

当n->无穷的时候,这个概率的极限是1,限制条件是m<2(n+1) 。LTG不能处理m>3(n+1)的问题,但有这问题的时候我们还可以提高维度。

General Position其实是这个问题的上界,因为在任意点集合,出现不同的线性二分的情况叫少了,数目少了,概率自然就降下来了。
对于属于布尔空间的m个点,能被一个r阶PTG进行二分的概率是多少呢
Function counting的数目上界是Boolean linear function counting 。这里右边的是多项式的自由度,看到最上面写的那个定理么,funciton counting theorem里看得出方程也是随m递增的,2的n次方做为左边的极限带来的就是最大值。

再往下的就不说了。



其实写了这么多更多只是对于Cover theorem的一个佐证 :The probability that classes are linearly separable increases when the features are nonlinearly mapped to a higher dimensional feature space.

低维空间不可分转换到高维空间有可能线性可分

分享到:
评论
1 楼 doudoulong2002ok 2008-11-29  
有道理!加油!

相关推荐

    机器学习深度学习及计算机视觉入门基础.docx

    关于机器学习、深度学习及计算机视觉入门论文和书籍...统计模式分类 37 感知机 38 支持向量机 39 结构模式识别 39 广义匹配 39 目标匹配 39 动态模式匹配 41 关系匹配 41 图同构匹配 43 时空行为理解 43 场景解释 43

    统计学习方法——K近邻法(学习笔记)

    K近邻算法简介 K近邻法是一种基本分类与回归方法。K近邻法的输入为实例的特征向量(特征空间的点),输出为实例的类别,可以取多类。 K近邻算法假设给定一个训练数据集,其...2.距离度量 特征空间中两个实例点的距离

    timenote时光笔记(记事本软件) v2.37.zip

    支持加密管理以及提供了年月日周等多种查看模式并新增唯美的时光树统计方式,满足不同的记事需求。适合于工作日志记录,个人记事及家庭备忘。当迷恋上了每天记录事件,会发现自己对生活与工作的节奏有更好的把握,...

    针式PinPKM-V201506(免费无使用限制)

    而针式PKM,则更注重文档的归类、统计分析、辅助学习等, 避免浪费了很多时间收集的资料,实际上只是活在硬盘空间中的垃圾。 并且多数的其它软件以网页以主,但网页的知识载体量约为20%而于; 而针式PKM则以Word...

    asp.net知识库

    VS2005 ASP.NET本地化学习笔记&感受 在自定义Server Control中捆绑JS文件 Step by Step 深度解析Asp.Net2.0中的Callback机制 使用 Web 标准生成 ASP.NET 2.0 Web 站点 ASP.NET 2.0基于SQLSERVER 2005的aspnetdb.mdf...

    PinPKM-V201525(官网发布的最后一个免费无使用限制版本)

    而针式PKM,则更注重文档的归类、统计分析、辅助学习等, 避免浪费了很多时间收集的资料,实际上只是活在硬盘空间中的垃圾。 并且多数的其它软件以网页以主,但网页的知识载体量约为20%而于; 而针式PKM则以Word...

    oracle数据库笔记

    2. SQL分类 31 3. PL/SQL (Procedure Language) 31 二. SQL*Plus 31 1.启动 SQL*Plus 单行编辑 31 2.启动iSQL*Plus 多行编辑 31 3.退出 32  直接关闭 32  输入:Exit 或 quit 32 三. 本书所使用的示例模式 32 ...

    MySQLDBA运维笔记.pdf

    1.7 关于 mysql 管理员设置..................................................................................................22资源由 www.eimhe.com 美河学习在线收集分享 1.7.1 为管理员 root 用户设置密码...

    基于微信小程序的模拟考试+ssm框架.rar

    考试模式选择:学生可以选择不同类型的考试模式,包括章节练习、模拟考试等,根据个人需求进行自主学习和测试。 在线考试与答题:学生可以在微信小程序上进行在线考试,系统支持计时和答题过程监控,学生可以根据...

    奥瑞文oTraining在线培训系统

    支持用户看视频时做学习笔记 支持用户学习课程统计 支持在线问答 支持众多题型(单选、多选、填空、判断、简答、综合题、完形填空题、判断该错题、听力题、视频题、图片题等) 支持单选、多选题的选项中插入...

    wps2019数据分析加载项-数据分析的思维和方法.pdf

    2019-05-04 学习笔记 学习笔记 ⼤数据特点:数据量、发⽣频率、数据种类 费雪:农业领域的实验设计法 A/B测试(随机对照测验):排除不需要的因素的评价⽅法。为同⼀个优化⽬标制定两个⽅案(⽐如两个页⾯),让⼀...

    概率密度函数非参数估计matlab代码-AI:关于AI的所有知识的知识库(到目前为止,我还不知道)

    我所了解的有关人工智能/数据科学/机器学习/统计建模/模式识别/您想要称呼本笔记内容的一切。 所有这些之间的界线都非常模糊,但是它们都试图回答相同的问题:“我们如何从数据中学习?” 机器学习基本上只是花哨的...

    大数据预处理技术.pdf

    ⼤数据预处理技术 学习了⽜琨⽼师的课程后整理的学习笔记,⽤于⽇后复习 学习了⽜琨⽼师的课程后整理的学习笔记,⽤于⽇后复习 ⼀、⼤数据预处理的⼏个步骤 ⼀、⼤数据预处理的⼏个步骤 1.数据预处理 2.数据清洗 3....

Global site tag (gtag.js) - Google Analytics