网站大量收购独家精品文档,联系QQ:2885784924

31第三十一节 支持向量机.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三十一章 支持向量机 支持向量机是数据挖掘中的一项新技术,是借助于最优化方法来解决机器学习问题的新工具,最初由 V.Vapnik 等人提出,近几年来在其理论研究和算法实现等方面都取得了很大的进展,开始成为克服“维数灾难”和过学习等困难的强有力的手段,它的理论基础和实现途径的基本框架都已形成。 §1 支持向量分类机的基本原理根据给定的训练集 T = {(x1,y1 ), (x2 ,y2 ),L, (xl ,yl )}∈ ( X ×Y )l , 其中 xi ∈ X = Rn , X 称为输入空间,输入空间中的每一个点 xi 由 n 个属性特征组成, yi ∈Y = {?1,1},i = 1,L,l 。寻找 Rn 上的一个实值函数 g(x) ,以便用分类函数 f (x) = sgn(g(x)), 推断任意一个模式 x 相对应的 y 值的问题为分类问题。 线性可分支持向量分类机 考虑训练集 T ,若 ?ω ∈ Rn , b ∈ R 和正数 ε ,使得对所有使 yi = 1 的下标 i 有 (ω ? xi ) + b ≥ ε(这里 (ω ? xi ) 表示向量 ω 和 xi 的内积),而对所有使 yi = ?1的下标 i 有 (ω ? xi ) + b ≤ ?ε ,则称训练集 T 线性可分,称相应的分类问题是线性可分的。 记两类样本集分别为 M + = {xi | yi = 1, xi ∈T}, M ? = {xi | yi = ?1, xi ∈T}。定义 M + 的凸包 conv(M + ) 为 N+ N+ conv(M + ) = x = ∑ λ j x j | ∑λ j = 1, j=1 j=1 M ? 的凸包 conv(M ? ) 为 N? N? conv(M ? ) = x = ∑ λ j x j | ∑λ j = 1, j=1 j=1  λ j ≥ 0, j = 1,L, N + ; x j ∈ M + , λ j ≥ 0, j = 1,L, N ? ; x j ∈ M ? . 其中 N+ 表示 +1 类样本集中样本点的个数, N? 表示 ?1类样本集中样本点的个数,定理 1 给出了训练集 T 线性可分与两类样本集凸包之间的关系。 定理 1 训练集 T 线性可分的充要条件是, T 的两类样本集 M + 和 M ? 的凸包相离。如下图所示 图 1 训练集 T 线性可分时两类样本点集的凸包 证明:①必要性 -762- 和 ε 0 ,使得 若 T 是线性可分的,M + = {xi | yi = 1, xi ∈T},M ? = {xi | yi = ?1, xi ∈T},由线 性可分的定义可知,存在超平面 H = {x ∈ Rn : (ω ? x) + b = 0} (ω ? xi ) + b ≥ ε , ?xi ∈ M + 且 (ω ? xi ) + b ≤ ?ε , ?xi ∈ M ? . 而正类点集的凸包中的任意一点 x 和负类点集的凸包中的任意一点 x 可分别表示为 N+ N? x = ∑αi xi 和 x = ∑β j x j i=1 j=1 N + N ? 其中αi ≥ 0, β j ≥ 0 且 ∑αi = 1, ∑β j = 1。 i =1 j =1 于是可以得到 (ω ? (ω ?  N+ N+ + b = ∑αi ((ω ? xi x) + b = ω ? ∑αi xi i=1 i=1 N? N? + b = ∑β j ((ω ? x) + b = ω ? ∑β j x j j=1 j=1  ) + x j  N+ b) ≥ ε ∑αi = ε 0 i=1 N? ) + b) ≤ ?ε ∑β j = ?ε 0 j=1 由此可见,正负两类点集的凸包位于超平面 (ω ? x) + b = 0 的两侧,故两个凸包相离。②充分性设两类点集 M + ,M ? 的凸包相离。因为两个凸包都是闭凸集,且有界,根据凸集 强分离定理,可知存在一个超平面 H = {x ∈ Rn : (ω ? x) + b = 0} 强分离这两个凸包,即存在正数 ε 0 ,使得对 M + , M ? 的凸包中的任意点 x 和 x 分别有 (ω ? x) + b ≥ ε (ω ? x) + b ≤ ?ε 显然特别的,对于任意的 xi ∈ M + ,有 (ω ? xi ) + b ≥ ε ,对于任意的 xi ∈ M ? ,有 (ω ? xi ) + b ≤ ?ε ,由训练集线性可分的定义可知 T 是线性可分的。 由于空间 Rn 中超平面都可以写为 (ω ? x) + b =

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档