- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三十一章 支持向量机
支持向量机是数据挖掘中的一项新技术,是借助于最优化方法来解决机器学习问题的新工具,最初由 V.Vapnik 等人提出,近几年来在其理论研究和算法实现等方面都取得了很大的进展,开始成为克服“维数灾难”和过学习等困难的强有力的手段,它的理论基础和实现途径的基本框架都已形成。
§1 支持向量分类机的基本原理根据给定的训练集
T = {(x1,y1 ), (x2 ,y2 ),L, (xl ,yl )}∈ ( X ×Y )l ,
其中 xi ∈ X = Rn , X 称为输入空间,输入空间中的每一个点 xi 由 n 个属性特征组成, yi ∈Y = {?1,1},i = 1,L,l 。寻找 Rn 上的一个实值函数 g(x) ,以便用分类函数
f (x) = sgn(g(x)),
推断任意一个模式 x 相对应的 y 值的问题为分类问题。
线性可分支持向量分类机
考虑训练集 T ,若 ?ω ∈ Rn , b ∈ R 和正数 ε ,使得对所有使 yi = 1 的下标 i 有
(ω ? xi ) + b ≥ ε(这里 (ω ? xi ) 表示向量 ω 和 xi 的内积),而对所有使 yi = ?1的下标 i 有 (ω ? xi ) + b ≤ ?ε ,则称训练集 T 线性可分,称相应的分类问题是线性可分的。
记两类样本集分别为 M + = {xi | yi = 1, xi ∈T}, M ? = {xi | yi = ?1, xi ∈T}。定义
M + 的凸包 conv(M + ) 为
N+ N+ conv(M + ) = x = ∑ λ j x j | ∑λ j = 1, j=1 j=1 M ? 的凸包 conv(M ? ) 为 N? N? conv(M ? ) = x = ∑ λ j x j | ∑λ j = 1, j=1 j=1
λ j ≥ 0, j = 1,L, N + ; x j ∈ M + , λ j ≥ 0, j = 1,L, N ? ; x j ∈ M ? . 其中 N+ 表示 +1 类样本集中样本点的个数, N? 表示 ?1类样本集中样本点的个数,定理 1 给出了训练集 T 线性可分与两类样本集凸包之间的关系。
定理 1 训练集 T 线性可分的充要条件是, T 的两类样本集 M + 和 M ? 的凸包相离。如下图所示
图 1 训练集 T 线性可分时两类样本点集的凸包
证明:①必要性
-762-
和 ε 0 ,使得
若 T 是线性可分的,M + = {xi | yi = 1, xi ∈T},M ? = {xi | yi = ?1, xi ∈T},由线
性可分的定义可知,存在超平面 H = {x ∈ Rn : (ω ? x) + b = 0}
(ω ? xi ) + b ≥ ε , ?xi ∈ M + 且 (ω ? xi ) + b ≤ ?ε , ?xi ∈ M ? .
而正类点集的凸包中的任意一点 x 和负类点集的凸包中的任意一点 x 可分别表示为
N+ N? x = ∑αi xi 和 x = ∑β j x j i=1 j=1 N + N ? 其中αi ≥ 0, β j ≥ 0 且 ∑αi = 1, ∑β j = 1。 i =1 j =1
于是可以得到
(ω ?
(ω ?
N+ N+ + b = ∑αi ((ω ? xi x) + b = ω ? ∑αi xi i=1 i=1 N? N? + b = ∑β j ((ω ? x) + b = ω ? ∑β j x j j=1 j=1
) +
x j
N+
b) ≥ ε ∑αi = ε 0
i=1
N?
) + b) ≤ ?ε ∑β j = ?ε 0
j=1
由此可见,正负两类点集的凸包位于超平面 (ω ? x) + b = 0 的两侧,故两个凸包相离。②充分性设两类点集 M + ,M ? 的凸包相离。因为两个凸包都是闭凸集,且有界,根据凸集
强分离定理,可知存在一个超平面 H = {x ∈ Rn : (ω ? x) + b = 0} 强分离这两个凸包,即存在正数 ε 0 ,使得对 M + , M ? 的凸包中的任意点 x 和 x 分别有
(ω ? x) + b ≥ ε
(ω ? x) + b ≤ ?ε
显然特别的,对于任意的 xi ∈ M + ,有 (ω ? xi ) + b ≥ ε ,对于任意的 xi ∈ M ? ,有 (ω ? xi ) + b ≤ ?ε ,由训练集线性可分的定义可知 T 是线性可分的。
由于空间 Rn 中超平面都可以写为 (ω ? x) + b =
文档评论(0)