首页 > 编程知识 正文

支持向量机的特点,svm支持向量机有啥用

时间:2023-05-06 15:47:24 阅读:39130 作者:2808

1 .支持向量机概述支持向量机(Support Vector Machines,SVM ) :一种监视学习算法。

支持向量是最接近分离超平面的点。 机器(Machine )代表算法而不是机器支持向量机(也称为SVM、支持向量网络),而不是机器学习中最引人注目的算法之一。 基于统计学习理论,

这是我们除集成算法外接触到的第一个强大的学习器。 有多强?

从算法的功能来看,SVM几乎涵盖了我们前六周描述的所有算法的功能:

从分类的效力来说,无论是线性分类还是非线性分类,SVM都是明星般的存在

从实际应用来看,SVM在各种实际问题上都非常优秀。 广泛应用于手写识别数字和人脸识别,在文本和超文本的分类中起着重要的作用。 这是因为SVM可以大大减少标准归纳和变换设置下的标签训练实例的需求。 同时,SVM执行图像分类,也用于图像分割系统。 实验结果表明,经过3-4次相关反馈后,SVM可以实现比传统查询细分方案(query refinement schemes )大幅度更高的搜索精度。 此外,生物学和许多其他科学都是SVM的青睐者,SVM目前广泛用于蛋白质分类,目前化合物分类的行业平均水平可达到90%以上的准确率。 生物科学前沿研究还利用支持向量机识别模型预测中使用的各种特征,找出各种基因表达结果的影响因素。 2 .在支持向量机分类器如何工作之前,让我们先看看以下一系列数据的分布: 这是由青色和红色各自的点表示的两组标签的数据。支持向量机的分类方法,是在这组分布中找出一个超平面作为决策边界,使模型在数据上的分类误差尽量接近于小,尤其是在未知数据集上的分类误差(泛化误差)尽量小

超平面几何中,超平面是空间的子空间,比维度所在的空间小一个维度。 如果数据空间本身是三维的,

该超平面是二维平面,如果数据空间本身是二维的,则该超平面是一维的直线。

划分边界左侧的点被认为是一种,右侧被认为是一种。 如果左边和右边都只有一种元素,则没有分类错误,我们的训练误差为0,但对于一个数据集来说,可能存在多个这样的误差为0的边界。 下图为http://www.Sina.com/http://www.Sina.com/http://www.Sina.com/http://www.Sina.com /

下图是在这里发现了超平面s0。 分别左右平移s0,遇到左或右第一个向量时停止,s1到s2的距离为裕量,第一个向左或向右接触的向量称为支撑向量

那么,如果分割其他边界,则在此可以比较,可知图2的边界的大小比较小,而分割图2的边界的泛化能力比较低,他受到某一点的影响而偏向左点

3 .支持向量机的三层理解目标是“找到极限最大的决策边界”,这听起来是众所周知的表达。 这是一个优化问题,优化问题往往与损失函数联系在一起。 与逻辑回归过程一样,SVM也通过最小化损耗函数来求解决策边界,这是后续模型中使用的重要信息。

4. sklearn的支持向量机

请注意,除了特别表示为线性的两个类LinearSVC和LinearSVR之外,所有类都支持线性和非线性。 NuSVC和NuSVC可以手动调整支持向量的数量,其他参数与最常见的SVC和SVR匹配。 请注意,OneClassSVM是一个没有监视的类。

除了自己拥有的类之外,sklearn还提供了几个直接调用libsvm库的函数。 Libsvm是台湾大学教授林智仁(Lin Chih-Jen )等人开发设计的一个简单易用、快速高效的英语SVM库,为SVM提供了许多基础计算和参数选择,在sklearn许多类的背后目前,LIBSVM有几十个语言版本,包括c、Java、Matlab、Python和r,每个语言版本都可以在LIBSVM官方网站上下载

33559 www.csie.NTU.edu.tw/~ CJ Lin/libs VM /

如下图 这里我们有多条划分边界,虽然所有的边界都能将数据很好的划分开,但是并不是每一条线都是最优的,有的划分边界偏向左方或者右方的数据,这样当我们使用这个模型对新的数据进行划分时,如果使用了偏向左方数据或者偏向右方数据的划分边界就会出现图二这种情况

class sklearn.svm.SVC (

C=1.0,

kernel=’RBF’,

degree=3,

gamma=’auto _ deprecated’,

coef0=0.0、

shrinking=True,

probability=False,

tol=0.001,

cache_size=200,

class_weight=None,

verbose=False,

max_iter=-1,

decision _ function _ shape=’ovr’,

random_state=None )

5. SVM损耗函数的推导

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。