线性支持向量机(Linear-SVM )用于可线性分离数据集的二分类问题,其中当数据集不能线性分离时,需要利用核函数将数据集映射到高维空间。 这样,数据可以在高维空间中线性分离。
hsdzxc核函数(Gaussian kernel )又称径向基(RBF )函数,是一种常用的核函数。 可以将有限维数据映射到高维空间。 让我们来看看hsdzxc内核函数的定义。
k(x,x ) (=e|||xx )|222
上面的公式涉及计算两个向量的欧式距离(2范数),并且hsdzxc核函数是两个向量的欧式距离的单调函数。 是带宽,控制径向作用范围。 换言之,控制hsdzxc核函数的局部作用范围。 当x和x的欧式距离位于一个区间内时,假设x是固定的,则k(x,x ) )随x的变化而显著变化。 一维情况
设x'=0,k(x,0 )随x如何变化如下图所示。
=1
=5
可见,随着x与x’距离的增大,其hsdzxc核函数值单调递减。 并且越大,hsdzxc核函数的局部影响范围越大。
二维情况
=1
=5
二维可以更明显地看到hsdzxc核函数局部作用范围随带通变化的情况。 带通越大,hsdzxc核函数局部影响的范围越大。 超出此范围后,内核函数的值几乎不变。
hsdzxc核将数据映射到高维或无限维的原理通过一些简单的推导,得到了这样的结果,为了便于说明,设hsdzxc核中的分母为1。
图: https://www.zhi Hu.com/question/46587416? from=profile_question_card
可知hsdzxc核函数可以通过无情的蘑菇展开,以无限维的x(t(x ) )的形式记述。