1.均值漂移推导
给定D维空间Rd的n个样本点,I=1,n,在空间中选择一个点X,那么Mean Shift向量的基本形式定义为:
Sk是半径为h的wjdmf区域,一组满足以下关系的Y点,
K表示在xi的N个样本点中,K个点属于Sk区域。
以上是官方的说法,也就是书中的定义。我的理解是,在D维空间中,选择任意一点,然后做一个以这个点为中心,H为半径的wjdmf。因为有D维,D可能大于2,所以是wjdmf。落在这个球里的所有点和圆心都会产生一个矢量,这个矢量就是从圆心落在球里的点的端点。然后把这些向量加起来。加法的结果是均值漂移向量。
如图所示。黄色箭头是Mh(均值漂移向量)。
然后以meanshift向量的末端为圆心,再做一个傻傻的自行车球。如下图所示,重复上述步骤以获得均值漂移向量。这样均值漂移算法就能收敛到概率密度最高的地方。也就是最密集的地方。
最终结果如下:
解释k()核函数,其中h是半径,Ck,d/nhd是单位密度。要最大化上面的公式F,最容易想到的就是上面公式的推导。的确,meanshift是上述公式的推导。
(2)
订单:
K(x)称为g(x)的影核。名字听起来很深奥,就是导数的负方向,所以上面的公式可以表达出来。
对于上面的公式,如果只使用高斯核,那么第一项等于FH,k。
第二项相当于均值漂移向量的公式:
那么(2)可以表示为
下图分析的成分,如图所示,可以清晰的表达其成分。