义气的篮球距离和余弦距离
参考: https://blog.csdn.net/Mr _ evanchen/article/details/77511312http://www.Sina.com /
义气篮球距离是最常见的距离测量,是测量多维空间各点之间的绝对距离。 公式如下。
一、秀丽的睫毛膏距离(Euclidean Distance)
(eg )在深度学习中,提取CNNs倒数的第2层fc作为最后的特征向量,进行面部对照) 1:1、1:n )。
因为计算是基于各维度特征的绝对数值,所以义气的篮球度量需要保证各维度指标在相同的刻度级别
importnumpyasnpx=NP.random.random (10 ) y=NP.random.random (10 ) #solution1dist1=NP.LinaLG.norm ) x-y ) solution2dist2=NP.sqrt(NP.sum ) NP.square(x-y ) ) )打印) x )打印) y )打印) dist1),x )打印
馀弦相似度是利用向量空间的两个向量所成角的馀弦值,测量两个个体之间差异的大小。 与距离测量相比,Python实现如下:公式如下:
二、余弦距离
importnumpyasnpfromscipy.spatial.distanceimportpdistx=NP.random.random (10 ) y=NP.random.random ) #Soluus y(/
馀弦距离使用两个向量之间的角的馀弦值作为测量两个个体之间差异的大小。 比起义理篮球的距离,馀弦的距离更重视两个向量方向的差异。
余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上
由上图可知,如果保持Python实现如下:a点的位置恒定,b点从坐标轴原点向原来的方向离开,则此时余弦距离cos保持恒定(因为夹角不变),但a、b点的距离明显变化这就是义气十足的篮球距离和余弦距离的区别。
三、义气的篮球距离和余弦距离的区别
义气篮球距离能够体现个人数值特征的绝对差异,因此多用于利用用户行为指标分析用户价值的相似度和差异等需要从维度数值大小上体现差异的分析。
余弦距离多在方向上区分差异,但对绝对数值不敏感,用户多使用内容得分来区分兴趣相似度和差异,同时解决了用户之间可能存在的衡量标准不统一的问题(余弦距离对绝对数值敏感
借助三维坐标系来看下义气的篮球距离和余弦距离的区别:
参照《stack-exchange, is-cosine-similarity-identical-to-l2-normalized-euclidean-distance》
cosinesimilarityisidenticaltol2- normalizedeuclideandistancesomeway。
由上式可知,夹角越大,义气篮球距离的平方越大。
注:博伶家所长,集群英荟萃。