首页 > 编程知识 正文

人工神经网络和卷积神经网络,神经网络是什么

时间:2023-05-06 11:34:22 阅读:149685 作者:2273

rx dxy网络

原文: 《Learning a Similarity Metric Discriminatively, with Application to Face Verification》

1、4个问题解决什么问题? 解决问题类别多(或者不确定),但训练样本的类别数少的分类任务(例如脸部识别、脸部认证) )在通常的分类任务中,类别数是一定的,每班的样本数也多)例如哪个ImageNet ) 提出了将输入映射到一个特征向量,使用这两个向量之间的“距离”(L1 Norm )来表示输入之间的差异(图像的意义上的差异)的想法。 基于上述思路设计了rx dxy网络。 必须一次输入两个样本作为一个样本对来计算损失函数。 常用的softmax只需输入一个样本。 必须为FaceNet的三重丢失输入三个示例。 为了训练提出了Contrastive Loss。 效果怎么样? 进行了测定两个人脸相似度的实验,使用多个数据库进行了复杂化。 ssdwx network至今仍在许多地方使用,可以达到state-of-the-art的效果。 有什么问题吗? contrastive loss训练样本的选择需要注意,论文均保证了50%的正样本对和50%的负样本对。 2、论文概要2.1、问题的提出和解决方案的分类问题:第一类,分类数量少,各类数据量大。 例如ImageNet、VOC等。 这样的分类问题,只要事先知道所有的类,就可以用神经网络和SVM来解决。 二是分类数量大(或无法确认具体数量),每类数据量少,如人脸识别、人脸验证任务等。 本文提出的解决方案: learn a similar metric from data。 中心思想是寻找能够将输入图像转换成特征空间的映射函数,将特征向量与每个图像对应,用几个简单的“距离测量”(例如欧式距离)来表示向量之间的差异,最后在该距离处拟合输入图像的相似度的差异(语义的差异) 2.2、网络结构概述

数学符号描述输入数据。 X 1 X_1 X1、X 2 X_2 X2、x2'x_2^{#x27; (x2 )。 其中X 1 X_1 X1和X 2 X_2 X2为同一类型,X 1 X_1 X1和x2x _2^ { # x27; }

X2′​属于不同类。模型: G W G_W GW​。其中 W W W表示模型参数, G W G_W GW​的作用就是将输入数据 X X X转换为一组特征向量。距离(文中称其为energy function): E W E_W EW​。用于衡量两个输入向量转换为向量之后,两个向量之间的距离。 如果采用L1距离,则公式为: E W ( X 1 , X 2 ) = ∥ G W ( X 1 ) − G W ( X 2 ) ∥ E_W(X_1, X_2)=| G_W(X_1) - G_W(X_2) | EW​(X1​,X2​)=∥GW​(X1​)−GW​(X2​)∥。 2.3、Contrastive Loss损失函数

Y Y Y表示 X 1 X_1 X1​、 X 2 X_2 X2​是否属于同一类。为同类,则为0;不同类,则为1。 P P P表示输入的总样本数, i i i表示当前样本的下标。 L G L_G LG​表示两个样本为同类时的损失函数, L I L_I LI​表示两个样本未不同类时的损失函数。使用Contrastive Loss的任务主要是设计合适的 L G L_G LG​和 L I L_I LI​损失函数,当为同类时,使得 L G L_G LG​尽可能小;当不同类时,使得 L I L_I LI​尽可能大。文中给出的函数如下图,现在也不常用了,推导步骤略。

查找资料看到,caffe中的contrastive loss定义如下:(参考:https://blog.csdn.net/autocyz/article/details/53149760)

L = 1 2 N ∑ n = 1 N y d 2 + ( 1 − y ) m a x ( jzdqb − d , 0 ) 2 L=frac{1}{2N}sum_{n=1}^Nyd^2+(1-y)max(margin-d,0)^2 L=2N1​n=1∑N​yd2+(1−y)max(margin−d,0)2

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。