第一次发blog的时候,因为个人网站正在建设中,所以先用手机发了CSDN。
行为识别/动作识别得到视频或图像中的目标行为类别。
分为以下两个子方向。
行为分类(Action Recognition)
对视频剪辑进行分类。
在常用的数据库中,首先对操作进行了拆分。 视频剪辑包含明确的动作,并且在短时间内(几秒钟)被标记为唯一。 所以input也可以看作视频,输出也可以看作标签。
行为检测(Temporal Action Localization)
不仅要知道一个动作是否会在视频中发生,而且要知道动作发生在视频的什么时间(包括开始时间和结束时间)
其特点是需要处理较长的未分割视频,视频中会产生很多噪声,目标的运动一般只占视频的一小部分。 也可以说是对视频指定行为的检测。
联系
操作注册和模板操作定位之间的关系类似于图像类标识和对象检测之间的关系。 基于image classification的问题,开发了很多强大的模型,如ResNet、VGGNet等,这些模型在对象检测方法中发挥了很大的作用。 类似地,动作注册的相关模型如two-stream、C3D、iDT等也广泛应用于动作检测。
参考博客-行为识别:
3359 blog.csdn.net/QQ _ 28301007/article/details/103096381
附册语义网络查看,留存学习:
3359 blog.csdn.net/hjc 256/article/details/88823327 /