look before youmagic leap 视频,肝脏去郑州那个医院检查

论文阅读(9)
Dinesh Jayaraman,
UT Austin,
and Kristen Grauman,
一、论文所解决的问题
这篇文章很有意思,主要是学习如何控制摄像头进行移动进而去进行有效的场景识别,这一点很类似于人的行为
RNN学习如何操纵传感器实现可靠识别(主动视觉active vision)
本文中定义了主动视觉中的三个步骤:控制、每个场景的识别、时间证据的融合(integrate evidence over time)
控制使用随机神经网络、每个场景的识别使用NN、时间证据的融合使用RNN
本文follow的是Mnih, V., Heess, N., Graves, A., Kavukcuoglu, K.: Recurrent models&of visual attention. In: NIPS. (2014)
二、何为主动视觉
我们传统的识别都是被动的,为何称之为被动,因为都是静态的图片,并且我们的算法也是找出图片中的不变的特征
而主动视觉可以自己调整摄像头的角度和方向,这样可以改变光照和角度等因素,可以实现环境的变化,因此并不是寻找图片中的不变特征。而是在当前的场景下以及对摄像头的动作之下(调整摄像头的角度和方向下)预测知识的改变的(
we jointly train our active vision system to have&the ability to predict
how its knowledge will evolve
conditioned&on its present state and its choice of motion.)
idea是如何产生的:我们人在看东西的时候,如果看不清的话,都是自己转动自己的头,或者调整自己的角度再去看的。这一点,传统的视觉并没有考虑进去
三、与视觉显著性、视觉注意力的区别(visual saliency and attention)以及预测相关特征之间的差别(相当于本文与以前方法的区别)
(1)视觉显著性(visual saliency)的目的是想去除图像中的干扰的部分,核心目标是替代滑动窗口
(2)视觉注意力(visual attention)是有一个整个环境的snapshot 。与本文的区别就是视觉注意力是离散的,也就是说传感器移动的幅度很大,而本文中传感器移动的幅度并不是很大,相对来看是连续的。
Attention systems thus sometimes take a “foveated”approach [29], [24]. In contrast, in our setting, the system&never holds a snapshot of the entire environment at once.&Rather, its input at each time step is one portion of its complete&physical 3D environment,
and it must choose motions leading&to more informative—possibly non-overlapping—viewpoints.&Another difference between the two settings is that the focus&of attention may move in arbitrary jumps (saccades) without&continuity, whereas active vision agents may
only move continuously.
(3)预测相关特征是指:通过当前帧预测下一帧的特征(或者图像、或者光流)
比如下面这个架构,直接利用CNN进行预测未来的某一帧
选自:Anticipating the future by watching unlabeled video
或者下面将CNN和RNN融合形成回复式的CNN(rCNN),然后利用空间信息和时间信息预测下一帧的内容,输入的图像patch是经过量化的,具体怎么做我没看懂。
选自:VIDEO (LANGUAGE) MODELING: A BASELINE&FOR GENERATIVE MODELS OF NATURAL VIDEOS
四、论文的解决方案
(0)整体架构一览
整个系统分为ACTOR,SENSOR,AGGREGATOR这三个部分,最后接一个CLASSIFIER, 其中ACTOR是随机神经网络、SENSOR是前馈神经网络、AGGREGATOR是RNN,CLASSIFIER是Softmax
每一个时刻t:
(1)ACTOR发出一个相机移动的参数mt,参数pt表示t时刻的位置pt-1是t-1时刻的位置
(2)根据此时的位置pt,获取一个图像Xt,并将mt和Xt都给SENSOR
SENSOR(xt,
s1, . . . ,
(3)此时将上面的 s1, . . . ,
st&都输入到AGGREGATOR
得到 AGGREGATOR(s1,
. . . , st),AGGREGATE能够得到一个聚合的特征向量at
将at作为下一个时刻的输入ACTOR(at)
上面的英文描述为:
Our basic active recognition system is modeled on the&recurrent architecture first proposed in [24] for visual attention.
Our system is composed of four basic modules: ACTOR,
SENSOR, AGGREGATOR and
CLASSIFIER, with weights&Wa&,
respectively. At each step
ACTOR issues&a motor command
mt, which updates the camera pose vector to
+ mt. Next, a 2-D image
captured&from this pose is fed into
SENSOR together with the motor command
SENSOR produces a view-specific feature vector
SENSOR(xt,
mt), which is then fed
into&AGGREGATOR
to produce aggregate feature vector
=&AGGREGATOR(s1,
. . . , st).
The cycle is completed when, at&the
next step t
processes the aggregate feature&from the previous time step to issue
ACTOR(at).&Finally,
steps, the category label beliefs are predicted as&y
CLASSIFIER(at),
如何训练:
ACTOR是随机神经网络用强化学习进行训练
SENSOR是前馈神经网络、AGGREGATOR是RNN,CLASSIFIER是Softmax & & & & & & & & & & & 用BP
此外作者还引入了LOOKAHEAD单元
At time step
LOOKAHEAD takes as input
and predicts
=LOOKAHEAD(at-1,
也就是说在时间t,LOOKAHEAD将前一个时刻的输入和前一个时刻的摄像头移动的参数作为输入,然后输出下一个时刻的输出。
这个函数在每个时刻都有一个损失,然后可以对该损失求偏导就可以进行训练。
引入这个单元的意图是:如果移动摄像头很好,那么就应该能够准确地预测出下一次的输出。
五、论文中的方案解决该问题,解决到了什么程度?
这篇论文我感觉最新颖的地方就是如何调整摄像头视角,然后有利于识别场景类别,解决的程度并不好还有很大空间,从实验结果来看其实效果并不是很好
只是这篇文章脑洞开的比较大。
六、其他未能考虑的问题
想不出来,主要是强化学习没看过,所以这篇文章看起来还是比较吃力的。
(1)数据集
SUN360 and GERMS
SUN360是球形的拼接起来图片
GERM是单轴机器人手旋转136个玩具的视频。。。
对比的标准是准确度:
只找到了个人主页
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:215008次
积分:2861
积分:2861
排名:第13784名
原创:75篇
转载:13篇
评论:172条
(1)(4)(4)(6)(18)(1)(1)(1)(1)(1)(2)(1)(1)(2)(1)(1)(1)(1)(6)(6)(3)(11)(5)(1)(2)(1)(2)(1)(6)2015年郑州外国语学校入学试卷(英语)_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
2015年郑州外国语学校入学试卷(英语)
上传于||暂无简介
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩3页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢you look as active as before_百度知道
you look as active as before
you look as active as before
you look as active as before你看起来像以前一样活跃
来自团队:
其他类似问题
为您推荐:
其他5条回答
you look as active as before你看起来像以前一样活跃-------------Shanghai Onesmart Education is glad to serve for you.
你看起来和以前一样活力四射呀
你像曾经一样充满活力
你好!you look as active as before你看起来和以前一样活跃
you look as active as before你看起来像以前一样活跃
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁郑州枫杨外国语中学小升初英语真题_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
郑州枫杨外国语中学小升初英语真题
上传于||暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩10页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢}

我要回帖

更多关于 leap motion 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信