look before youmagic leap 视频，肝脏去郑州那个医院检查

点击联系发帖人 时间：2016-08-10 06:19

leap motion

论文阅读（9）
Dinesh Jayaraman,
UT Austin,
and Kristen Grauman,
一、论文所解决的问题
这篇文章很有意思，主要是学习如何控制摄像头进行移动进而去进行有效的场景识别，这一点很类似于人的行为
RNN学习如何操纵传感器实现可靠识别（主动视觉active vision）
本文中定义了主动视觉中的三个步骤：控制、每个场景的识别、时间证据的融合（integrate evidence over time）
控制使用随机神经网络、每个场景的识别使用NN、时间证据的融合使用RNN
本文follow的是Mnih, V., Heess, N., Graves, A., Kavukcuoglu, K.: Recurrent models&of visual attention. In: NIPS. (2014)
二、何为主动视觉
我们传统的识别都是被动的，为何称之为被动，因为都是静态的图片，并且我们的算法也是找出图片中的不变的特征
而主动视觉可以自己调整摄像头的角度和方向，这样可以改变光照和角度等因素，可以实现环境的变化，因此并不是寻找图片中的不变特征。而是在当前的场景下以及对摄像头的动作之下（调整摄像头的角度和方向下）预测知识的改变的（
we jointly train our active vision system to have&the ability to predict
how its knowledge will evolve
conditioned&on its present state and its choice of motion.）
idea是如何产生的：我们人在看东西的时候，如果看不清的话，都是自己转动自己的头，或者调整自己的角度再去看的。这一点，传统的视觉并没有考虑进去
三、与视觉显著性、视觉注意力的区别(visual saliency and attention)以及预测相关特征之间的差别（相当于本文与以前方法的区别）
（1）视觉显著性（visual saliency）的目的是想去除图像中的干扰的部分，核心目标是替代滑动窗口
（2）视觉注意力（visual attention）是有一个整个环境的snapshot 。与本文的区别就是视觉注意力是离散的，也就是说传感器移动的幅度很大，而本文中传感器移动的幅度并不是很大，相对来看是连续的。
Attention systems thus sometimes take a “foveated”approach [29], [24]. In contrast, in our setting, the system&never holds a snapshot of the entire environment at once.&Rather, its input at each time step is one portion of its complete&physical 3D environment,
and it must choose motions leading&to more informative—possibly non-overlapping—viewpoints.&Another difference between the two settings is that the focus&of attention may move in arbitrary jumps (saccades) without&continuity, whereas active vision agents may
only move continuously.
（3）预测相关特征是指：通过当前帧预测下一帧的特征（或者图像、或者光流）
比如下面这个架构，直接利用CNN进行预测未来的某一帧
选自：Anticipating the future by watching unlabeled video
或者下面将CNN和RNN融合形成回复式的CNN（rCNN），然后利用空间信息和时间信息预测下一帧的内容，输入的图像patch是经过量化的，具体怎么做我没看懂。
选自：VIDEO (LANGUAGE) MODELING: A BASELINE&FOR GENERATIVE MODELS OF NATURAL VIDEOS
四、论文的解决方案
（0）整体架构一览
整个系统分为ACTOR，SENSOR，AGGREGATOR这三个部分，最后接一个CLASSIFIER, 其中ACTOR是随机神经网络、SENSOR是前馈神经网络、AGGREGATOR是RNN，CLASSIFIER是Softmax
每一个时刻t：
（1）ACTOR发出一个相机移动的参数mt，参数pt表示t时刻的位置pt-1是t-1时刻的位置
（2）根据此时的位置pt,获取一个图像Xt，并将mt和Xt都给SENSOR
SENSOR(xt,
s1, . . . ,
（3）此时将上面的 s1, . . . ,
st&都输入到AGGREGATOR
得到 AGGREGATOR(s1,
. . . , st)，AGGREGATE能够得到一个聚合的特征向量at
将at作为下一个时刻的输入ACTOR(at)
上面的英文描述为：
Our basic active recognition system is modeled on the&recurrent architecture first proposed in [24] for visual attention.
Our system is composed of four basic modules: ACTOR,
SENSOR, AGGREGATOR and
CLASSIFIER, with weights&Wa&,
respectively. At each step
ACTOR issues&a motor command
mt, which updates the camera pose vector to
+ mt. Next, a 2-D image
captured&from this pose is fed into
SENSOR together with the motor command
SENSOR produces a view-specific feature vector
SENSOR(xt,
mt), which is then fed
into&AGGREGATOR
to produce aggregate feature vector
=&AGGREGATOR(s1,
. . . , st).
The cycle is completed when, at&the
next step t
processes the aggregate feature&from the previous time step to issue
ACTOR(at).&Finally,
steps, the category label beliefs are predicted as&y
CLASSIFIER(at),
如何训练：
ACTOR是随机神经网络用强化学习进行训练
SENSOR是前馈神经网络、AGGREGATOR是RNN，CLASSIFIER是Softmax & & & & & & & & & & & 用BP
此外作者还引入了LOOKAHEAD单元
At time step
LOOKAHEAD takes as input
and predicts
=LOOKAHEAD(at-1,
也就是说在时间t，LOOKAHEAD将前一个时刻的输入和前一个时刻的摄像头移动的参数作为输入，然后输出下一个时刻的输出。
这个函数在每个时刻都有一个损失，然后可以对该损失求偏导就可以进行训练。
引入这个单元的意图是：如果移动摄像头很好，那么就应该能够准确地预测出下一次的输出。
五、论文中的方案解决该问题，解决到了什么程度？
这篇论文我感觉最新颖的地方就是如何调整摄像头视角，然后有利于识别场景类别，解决的程度并不好还有很大空间，从实验结果来看其实效果并不是很好
只是这篇文章脑洞开的比较大。
六、其他未能考虑的问题
想不出来，主要是强化学习没看过，所以这篇文章看起来还是比较吃力的。
（1）数据集
SUN360 and GERMS
SUN360是球形的拼接起来图片
GERM是单轴机器人手旋转136个玩具的视频。。。
对比的标准是准确度：
只找到了个人主页
参考知识库
* 以上用户言论只代表其个人观点，不代表CSDN网站的观点或立场
访问：215008次
积分：2861
积分：2861
排名：第13784名
原创：75篇
转载：13篇
评论：172条
(1)(4)(4)(6)(18)(1)(1)(1)(1)(1)(2)(1)(1)(2)(1)(1)(1)(1)(6)(6)(3)(11)(5)(1)(2)(1)(2)(1)(6)2015年郑州外国语学校入学试卷(英语)_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
2015年郑州外国语学校入学试卷(英语)
上传于||暂无简介
阅读已结束，如果下载本文需要使用2下载券
想免费下载本文？
定制HR最喜欢的简历
下载文档到电脑，查找使用更方便
还剩3页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢you look as active as before_百度知道
you look as active as before
you look as active as before
you look as active as before你看起来像以前一样活跃
来自团队：
其他类似问题
为您推荐：
其他5条回答
you look as active as before你看起来像以前一样活跃-------------Shanghai Onesmart Education is glad to serve for you.
你看起来和以前一样活力四射呀
你像曾经一样充满活力
你好！you look as active as before你看起来和以前一样活跃
you look as active as before你看起来像以前一样活跃
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁郑州枫杨外国语中学小升初英语真题_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
郑州枫杨外国语中学小升初英语真题
上传于||暂无简介
阅读已结束，如果下载本文需要使用0下载券
想免费下载更多文档？
定制HR最喜欢的简历
下载文档到电脑，查找使用更方便
还剩10页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢}

我就爱健康网

look before youmagic leap 视频，肝脏去郑州那个医院检查

我要回帖

更多关于 leap motion 的文章

更多推荐