当前位置:大学毕业论文> 论文范文>材料浏览

关于神经网络论文范文写作 递归神经网络多目标跟踪技术相关论文写作资料

主题:神经网络论文写作 时间:2024-01-15

递归神经网络多目标跟踪技术,这篇神经网络论文范文为免费优秀学术论文范文,可用于相关写作参考。

神经网络论文参考文献:

神经网络论文参考文献 计算机网络技术论文网络安全技术论文网络论文电脑知识和技术杂志

摘 要:多目标跟踪是计算机视觉领域的热点问题之一.多目标跟踪技术通过对特定目标特征的分析,获取目标在视频序列中的位置与区域变化,为后续数据分析、模式识别等应用提供便利.深度学习在视觉领域表现出了强大的能力,而基于典型的卷积神经网络(CNN)在视频跟踪领域因为卷积神经网络是基于空间深度的神经网络,对于处理具有时序信息的视频多目标跟踪困难重重,近年,因为递归神经网络(RNN)尤其是带有门结构的长段时间记忆网络(LSTM)在时序任务上显示出了突出的性能.不少研究者开始探索如何应用RNN来解决现有跟踪任务中存在的问题.该文介绍了RNN目标跟踪技术的研究背景,该领域的主要研究内容及最新研究进展,分析了近期提出几种较为著名的RNN目标跟踪算法,总结其优缺点并展望RNN目标跟踪技术未来的发展.

关键词:多目标跟踪;递归神经网络;计算机视觉;RNN目标跟踪算法

中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2017)26-0176-02

视频序列中,感兴趣目标运动轨迹及所占区域是非常重要的视觉信息,对于行为识别、三维重建、军事侦察、医疗辅助[1]等方面的计算机视觉应用而言,视频目标跟踪是必不可少的步骤.而在无约束环境中跟踪多个目标是非常具有挑战性的.即使经过几十年的研究,仍然远远没有达到准确的定位.其任务是定位视频序列中的所有感兴趣目标,并随时保持目标的定位.传统多目标跟踪算法主要有两个框架:一是先检测后将检测数据联合[2];二是基于模板学习训练与检测跟踪[3].

随着深度学习的兴起,近年来因为RNN尤其是带有门结构的LSTM等在时序任务上显示出了突出的性能.不少研究者开始探索如何应用RNN来解决现有跟踪任务中存在的问题.本文将着重介绍两种利用深度学习中典型的递归神经网络在多目标跟踪领域的探索性方法.它们分别是基于传统多目标跟踪算法的第一类框架和第二类框架.

第一类框架下的递归神经网络多目标跟踪,称为递归神经网络数据联合多目标跟踪,例如文献[4]的方法,对于一个面临离散和连续变量,输入和输出未知基数以及视频序列的长度可变.在这方面的一个有趣的工作是Ondrúska和Posner(2016)最近的工作,它将深层的神经网络引入状态估计任务.通过第一类框架下的递归神经网络多目标跟踪,实现了现实情况下的多个目标的在线端到端模型学习的跟踪.

第二类框架下的递归神经网络多目标跟踪,称为递归神经网络相关性检测多目标跟踪[5](RTT).为了发现可靠的组件,RTT采用多方向循环神经网络(RNNs)对四个不同角度的所有部分进行空间编码.多向RNN为强大的跟踪对象提供了以下优点:一是循环递归模型可以学习各部分之间的长距离上下文相关性,并进一步产生与零件相关的更准确的检测置信图;二是从多个方向编码可以显着减轻在各个方向发生的遮挡的负面影响;三是目标的生成表示在某种程度上是平移不变的,因为空间网络在局部部分上循环执行;四是与具有复杂结构的图形模型相比,多向RNN非常简单和容易实现.

1 递归神经网络(RNN)与长段时间记忆网络(LSTM)

1.1 递归神经网络(RNN)

RNN可以指代两种神经网络,递归神经网络以及循环神经网络,递归神经网络是为了解决日常现象中一些递归结构的存在而特别设计的网络,比如在图像处理中一个表示房子的图片中可以分为若干块小的零件图片,如窗户、门,但是这些代表窗户的图片也可能是飞机甚至是房子的一部分;比如在自然语言处理中出现的名词带的从句中又出现名词的情况.因此,递归神经网络是一种对网络结构的重复,重复的网络权值构成一个树状结构.而循环神经网络则更偏重于时序上的处理,因此是一个链式的连接.如图1所示.

如图1,在a的基础上加上b在时序上循环结构构成循环神经网络.

现在我们常说的递归神经结构网络RNN也就是上图中的循环神经结构,其主要应用是图片分割与注释,在自然语言处理中也有应用.但如果上文间隔过远,就有可能出现难以联想的情况.例如:“我在法国成长等此处省略100个字等我的法语说得很流利.”中要利用段落最前面的“法国”对段落最后的“法语”进行预测,因为提示信息“法国”距离“法语”间隔过远,RNN处理起来就比较困难.所以有人提出利用长段时间记忆网络(LSTM)来解决这个问题.

1.2 长段时间记忆网络(LSTM)

LSTM的改进结构如图2中c中与RNN的不同主要是存在控制存储状态的结构,其结构构成与作用为:先将这个重复结构叫做一个单元,把该单元的一次计算作为一拍,那么这个单元存在三组重要的变量:单元输入、单元输出以及单元状态,从直观来说,LSTM的作用是:

1) 根据上一拍单元的输出ht-1以及本拍的输入xt,计算出需要单元状态中需要遗忘的元素,这种控制是通过门(Gate, σ)实现的;

2) 根据上一拍输出ht-1与本拍输入xt选择需要在单元状态中新记忆的状态;

3) 根据单元状态和本拍输入,输出ht.

通过这样的操作,该单元就将需要记忆的信息通过单元状态的形式记录下来并且在神经元中进行传递,而每一次计算,神经元都可以根据当前的输入对单元状态进行修改.

2 递归神经网络数据联合多目标跟踪

深度学习在多目标跟踪方面主要的方法如下:一是受贝叶斯滤波思想的启发,给出一种RNN网络,能够执行多目标的跟踪任务,这些任务包括预测,数据关联,状态更新以及用图3结构来判断目标的出现和消失.用RNN进行数据联合多目标跟踪方法的优点:非模型,无需学习一些先验知识(目标动力学、杂波分布).因此,它可以捕获线性(卡尔曼滤波器),非线性(比较粒子滤波器)和高阶依赖性;二是可以从数据中完全学到这样的一个模型:该模型是为包含目标的出现和消失的数据关联的组合问题而诞生的.利用RNN可以用来预测具有固定大小的输入和输出向量的序列,也可以推测具有不确定基数的无序集合;三是提出一种从生成模型中采樣以产生任意数量的方法;四是在模拟和实际数据上采用定性和定量的方式,都可以得到很好的结果.如图3,递归神经网络数据联合多目标跟踪方法框架把问题分成两个模块:1)状态预测和更新以及跟踪管理;2)数据联合.

结论:适合不知如何写神经网络方面的相关专业大学硕士和本科毕业论文以及关于神经网络论文开题报告范文和相关职称论文写作参考文献资料下载。

基于神经网络技术对标普500指数波动率预测
[摘要]波动率是对特定证券或市场指数收益分散度的统计量度,可以通过使用证券或市场指数收益率之间的标准偏差或方差来衡量。通常,波动率越高,风险越高。

水下制导多目标跟踪关键技术
摘 要:随着军事现代化技术的不断发展和进步,对海军作战的要求越来越高,尤其是水下作战,但是水下作战的环境变得越来越复杂,传统意义的水下制导系统已。

基于BP神经网络车牌识别技术算法分析
摘要:车牌识别是计算机视觉技术的一种典型应用,以机器视觉、图形图像、模式识别等为理论基础,采用神经网络、形态学、投影等技术实现车辆拍照、视频分解。

基于AHP和BP神经网络制造企业产品绿色评价
因为近期“十三五”五大发展之一“绿色发展”的提出以及我国长期可持续发展的需要,制造业越来越重视产品及其生产的绿色低碳可持续化,采用科学的评价方法。

论文大全