夜神模拟器内置加速器器内部结构的现实存在形态

 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
物质的两种基本存在形态
下载积分:400
内容提示:物质的两种基本存在形态
文档格式:PPT|
浏览次数:189|
上传日期: 22:44:27|
文档星级:
全文阅读已结束,如果下载本文需要使用
 400 积分
下载此文档
该用户还上传了这些文档
物质的两种基本存在形态
官方公共微信您所在位置: &
 &  & 
类纸阅读版面加速器体系架构及关键问题的研究.pdf64页
本文档一共被下载:
次 ,您可免费全文在线阅读后下载本文档
文档加载中...广告还剩秒
需要金币:200 &&
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文的提供参考!!
你可能关注的文档:
??????????
??????????
Withtheswift
developmentcomputer
technology,sheet
toresearchand
ofcharacter,and
longeronly
devicesthat
withthetraditionalcustomforthe
book.This
electronic
replacepapery
introducesthe
handsetofelectronic
actuality reading
book,compares
devicesthataresuitableformobile
thedefectforthe
field,analyzes
fromtheneedof
timestatic
forwardthe
non—paperlikeLCD,and
readingputs
devicestandardthat
should tomakereadersread.Theeffect
standard,indicmes
productssystems designedaccording
meettheneedof
comfortableextentisthesanle
long reading,andreading
asthatoftraditional
validatethe
andscienceforthis
paper.Accordinglyrationality
standard.
Accordingreadingstandard,thepaper
正在加载中,请稍后...优秀研究生学位论文题录展示面向目标检测识别应用的算法加速器体系结构研究专 业: 计算机科学与技术关键词: 目标检测识别 算法加速器 行人检测识别 人脸检测识别 无冲突并行访问 FPGA分类号: TP391.41 
TP301.6形 态: 共 180 页 约 117,900 个字 约 5.64 M内容阅 读: 内容摘要无论在军事还是民用领域,目标检测识别技术都具有重要的研究意义和应用价值。人们提出了很多方法来提高目标检测识别的准确性,且取得了显著的成果,但是在提高目标检测识别处理速度方面的相关研究较少。事实上,在将目标检测识别技术应用于实际系统中时,除了保证足够高的识别准确率,识别速度能否满足系统对实时性的要求也是一个关键问题。另外,目标检测识别系统的体积、实现代价、功耗以及对不同应用环境的适应能力也是需要研究的问题。基于FPGA(Field Programmable Gate Array)的硬件加速技术能够实现较大程度的算法到计算引擎的空间映射(区别于通用处理器),且具备计算和存储资源的定制能力(区别于ASIC(Application Specific Integrated Circuits)),因此在灵活性和高性能方面做到了比较好的权衡。同时,FPGA硬件加速器与通用处理器相比还具有体积小、功耗低的优势。基于FPGA的硬件加速技术对于提高目标检测识别技术的实用性具有重要意义。本文研究面向目标检测识别应用的算法加速器体系结构,主要研究四类应用:静态刚性目标识别、运动目标检测提取、行人检测识别、人脸检测识别,研究目的是实现算法到有限硬件资源的充分高效的映射,在硬件实现代价、处理速度和处理效果之间进行适当的折中。基于研究成果为这四类应用分别设计了基于FPGA的硬件加速原型系统。同时,针对行人、人脸检测识别等一类具有不规则数据访问模式的图像处理应用提出了一种通用无冲突并行访问存储模型。首先研究了基于Hausdorff距离与模板匹配的静态刚性目标识别硬件加速技术。静态刚性目标识别应用的数据访问模式较规整,但是计算复杂性较大。本文提出了面向大尺寸窗口遍历型应用的并行计算模型,目的是实现运算单元的数据消耗速度与存储系统的数据供应速度之间的均衡。将基于多体存储结构的无冲突并行访问存储模型与基于分治并行策略的多PE(Processing Element)计算结构相结合,缓解了只采用前者时所遇到的存储体个数太多的问题以及只采用后者时所面临的存储容量受限的问题。性能分析与实验结果表明采用该计算模型可以显著提高运算单元的并行度。其次,研究了运动目标检测提取算法的硬件加速技术以及存储优化技术。相对于静态目标,在现实场景中,人们往往对运动目标更感兴趣。本文设计了对图像中不同运动目标进行分类的硬件加速结构;针对图像序列中运动目标数量、位置、大小等信息不断变化的特点,引出了“可变数据集合维护问题”,设计了一种通用的高速硬件链表结构,提高了对可变数据集合进行存取访问的灵活性。接下来,对于检测并提取出的运动目标,后续工作通常是运动目标识别。本文选取运动目标识别应用中计算复杂性较大且应用需求较广泛的行人检测识别与人脸检测识别进行重点研究。行人与人脸属于“非刚性目标”,与刚性目标不同,非刚性目标的轮廓是不规则且不断变化的,这不仅增加了计算的复杂性,也导致了对存储器数据访问模式的不规则性。本文研究了基于主动形状模型(Active Shape Model,ASM)的行人识别硬件加速技术。针对计算复杂性较大所造成的计算资源不足问题,为了实现硬件代价和处理速度的适当平衡,提出了资源共享模式和硬件流水线方式相互结合、灵活配置的计算资源映射策略,基本思想是对于占用较多计算资源的非瓶颈任务,采用资源共享模式,将多个相同类型的操作映射到一个功能部件上分时执行,多个操作的源操作数通过多路选择器进入功能部件的输入端口,通过采用优化的指令调度算法,最大程度的缩短了同一类型的不同操作之间的启动时间间隔;而对于计算复杂性较大的瓶颈任务,分配较多的计算资源,尽可能的采用流水线技术和其它并行策略提高处理速度。本文在FPGA上构建了原型系统,实现了行人的检测、识别与跟踪,实验结果表明,与相关工作相比具有较大的速度优势。对于人脸目标,本文提出了一种精确分类的视角无关人脸检测方法,能够对垂直于图像平面±90度和图像平面内360度范围的所有人脸姿态进行快速准确地检测分类。树形检测器框架结构中的每个检测节点采用一种创新的两段式Boosting方法(Two-Stage Boosting,TS-Boosting)进行训练,核心思想是在判断一个样本是否属于某个姿态区间时,不仅要看该样本属于该姿态区间的概率有多大,还要看该样本不属于其它姿态区间的概率有多大。基于提出的算法,设计了硬件加速器,并提出了一种对硬件资源进行动态配置的设计空间探索算法。实验表明,本文提出的方法和硬件加速器与相关工作相比具有较高的检测准确率和处理速度。本文最后针对行人、人脸检测识别等一类具有不规则数据访问模式的图像处理应用提出了一种通用无冲突并行访问存储模型,在主存储器与处理器之间构建了一种多体存储结构,并将大部分的不规则数据访问模式归类为对图像中多个局部矩形兴趣区域(Regions of Interest,ROIs)内的任意位置固定大小矩形数据块的无冲突并行访问。理论分析与实验结果表明该存储模型与相关工作相比更适合于多兴趣区域图像处理应用,与直接访问主存储器相比在访存速度上提高了几倍到上百倍。综上所述,本文面向目标检测识别应用,研究了使用硬件加速技术提高性能的关键技术,对算法并行特性分析、体系结构设计、计算和存储资源的灵活配置、面向不规则数据访问模式的并行存取模型等问题提出了有效的解决方案,对于推进目标检测识别技术的研究和实用化具有一定的意义和价值..……全文目录摘要第一章
绪论1.1 目标检测识别技术概述1.1.1 基本概念1.1.2 目标检测识别技术的研究意义和应用价值1.1.3 目标检测识别技术发展现状1.1.4 目标检测识别应用所面临的挑战1.2 基于FPGA的硬件加速技术概述1.2.1 硬件加速技术基本概念和特征1.2.2 硬件加速技术的优势1.2.3 硬件加速技术在科学计算问题中的应用现状1.2.4 硬件加速的关键技术问题1.3 本文的主要工作1.4 全文组织第二章
静态目标检测识别应用硬件加速关键技术研究2.1 引言2.2 基于Hausdorff距离的目标匹配方法2.2.1 Hausdorff距离2.2.2 目标匹配方法2.3 基于Hausdorff距离的目标匹配硬件加速器设计实现2.3.1 并行性分析2.3.2 任务划分策略2.3.3 体系结构设计2.3.4 距离变换的FPGA实现2.3.5 平移匹配的FPGA实现2.4 存储资源对系统可扩展性的影响2.5 面向大尺寸窗口遍历型应用的并行计算模型2.6 实验与性能比较2.7 小结第三章
运动目标检测提取应用硬件加速与存储优化研究3.1 引言3.2 运动目标检测提取应用硬件加速体系结构研究3.2.1 运动目标检测3.2.2 基于Flood-Fill算法的运动区域提取3.2.3 实验与分析3.3 基于高速硬件链表结构的存储优化3.3.1 设计难点及解决方案3.3.2 硬件链表体系结构设计3.3.3 硬件链表的应用3.3.4 实验与分析3.4 小结第四章
行人检测识别应用硬件加速关键技术研究4.1 引言4.2 理论背景与行人检测识别算法描述4.2.1 主动形状模型ASM4.2.2 随机模型4.2.3 Kalman滤波4.2.4 基于主动形状模型和Kalman滤波的行人检测识别算法4.3 行人目标检测识别算法并行性研究4.4 存储层次的并行访问优化4.5 资源共享与硬件流水线相结合的计算资源映射策略4.5.1 资源共享4.5.2 硬件流水线4.6 基于主动形状模型的行人目标识别硬件加速体系结构研究4.6.1 总体结构设计4.6.2 关键模块设计4.6.3 基于资源共享的线形乘累加器设计4.6.4 基于资源共享的Kalman滤波器设计4.7 实验结果与性能分析4.7.1 测试平台4.7.2 资源使用情况4.7.3 与软件实现的处理速度比较4.8 行人目标识别与跟踪原型系统设计4.8.1 行人识别跟踪系统相关研究4.8.2 系统总体框架结构4.8.3 原型系统实现4.8.4 实验结果4.9 小结第五章
视角无关人脸检测识别算法与硬件加速关键技术研究5.1 引言5.2 理论背景5.2.1 AdaBoost简介5.2.2 基于AdaBoost的人脸检测框架5.3 基于两段式Boosting的视角无关人脸检测方法5.3.1 树形视角无关人脸检测器框架结构5.3.2 精确分类的两段式Boosting方法TS-Boosting5.3.3 弱分类器的第一阶段5.3.4 弱分类器的第二阶段5.4 基于两段式Boosting的视角无关人脸检测硬件加速体系结构5.4.1 总体结构5.4.2 检测节点间的组织与通信5.4.3 强分类器的并行结构5.4.4 两段式弱分类器的并行结构5.5 硬件加速体系结构的动态配置策略5.5.1 总体结构层次的动态配置5.5.2 检测器框架结构层次的动态配置5.5.3 强分类器结构层次的动态配置5.5.4 弱分类器结构层次的动态配置5.5.5 系统动态配置的设计空间探索算法5.6 实验与性能比较5.6.1 训练样本5.6.2 训练过程5.6.3 测试平台与测试数据5.6.4 资源使用情况5.6.5 与软件和相关工作的速度比较5.6.6 与相关工作的准确率比较5.6.7 动态配置对系统性能的影响5.7 小结第六章
面向不规则数据访问模式的无冲突并行访问存储模型6.1 引言6.2 面向不规则数据访问模式的无冲突并行访问存储模型及体系结构6.2.1 总体框架6.2.2 数据划分策略6.2.3 虚拟地址计算6.2.4 基于地址映射表的寻址机制6.2.5 基于地址映射表的寻址体系结构6.2.6 接口、地址映射表更新机制及体系结构6.2.7 编址一致性6.3 实验结果以及与相关工作的比较6.3.1 实验结果与性能分析6.3.2 与相关工作的比较6.4 小结第七章
结束语7.1 论文工作的总结7.2 课题研究展望参考文献相似论文,95
页,TP391.41,65
页,TP391.41
TP301.6,103页,TP391.41
10页,TP391.41,71
页,TP391.41,141页,TP391.41,142页,TP391.41,112页,TP391.41,77
页,TP391.41
TP181,68
页,TP393.07
TN915.04,58
页,TP393.07,58
页,TP393.07,53
页,TP393.07
TP311.131,62
页,TP393.06,80
页,TP393.08,88
页,TP393.07
TP393.1,79
页,TP391.41
TP393.4,66
页,TP393.08
TP312,75
页,TP392
TP311.13,52页,TP393.08
TP309.2中图分类:
> TP391.41 > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工)其他分类:
> TP301.6 > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法
& 2012 book.

参考资料

 

随机推荐