网站大量收购独家精品文档,联系QQ:2885784924

基于深度学习的人脸检测系统设计文档.PDF

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于深度学习的人脸检测系统设计文档 庞伟 179110 周世豪 163850 沈志源 163807 第一部分 设计概述 /Design Introduction 1.1 设计目的 近年来,由于视频监控,人机交互和视频检索的应用需求,视频中的人脸检测研究得到了迅速发展。 尤其是在第三次人工智能浪潮中,深度学习被广泛应用于各行各业。本作品是基于深度学习的人脸检测 系统设计,以深度学习的目标检测算法为基础,充分考虑硬件实现的需求,训练了一个用于人脸检测的 卷积神经网络架构。通过硬件实现,是人脸检测系统能够应用于更多的场景,而不在局限CPU 或GPU 的 环境。同时也为人脸识别打下了坚实的基础。 1.2 应用领域 人脸检测可以应用于很多领域。如安防领域、经济领域、商贸领域以及健康管理等领域。以及一些 需要对人数清点的领域,比如教学点名,公司考勤等领域。 1.3 适用范围 本系统的突出特点在于检测算法鲁棒性和硬件的实时性。基于以上特点,本系统可以适用于基于人 脸识别的考勤、点名系统;海关、商场、机场和银行监控系统;公共场合监控和自动门卫系统等。 第二部分 系统组成及功能说明 /System Construction Function Description 2.1 系统介绍 本系统是基于YOLO (You Only Look Once )算法的人脸检测系统。首先根据yolo 算法在软件上实 现了高精度高鲁棒性的人脸检测程序,并提取相应参数。之后在Zynq 平台上,把PL 端开发为运算逻辑, 使PS 端负责控制逻辑,合理配置各模块之间的通信,以逐层并行运算的方式实现了单张图片的人脸检 测工程。最后加入视频处理和视频输出模块,将摄像头采集的视频转化成图片处理,在显示屏上连续输 1 出检测后的图片。速度可达1FPS,满足实时性的要求。相比传统方法,该系统对采集质量不高的视频 仍然有很强的识别能力,对人脸遮挡,表情,侧脸,装饰等变化具有强鲁棒性,可以用于闸机检测、实 时人数统计等实际应用场景中。 系统的具体工作流程如图1。用摄像头采集640*480 分辨率的视频。视频首先进入视频处理模块, 截取中间的方形区域,通过通信模块暂存在DDR 中,同时传送到视频输出模块,保持显示器上视频的 连续输出。接收到输入图片后,PS 端的控制逻辑根据网络结构依次在DDR 中取出特征图和对应的权重, 将其传送到PL 端的运算单元。PL 端由多个卷积核运算单元组成,每个运算单元包含输入缓存、输出缓 存和DSP 构成的卷积器。可以同时完成多个卷积运算。运算后的结果通过总线传送回DDR 暂存。在神 经网络运算完毕后,将得到的人脸框标注在输出视频帧中。 图1 人脸检测系统流程图 2.2 各模块介绍 1.算法模块 1.1 算法原理 人脸检测是计算机视觉应用中的常见问题。传统的人脸检测方法利用特征算子和级联分类器的计算 方式鲁棒性不强,对光照变化,遮挡和姿态变化漏检率很高。深度学习很好地解决了这个问题。 本项目中,待测图片尺度转换成为416*416 输入卷积网络直接得到边界框。网络负责进行回归操作, 输出预测框的位置和框内物体的类别。此网络可以看作把图像分为13*13 的网格,每个网格预测4 个边 界框。如果对象的中心落在网格单元中,则该网格负责预测该物体。每个边界框会输出(X, Y, W, H, O, C )六个值。O 代表置信度,反映本框中出现人脸的概率。X,Y,W,H 是该预测框的长宽和中心点所在坐 标。C 是该框中物体所属类别,1,0 分别代表人脸和非人脸。最终网络输出一个13*13*4*6 的张量。如 2 图2 所示,边界框的长宽通过相对于聚类中心的偏移确定。边界框的中心点坐标通过网络输出和网格位 置确定。 图2 预测框展示图 网络以CNN 实现,网络的初始卷积层从图像中提取特征,最后三层生成位置和置信度信息。网络 结构如图3 所示,其中第1,2 层的步长为2 ,其他为1。每层输出特征图在进行下一次运算时都要在周围

您可能关注的文档

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档