- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
1
大熊猫识别技术规范
1范围
本文件规定了大熊猫个体识别有关术语定义、数据采集、数据分析等。本文件适用于基于图像和音频的大熊猫个体识别。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其必威体育精装版版本(包括所有的修改单)适用于本文件。
CJJ/T263-2017动物园动物管理技术规程
GB/T26238-2010信息技术生物特征识别术语
3术语、定义和缩略语
3.1术语和定义
下列术语和定义适用于本文件。
3.1.1
生物特征识别biometrics
基于动物个体的行为特征和生物学特征,对个体进行的识别。
3.1.2
目标检测objectdetection
从图像中找出目标的位置坐标,一般用矩形框框出目标,并对该目标进行分类。
3.1.3
特征提取featureextraction
使用计算机提取大熊猫图像中属于特征性的特征序列的方法及过程。
3.1.4
特征比对featurematching
计算两个特征向量之间的相似度。特征比对包括1:1比对验证和1:N比对识别两种方式。
3.1.5
相似度similarity
衡量两个特征的相似程度,数值越大说明它们越相似。
3.1.6
2
阈值threshold
做出判定所依据的边界值或值集。
3.1.7
错误接受率falseacceptrate
在验证过程中,将新个体识别为数据库中个体的比率,用百分比表示。错误接受率也称认假率。
3.1.8
错误拒绝率falserejectrate
在验证过程中,将数据库中个体识别错误的比率,用百分比表示。错误拒绝率也称拒真率。
3.1.9
残差网络residualnetwork
残差网络其内部的残差块使用了跳跃连接,缓解了在深度神经网络中增加深度带来的梯度消失问题。
3.1.10
声纹voiceprint
声纹是各种常见声学特征图谱的集合,是指通过专门的电声转换仪器(声谱仪、语图仪等)将声音绘制成波普图形。
3.1.11
声纹识别voiceprintrecognition
声纹识别常称为说话人识别,该技术主要通过提取不同发声者语音中的特征参数,经过模型训练和得分计算等过程,进行语音区分和个体识别。
3.1.12
Mel频率倒谱系数Mel-FrequencyCepstralCoefficients
Mel频率倒谱系数是把人耳的听觉感知特性和语音的产生机理结合起来提取的声纹特征。
3.1.13
快速傅里叶变换fastfouriertransform
利用计算机计算离散傅里叶变换(DFT)的高效、快速计算方法的统称。
3.1.14
卷积神经网络convolutionalneuralnetworks
3
以卷积计算为主的深度神经网络,通常包含卷积层、批归一化层、激活层、池化层、全连接层、损失函数层等基础结构。
3.1.15
长短期记忆longshort-termmemory
长短期记忆网络是一种特殊的循环神经网络模型,其特殊的结构设计使得它可以避免长期依赖问题,记住很早时刻的信息是LSTM的默认行为,而不需补充专门为此付出很大代价。
3.1.16
精准率precision
精准率是指分类正确的正样本个数占分类器判定为正样本的个数的比例。
3.1.17
交并比IntersectionoverUnion
交并比是产生的候选框与原标记框的交集与并集的比值。
3.2缩略语
下列缩略语适用于本文件。
MFCC:Mel频率倒谱系数(Mel-FrequencyCepstralCoefficients)FFT:快速傅里叶变换(fastfouriertransform)
CNN:卷积神经网络(convolutionalneuralnetworks)
LSTM:长短期记忆(longshort-termmemory)
IOU:交并比(IntersectionoverUnion)
4数据采集
4.1大熊猫图像采集
4.1.1大熊猫图像采集流程
大熊猫图像数据采集流程如下:
a)通过调取某一区域对应大熊猫的监控视频或者野外红外相机视频数据,将含有大熊猫的片段挑选出来,并确认视频片段中每一只大熊猫的身份信息,将挑选的视频片段与大熊猫身份信息一同记录完成视频数据采集,然后通过视频拆帧的形式将视频转化成图像数据;
b)借助野外红外相机或者人工拍照设备,对大熊猫个体进行多方位拍摄,将拍摄到的图片与大熊猫身份信息一同记录完成图像数据采集工作。
4.1.2大熊猫全身图像采集
大熊猫全身图像的采集需满足以下要求:
a)大熊猫全身图像光线自然,
文档评论(0)