一种基于自驱动孪生采样和推理的视频问答方法 .pdf

一种基于自驱动孪生采样和推理的视频问答方法 .pdf

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

(19)中华人民共和国国家知识产权局

(12)发明专利说明书

(10)申请公布号CN114218439A

(43)申请公布日2022.03.22

(21)申请号CN202111553547.0

(22)申请日2021.12.17

(71)申请人中山大学

地址510275广东省广州市海珠区新港西路135号

(72)发明人余伟江卢宇彤李孟非陈志广

(74)专利代理机构44367深圳市创富知识产权代理有限公司

代理人高冰

(51)Int.CI

G06F16/783

G06F16/78

G06F16/75

G06F16/71

G06F16/332

G06V20/40

G06V10/764

G06K9/62

G06N5/04

权利要求说明书说明书幅图

(54)发明名称

一种基于自驱动孪生采样和推理的

视频问答方法

(57)摘要

本发明公开了一种基于自驱动孪生

采样和推理的视频问答方法,所述方法包

括视频段采样、特征提取与推理策略,其

中,所述视频段采样通过稀疏采样得到基

准视频段以及通过孪生采样获得孪生视频

段;所述特征提取通过一视频编码器,一

文本编码器和一多模态将多个视频段‑文

本对编码成相应的语义特征表示;所述推

理策略通过使用孪生知识生成模块为视频

段生成提炼后的知识标签,并使用孪生知

识推理模块将这个标签传播给其所有孪生

样本并进行融合。本发明有益效果在于,

提出了此基于自驱动孪生采样和推理的框

架,并将其用于提取相同视频的不同视频

段中的上下文语义信息,用于增强网络的

学习效果。

法律状态

法律状态公告日法律状态信息法律状态

2022-03-22公开发明专利申请公布

实质审查的生效IPC(主分

类):G06F16/783专利申请

2022-04-08实质审查的生效

号:2021115535470申请

权利要求说明书

1.一种基于自驱动孪生采样和推理的视频问答方法,其特征在于,所述方法包括视频

段采样、特征提取与推理策略,其中,所述视频段采样通过稀疏采样得到基准视频段

以及通过孪生采样获得孪生视频段;所述特征提取通过一视频编码器,一文本编码器

和一多模态将多个视频段-文本对编码成相应的语义特征表示;所述推理策略通过使

用孪生知识生成模块为视频段生成提炼后的知识标签,并使用孪生知识推理模块将

这个标签传播给其所有孪生样本并进行融合。

2.根据权利要求1所述的基于自驱动孪生采样和推理的视频问答方法,其特征在于,

在所述视频段采样中,分别使用稀疏采样和孪生采样获得基准段和孪生段,并使用特

征提取模型分别提取出这些视频段的特征;在所述特征提取中,用孪生知识生成模块,

根据基准段和孪生段的特征,计算出视频内部的上下文特征;在所述推理策略中,使用

孪生知识推理模块,根据所述上下文特征,自适应地为视频段生成提炼后的软标签。

3.根据权利要求1或2所述的基于自驱动孪生采样和推理的视频问答方法,其特征在

于,所述孪生采样包括通过对视频样本F进行稀疏采样得到长度为B帧的视频段样

本;其中,F的长度大于B;以随机的方式

文档评论(0)

1637142147337d1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档