无需3D数据的开放词汇单目3D物体检测模型训练 Training an Open-Vocabulary Monocular 3D Object Detection Model without 3D Data.docx
- 1、本文档共34页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
TraininganOpen-VocabularyMonocular3DObjectDetectionModelwithout3DData
RuiHuang1HenryZheng1YanWang2ZhuofanXia1MarcoPavone2,3GaoHuang1,4*
1DepartmentofAutomation,BNRist,TsinghuaUniversity,China
arXiv:2411.15657v1[cs.CV]23Nov20242NVIDIAResearch,USA3
arXiv:2411.15657v1[cs.CV]23Nov2024
4BeijingAcademyofArtificialIntelligence,China
{hr20,jh-zheng22,xzf23}@mails..cn
yanwan@,pavone@,gaohuang@.cn
https://ovm3d-det.github.io
Abstract
Open-vocabulary3Dobjectdetectionhasrecentlyattractedconsiderableattentionduetoitsbroadapplicationsinautonomousdrivingandrobotics,whichaimstoeffectivelyrecognizenovelclassesinpreviouslyunseendomains.However,existingpointcloud-basedopen-vocabulary3Ddetectionmodelsarelimitedbytheirhighdeploymentcosts.Inthiswork,weproposeanovelopen-vocabularymonocular3Dobjectdetectionframework,dubbedOVM3D-Det,whichtrainsdetectorsusingonlyRGBimages,makingitbothcost-effectiveandscalabletopubliclyavailabledata.Unliketraditionalmethods,OVM3D-Detdoesnotrequirehigh-precisionLiDARor3Dsensordataforeitherinputorgenerating3Dboundingboxes.Instead,itemploysopen-vocabulary2Dmodelsandpseudo-LiDARtoautomaticallylabel3DobjectsinRGBimages,fosteringthelearningofopen-vocabularymonocular3Ddetectors.However,training3Dmodelswithlabelsdirectlyderivedfrompseudo-LiDARisinadequateduetoimpreciseboxesestimatedfromnoisypointcloudsandseverelyoccludedobjects.Toaddresstheseissues,weintroducetwoinnovativedesigns:adaptivepseudo-LiDARerosionandboundingboxrefinementwithpriorknowledgefromlargelanguagemodels.Thesetechniqueseffectivelycalibratethe3DlabelsandenableRGB-onlytrainingfor3Ddetectors.ExtensiveexperimentsdemonstratethesuperiorityofOVM3D-Detover
baselinesinbothindoorandoutdoorscenarios.Thecodewillbe
您可能关注的文档
- 企业ESG治理推动长期价值提升.docx
- 企业竞争图谱:2024年灵巧手 头豹词条报告系列.docx
- 企业竞争图谱:2024年汽车电子后视镜 头豹词条报告系列.docx
- 企业退出时建设用地土壤污染问题处理中的难点 2024.docx
- 汽车:潜在关税风险对我国汽车行业出海的影响202411 远东资信.docx
- 浅析地方政府专项债作项目资本金 20241113 -远东资信.docx
- 全球及中国汽车转向系统市场发展分析报告 2024.docx
- 全球生活垃圾分类处理成功突破可行性报告.docx
- 融资租赁类资产支持证券产品报告(2024年前三季度):整体发行态势基本平稳,汽车租赁需求不断释放,融资成本显著下行 -中诚信.docx
- 山西省及下辖各市经济财政实力与债务研究(2024) -新世纪.docx
最近下载
- 潮汕英歌舞课件.pptx
- 苏教版小学科学五年级上册11地球的内部 课件.pptx
- 八年级历史与社会上册 3.3 回首西汉 人教版.ppt
- 海关法律规范体系介绍-政策法规司共72页.docx
- nikkidenso喜开理日VPS_NCR-DCC0,DCD0操作说明.pdf
- 人教版2024--2025学年度第一学期一年级数学上册期末测试卷及答案(含四套题).doc VIP
- 广西2022-2023学年高二12月学业水平考试英语试题和答案详解.pdf
- 2023-2024学年高二英语下学期期末之阅读七选五(解析版).docx VIP
- 橙色简约风非遗系列之英歌舞PPT模板.pptx VIP
- 怎样写学术论文【荐】.ppt
文档评论(0)