• 首页 > 数据存储频道 > 数据库频道 > 操作系统与开源

    即时3D搜索技术OVIR-3D开源 可从文本提示中检索3D对象

    2023年11月10日 10:37:23

      11月10日 消息:OVIR-3D是一个开放词汇的3D实例检索系统,它以直观而有效的方式解决了在没有对3D数据进行训练的情况下获取3D实例的问题。该系统通过语言引导的2D区域提议进行3D融合,为机器人应用(如操纵和导航)提供了解决方案。OVIR-3D的核心思想是直接训练开放词汇的3D分割模型在实践中变得困难,因此它从语言引导的2D区域提议出发,通过在大量2D数据集上进行训练,将2D实例信息在3D空间中投影和融合,以实现快速检索。

    1.jpg

      OVIR-3D的使用包括下载仓库、安装依赖、演示、数据集准备、2D到3D融合和推理等多个步骤。作者提供了详细的使用说明,包括如何获取仓库、安装依赖以及演示过程。此外,系统支持自定义数据集的准备,通过开源的实感相机和KinectFusion实现,用户能够以指定格式录制和重建自定义3D场景。

      在OVIR-3D的背后,Detic作为2D区域提议网络的骨干,通过查询Imagenet21k的所有类别,生成置信度阈值为0.3的输出蒙版和文本对齐特征。这一步骤的输出被存储在特定文件夹中,用户可以选择保存2D可视化,尽管这可能会降低推理速度。

      对于2D到3D的融合,OVIR-3D提供了一种算法来处理多个3D场景的并行融合,但作者建议至少拥有11GB内存的显卡以避免在处理大场景时出现内存问题。一旦融合完成,用户可以通过instance_query.py脚本与系统进行交互,检索3D实例。

      论文中提到OVIR-3D作为开放词汇问题的一个解决方案,强调其评估方式采用信息检索标准mAP,这是一种更合理的度量方式,尽管略有不同于通常用于封闭集实例分割的mAP度量。文章还提到了OVIR-3D的应用前景,以及后续工作OVSG的介绍,该工作在OVIR-3D的基础上构建3D场景图,实现更精准的对象检索。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。