Select Language

AI社区

公开数据集

ScanRefer数据:使用自然语言在RGB-D扫描中进行3D对象定位

ScanRefer数据:使用自然语言在RGB-D扫描中进行3D对象定位

58.59M
299 浏览
0 喜欢
0 次下载
0 条讨论
Others Classification

IntroductionWe introduce the task of 3D object localization in RGB-D scans using natural language descriptions.As input,......

数据结构 ? 58.59M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    Introduction

    We introduce the task of 3D object localization in RGB-D scans using natural language descriptions.            As input, we assume a point cloud of a scanned 3D scene along with a free-form description of a specified target object.            To address this task, we propose ScanRefer, learning a fused descriptor from 3D object proposals and encoded sentence embeddings.            This fused descriptor correlates language expressions with geometric features, enabling regression of the 3D bounding box of a target object.            We also introduce the ScanRefer dataset, containing 51,583 descriptions of 11,046 objects from 800 ScanNet scenes.            ScanRefer is the first large-scale effort to perform object localization via natural language expression directly in 3D.

    If you find our project useful, please consider citing us:        

    @article{chen2020scanrefer,
        title={ScanRefer: 3D Object Localization in RGB-D Scans using Natural Language},
        author={Chen, Dave Zhenyu and Chang, Angel X and Nie{\ss}ner, Matthias},
        journal={16th European Conference on Computer Vision (ECCV)},
        year={2020}
    }


    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:15 去赚积分?
    • 299浏览
    • 0下载
    • 0点赞
    • 收藏
    • 分享