Select Language

AI社区

公开数据集

Caltech 加州理工学院行人数据集

Caltech 加州理工学院行人数据集

11.16G
895 浏览
2 喜欢
9 次下载
0 条讨论
Person 2D Box

加州理工学院行人数据集包括大约10小时的640x480 30Hz视频,这些视频来自在城市环境中通过常规交通的车辆。大约250,000个框......

数据结构 ? 11.16G

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    加州理工学院行人数据集包括大约10小时的640x480 30Hz视频,这些视频来自在城市环境中通过常规交通的车辆。大约250,000个框架(137个近似分钟的长段)共有350,000个边界框和2300个独特的行人被注释。注释包括边界框和详细遮挡标签之间的时间对应。更多信息可以在我们的PAMI 2012和CVPR 2009基准测试文件中找到。

    数据结构

    • 加州理工学院行人数据集。训练数据(set00-set05)由六个训练集(每个约1GB)组成,每个训练集有6-13个一分钟长的seq文件,以及所有注释信息(详见论文)。测试数据(set06-set10)由五组组成,每组约1GB。新增:现在还提供了整个数据集的注释。还提供包含所有评估算法的检测结果的输出文件。

    • Seq视频格式。seq文件是一系列具有固定大小标题的连接图像帧。用于读/写/操作seq文件的matlab例程可以在 Piotr的Matlab工具箱中找到(需要3.20或更高版本)。这些例程还可用于将seq文件提取到图像目录。

    • Matlab评估/标签代码(3.2.1)。注释使用自定义的“视频边界框”(vbb)文件格式。该代码还包含用于查看覆盖注释的seq文件的实用程序,用于生成本文中所有ROC图的评估例程,以及用于创建数据集的vbb标记工具(另请参见此有点过时的视频教程)。

    • 标准格式的其他数据集。为方便起见,我们发布了seq / vbb格式的完整图像/注释以及许多其他数据集上所有评估算法的检测结果。这有助于对这些附加数据集的训练/测试以及所有ROC曲线的精确再现。原作者仍享有完整版权,请参阅相应网站以获取更多信息,包括如何引用这些数据集的评估结果。INRIA行人数据集[已转换 ], ETH行人数据集 [已转换 ], TUD-布鲁塞尔行人数据集 [已转换 ],戴姆勒行人数据集 [转换 ]。

    基准测试结果

    算法细节和参考 | 算法运行时与性能

    有关评估方案的详细信息,请参阅我们的PAMI 2012论文。 
    注意:自我们的CVPR 2009论文以来,评估方案已经发展。 
    注意:我们每个绘图最多渲染15个最佳结果(但始终包括VJ和HOG基线)。

    1. 加州理工学院行人测试数据集:我们提供两组结果:50像素或更高,未被遮挡或部分遮挡的行人(合理),以及更详细的性能细分,如文中所述(详细)。

    2. 加州理工学院行人培训数据集:加州理工学院培训数据的结果:合理,详细。

    3. 加州理工学院行人日本数据集:类似于加州理工学院行人数据集(无论是幅度还是注释),视频都是在日本收集的。我们无法发布这些数据,但是,我们将对结果进行基准测试,以对各种检测器进行二次评估。结果:合理,详细。

    4. INRIA行人测试数据集:INRIA Pedestrian数据集的全图像结果(评估详情)。

    5. ETH行人数据集:ETH行人数据集的结果(评估详情)。

    6. TUD-Brussels Pedestrian Dataset:TUD-Brussels Pedestrian数据集的结果(评估详情)。

    7. 戴姆勒行人数据集:戴姆勒行人数据集的结果(评估详情)。

    提交结果

    请联系我们,将您的探测器结果包含在本网站上。我们从第30帧开始每隔30帧进行一次评估。对于每个视频,每个帧的结果应该是一个文本文件,命名如下:“I00029.txt,I00059.txt,...”。每个文本文件应包含每个检测到的边界框1行,格式为“[left,top,width,height,score]”。如果未找到任何检测项,则文本文件应为空(但必须仍然存在)。目录结构应该模仿包含视频的目录结构:“set00 / V000,set00 / V001 ......”。如果上面的描述不清楚,请参阅评估算法的输出文件(可从下载部分获得)。请注意,在评估期间,给定视频的所有检测都连接成一个文本文件,

    相关数据集

    下面我们列出其他行人数据集,大致按照与Caltech Pedestrian数据集的相关性和相似性的顺序。可以在本文中找到数据集(前两个除外)的更详细比较。

    • GM-ATCI:从鱼眼镜头相机拍摄的后视行人数据集。

    • 戴姆勒:还在城市环境中捕获,更新旧的戴姆勒克莱斯勒数据集。包含跟踪信息和大量标记的边界框。

    • NICTA:在多个城市/国家收集的大规模城市数据集。没有运动/跟踪信息,但有大量独特的行人。

    • ETH:从安装在婴儿车上的立体装置捕获的城市数据集。

    • TUD-Brussels:在拥挤的城市环境中使用车载摄像头记录图像对的数据集。

    • INRIA:目前最受欢迎的静态行人检测数据集之一。

    • PASCAL:具有不同对象视图和姿势的静态对象数据集。

    • CVC-ADAS:行人数据集的集合,包括在船上获得的行人视频,虚拟世界的行人(带有部分注释)和被遮挡的行人。

    • 南加州大学:一些相当小的行人数据集主要来自监控视频。

    • 麻省理工学院:第一个行人数据集之一,相当小,相对较好地解决了这一点。

    更改日志

    • 07/01/2019:添加了ADM,ShearFtrs和AR-Ped结果。

    • 08/31/2018:添加了GDFL结果。

    • 07/05/2018:添加了TLL-TFA结果。

    • 07/05/2018:添加了FasterRCNN + ATT和AdaptFasterRCNN结果。

    • 06/03/2018:添加了F-DNN2 + SS结果。

    • 04/15/2018:添加了PCN结果。

    • 2017年11月20日:添加了SDS-RCNN结果。

    • 10/23/2017:添加了UDN +结果。

    • 2016年12月12日:添加了ACF ++ / LDCF ++,MRFC和F-DNN结果。

    • 2016年9月9日:添加了MS-CNN结果。

    • 07/26/2016:添加了RPN + BF结果。

    • 2016年3月3日:添加了SA-FastRCNN结果。

    • 2015年8月11日:添加了SCF + AlexNet结果。

    • 2015年10月26日:添加了CompACT-Deep结果。

    • 2015年9月24日:添加了CCF结果。

    • 2015年9月16日:添加了Checkerboards,LFOV,DeepCascade,DeepParts,SCCPriors,TA-CNN,FastCF和NAMC结果。最新的OSX Matlab显示更新的显示代码。修复了一些破碎的链接

    • 2014年10月29日:新代码版本v3.2.1(已修改的dbExtract.m,已更新的标头)。

    • 2014年9月21日:增加了LDCF,ACF-Caltech +,SpatialPooling,SpatialPooling +和Katamari结果。

    • 2014年7月22日:更新了CVC-ADAS数据集链接和说明。

    • 2014年7月16日:添加了WordChannels和InformedHaar结果。

    • 06/04/2014:添加了RandForest结果。

    • 2014年5月20日:添加了Franken,JointDeep,MultiSDP和SDN结果。

    • 11/11/2013:添加了FisherBoost和pAUCBoost结果。

    • 08/08/2013:添加了ACF + SDt结果。

    • 2013年7月30日:新代码发布v3.2.0(添加了dbExtract.m以提取图像和文本文件,重构了dbeval.m)。增加了ACF和ACF-Caltech结果。

    • 07/16/2013:添加了MOCO结果。

    • 07/11/2013:添加了DBN-Isol,DBN-Mut和+ 2Ped结果。更新了algorithm.pdf和网站。

    • 07/08/2013:添加了MLS和MT-DPM结果。每个绘图最多渲染15个最高结果。

    • 07/07/2013:添加了ConvNet,SketchTokens,Roerei和AFS结果。

    • 07/05/2013:新代码发布v3.1.0(清理和评论)。更新的情节颜色和样式。不再以二进制形式接受结果。更新了检测格式,每个视频都有一个结果文本文件。

    • 11/26/2012:添加了VeryFast结果。更新了TUD和Daimler数据集的链接。

    • 08/04/2012:添加了串扰结果。新代码版本v3.0.1。

    • 01/18/2012:在Caltech Pedestrian Testing Dataset上添加了MultiResC结果。

    • 09/05/2011:对应于PAMI 2012出版物的网站的主要更新(发布的测试注释,更新的评估代码,更新的图表,发布的PAMI论文,添加的FeatSynth和HOG-LBP检测器)。

    • 08/02/2010:添加了运行时与性能图。

    • 08/01/2010:增加了FPDW和PLS结果。修复了美国数据的MultiFtr + CSS结果。新代码发布v2.2.0。

    • 06/27/2010:在戴姆勒数据上添加了戴姆勒行人数据集的转换版本和评估结果。

    • 05/31/2010:添加了MultiFtr + CSS和MultiFtr + Motion结果。

    • 04/18/2010:添加了TUD-Brussels和ETH结果,新代码发布(新vbbLabeler),网站更新。

    • 03/15/2010:重大改革:新的评估标准,发布测试图像,所有新的rocs,添加的ChnFtrs结果,更新的HikSvm和LatSvm-V2结果,更新的代码,网站更新。

    • 06/12/2009:添加了PoseInv结果,链接到TUD-Brussels数据集。

    • 06/08/2009:添加了LatSvm-V2结果。

    • 06/02/2009:对网站的各种调整。

    • 05/18/2009:网站的初始版本


    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:12 去赚积分?
    • 895浏览
    • 9下载
    • 2点赞
    • 收藏
    • 分享