Select Language

公开数据集

SVHN街景门牌号码数据集,超过 600,000 个数字图像

SVHN街景门牌号码数据集,超过 600,000 个数字图像

Scene:

Action/Event Detection

Data Type:

Classification
所需积分:28 去赚积分?
  • 285浏览
  • 0下载
  • 0点赞
  • 收藏
  • 分享

贡献者查看主页

Stanford University

A place for learning, discovery, innovation, expression and discourse

Data Preview ? 5.7G

    Data Structure ?

    *数据结构实际以真实数据为准

    SVHN 是一个真实世界的图像数据集,用于开发机器学习和对象识别算法,对数据预处理和格式化的要求最低。它可以被视为与 MNIST 风格相似(例如,图像是经过裁剪的小数字),但包含了一个数量级的更多标记数据(超过 600,000 个数字图像),并且来自一个更难、未解决的现实世界问题(识别自然场景图像中的数字和数字)。 SVHN 是从谷歌街景图像中的门牌号获得的。

    Overview

    10 classes, 1 for each digit. Digit '1' has label 1, '9' has label 9 and '0' has label 10.

    73257 digits for training, 26032 digits for testing, and 531131 additional, somewhat less difficult samples, to use as extra training data

    Comes in two formats:

    1、Original images with character level bounding boxes.
    2、MNIST-like 32-by-32 images centered around a single character (many of the images do contain some distractors at the sides


    Format 1: Full Numbers:  train.tar.gz,  test.tar.gz ,  extra.tar.gz  (Note: for non-commercial use only)

    这些是带有字符级边界框的原始、可变分辨率、彩色门牌号图像,如上面的示例图像所示。 (此处的蓝色边界框仅用于说明目的。边界框信息存储在 digitStruct.mat 中,而不是直接在数据集中的图像上绘制。)每个 tar.gz 文件都包含 png 格式的原始图像,以及一个digitStruct.mat 文件,可以使用 Matlab 加载。 digitStruct.mat 文件包含一个名为 digitStruct 的结构,其长度与原始图像的数量相同。 digitStruct 中的每个元素都有以下字段: name 是一个包含相应图像文件名的字符串。 bbox 是一个结构数组,包含图像中每个数字边界框的位置、大小和标签。例如: digitStruct(300).bbox(2).height 给出第 300 个图像中第 2 个数字边界框的高度。


    Format 2: Cropped Digits:  train_32x32.mat,  test_32x32.mat ,  extra_32x32.mat  (Note: for non-commercial use only)



    类似 MNIST 格式的字符级基本事实。所有数字都已调整为 32 x 32 像素的固定分辨率。原始字符边界框在适当的维度上扩展为方形窗口,因此将它们调整为 32×32 像素不会引入纵横比失真。然而,这种预处理会在感兴趣的数字的两侧引入一些分散注意力的数字。加载 .mat 文件会创建 2 个变量:X 是包含图像的 4-D 矩阵,y 是类标签的向量。为了访问图像,X(:,:,:,i) 给出第 i 个 32×32 RGB 图像,类标签为 y(i)。


    Reference

    Please cite the following reference in papers using this dataset:

    Yuval Netzer, Tao Wang, Adam Coates, Alessandro Bissacco, Bo Wu, Andrew Y. Ng Reading Digits in Natural Images with Unsupervised Feature Learning NIPS Workshop on Deep Learning and Unsupervised Feature Learning 2011. (PDF)

    Please use http://ufldl.stanford.edu/housenumbers as the URL for this site when necessary
    For questions regarding the dataset, please contact streetviewhousenumbers@gmail.com

    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。