Select Language

AI社区

公开数据集

野外标记人脸 (LFW) 人脸照片数据库

野外标记人脸 (LFW) 人脸照片数据库

112.43M
675 浏览
1 喜欢
2 次下载
0 条讨论
People Classification

野外标记人脸 (LFW) 是一个人脸照片数据库,旨在研究无约束人脸识别问题。该数据库由马萨诸塞大学阿默斯特分校的研究人员创建和......

数据结构 ? 112.43M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    野外标记人脸 (LFW) 是一个人脸照片数据库,旨在研究无约束人脸识别问题。该数据库由马萨诸塞大学阿默斯特分校的研究人员创建和维护(具体参考资料在致谢部分)。 Viola Jones 人脸检测器检测到 5,749 人的 13,233 张图像并将其居中,并从网络收集。照片中的 1,680 人在数据集中有两张或更多张不同的照片。原始数据库包含四组不同的 LFW 图像以及三种不同类型的“对齐”图像。据研究人员称,与其他图像类型相比,深度漏斗图像对大多数人脸验证算法产生了更好的结果。因此,这里上传的数据集是深度漏斗版本。

    Content

    该数据集中有 11 个文件。 lfw-deepfunneled.zip 是包含图像的文件。所有其他 10 个文件都是相关元数据,可以帮助您为模型形成训练和测试集。下面有两个部分可以帮助您更好地浏览文件。第一部分提供专门与图像有关的信息。第二部分解释了每个元数据文件的内容。

    Image information:

    1、图像文件格式:每张图像都以“lfw/name/namexxxx.jpg”形式提供,其中“xxxx”是用前导零填充为四个字符的图像编号。例如,第 10 个 GeorgeWBush 图像可以找到为“lfw/GeorgeWBush/GeorgeWBush0010.jpg”

    2、图像尺寸:每张图像都是 250x250 jpg,使用 Viola-Jones 人脸检测器的 openCV 实现进行检测和居中。然后检测器返回的裁剪区域在每个维度上自动放大 2.2 倍,以捕获更多的头部,然后缩放到统一大小。

    metadata information:

    1、lfwallnames.csv:包含数据集中每个人脸的所有名称以及每个人脸拥有的图像数量。

    2、lfwreadme.csv:在原始数据库中找到的综合自述文件。如果您在此处遗漏了任何信息或正在寻找其他资源,您可能会在此文件中找到它。它解释了每个 .csv 文件在形成训练和测试模型时如何发挥作用,以及用于确定 .csv 所指内容的列元数据信息。原始网站还提供有关训练/测试拆分和比较基准的建议。

    有两种推荐的配置用于开发训练和测试集(成对与人)。根据您选择的路线,您将使用以下 .csv 文件:

    1、pairs.csv:包含随机生成的拆分,用于专门针对对的 10 折交叉验证。在形成训练集时将其用于图像受限配置(请参阅自述文件)。一共10套; 5 组包含 300 个匹配对,其他 5 组包含 300 个错配对。

    2、people.csv:包含随机生成的分割,用于专门针对单个人脸的 10 折交叉验证。在形成训练集时将其用于不受限制的配置(请参阅自述文件)。一共10组,每组人数不同;第 1 组:601。第 2 组:555。第 3 组:552。第 4 组:560。第 5 组:567。第 6 组:527。第 7 组:597。第 8 组:601。第 9 组:580。第 10 组:609。

    3、matchpairsDevTest.csv:如果您决定采用对配置,请使用此测试集。包含 500 对匹配的测试集人脸。

    4、matchpairsDevTrain.csv:如果您决定采用对配置,请使用此训练集。包含 1100 对匹配的人脸作为训练集。

    5、mismatchpairsDevTest.csv:如果您决定采用对配置,请使用此测试集。包含 500 对不匹配的人脸用于测试集。

    6、mismatchpairsDevTrain.csv:如果您决定采用对配置,请使用此训练集。包含 1100 对不匹配的人脸作为训练集。

    7、peopleDevTest.csv:如果您决定采用人员配置,请使用此测试测试。包含 1711 个人和 3708 张图片。

    8、peopleDevTrain.csv:如果您决定采用人员配置,请使用此训练集。包含 4038 个人和 9525 张图片。

    Acknowledgements

    All data and metadata were originally found on http://vis-www.cs.umass.edu/lfw/. Please visit the site for other data versions including original, non-aligned data as well as more information on errata and training/testing model resources.

    A big thank you and kudos to the creators of this dataset and relevant research:

    Gary B. Huang, Manu Ramesh, Tamara Berg, and Erik Learned-Miller. Labeled Faces in the Wild: A Database for Studying Face Recognition in Unconstrained Environments. University of Massachusetts, Amherst, Technical Report 07-49, October, 2007.

    Specifically for the deep-funneled version of the image data:

    Gary B. Huang, Marwan Mattar, Honglak Lee, and Erik Learned-Miller. Learning to Align from Scratch. Advances in Neural Information Processing Systems (NIPS), 2012.

    Banner photo by John Bakator on Unsplash

    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:15 去赚积分?
    • 675浏览
    • 2下载
    • 1点赞
    • 收藏
    • 分享