Select Language

AI社区

公开数据集

MSRA文本检测500数据库(MSRA-TD500)

MSRA文本检测500数据库(MSRA-TD500)

96.05M
1109 浏览
4 喜欢
3 次下载
0 条讨论
NLP 2D Box

MSRA文本检测500数据库(MSRA-TD500),作为评估文本检测算法的基准,目的是跟踪自然图像中文本检测领域的最新进展,尤其是检测......

数据结构 ? 96.05M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    MSRA文本检测500数据库(MSRA-TD500),作为评估文本检测算法的基准,目的是跟踪自然图像中文本检测领域的最新进展,尤其是检测任意方向文本的进展。
    MSRA文本检测500数据库(MSRA-TD500)包含500幅自然图像,使用袖珍相机从室内(办公室和商场)和室外(街道)场景中拍摄。室内图像主要是标志牌、门牌和警示牌,室外图像主要是复杂背景下的引导牌和广告牌。图像的分辨率从1296x864到1920x1280不等。
    由于文本的多样性和图像背景的复杂性,该数据集具有挑战性。文本可以使用不同的语言(中文、英文或两者混合)、字体、大小、颜色和方向。背景可能包含植被(例如树木和灌木丛)和重复图案(例如窗户和砖块),它们与文本没有太大区别。
    数据集分为两部分:训练集和测试集。训练集包含从原始数据集中随机选择的300幅图像,其余200幅图像构成测试集。该数据集中的所有图像都进行了完全注释。该数据集中的基本单位是文本行(见图1),而不是ICDAR数据集中使用的单词,因为很难根据间距将中文文本行划分为单个单词;即使对于英文文本行,在没有高级信息的情况下执行单词分割也是非常重要的。

    metadata and Ground Truth Data

    地面真相生成过程如图2所示。虽然目前的文本检测评估方法只针对水平文本,但我们提出了一种新的评估协议(详见[1])。在我们的协议中使用最小面积矩形,因为它们(图2(b)中的绿色矩形)比轴对齐矩形(图2(b)中的红色矩形)更紧。

     

    Figure 2. Ground truth generation. (a) Human annotations. The annotators are required to locate and bound each text line using a four-vertex polygon (red dots and yellow lines). (b) Ground truth rectangles (green). The ground truth rectangle is generated automatically by fitting a minimum area rectangle using the polygon.

    特别是,为了适应文本检测算法难以处理的困难文本(太小、被遮挡、模糊或被截断),每个被认为是困难的文本实例都会被附加一个“困难”标签(请注意图1中的红色矩形)。对此类困难文本的检测失误将不会受到惩罚。

    Format of the ground truth files

    数据库中的每个图像对应一个地面真相文件,其中每行记录一个文本的信息。地面真相文件的格式如图3所示。


    Figure 3. Illustration of the ground truth file format. The index field can be ignored. The difficult label is “1” if the text is labeled as “difficult” and “0” otherwise.

    Related Tasks Text Detection in Natural Images

    Purpose: To localize the positions and estimate the extents of texts in natural images

    importance: Understanding text information embedded in natural scene is of great importance, as it has a large number of applications, for instance, image understanding, image and video search, geo-locating, and navigation

    evaluation Protocol: The evaluation protocol is stated in detail in [1].

    References

    C. Yao, X. Bai, W. Liu, Y. Ma and Z. Tu. Detecting Texts of Arbitrary Orientations in Natural Images. CVPR 2012 (PDF)

    Contact Author

    Cong Yao
    Huazhong University of Science and Technology
    Email: yaocong2010@gmail.com


    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:10 去赚积分?
    • 1109浏览
    • 3下载
    • 4点赞
    • 收藏
    • 分享