公开数据集

MSRA文本检测500数据库（MSRA-TD500）

96.05M

1889 浏览

4 喜欢

4 次下载

0 条讨论

NLP 2D Box

MSRA文本检测500数据库（MSRA-TD500），作为评估文本检测算法的基准，目的是跟踪自然图像中文本检测领域的最新进展，尤其是检测......

数据介绍
文件预览
相关论文
Code
分享讨论(0)
使用声明

启动Notebook开发

数据结构 ? 96.05M

* 以上分析是由系统提取分析形成的结果，具体实际数据为准。

README.md

MSRA文本检测500数据库（MSRA-TD500），作为评估文本检测算法的基准，目的是跟踪自然图像中文本检测领域的最新进展，尤其是检测任意方向文本的进展。
MSRA文本检测500数据库（MSRA-TD500）包含500幅自然图像，使用袖珍相机从室内（办公室和商场）和室外（街道）场景中拍摄。室内图像主要是标志牌、门牌和警示牌，室外图像主要是复杂背景下的引导牌和广告牌。图像的分辨率从1296x864到1920x1280不等。
由于文本的多样性和图像背景的复杂性，该数据集具有挑战性。文本可以使用不同的语言（中文、英文或两者混合）、字体、大小、颜色和方向。背景可能包含植被（例如树木和灌木丛）和重复图案（例如窗户和砖块），它们与文本没有太大区别。
数据集分为两部分：训练集和测试集。训练集包含从原始数据集中随机选择的300幅图像，其余200幅图像构成测试集。该数据集中的所有图像都进行了完全注释。该数据集中的基本单位是文本行（见图1），而不是ICDAR数据集中使用的单词，因为很难根据间距将中文文本行划分为单个单词；即使对于英文文本行，在没有高级信息的情况下执行单词分割也是非常重要的。

metadata and Ground Truth Data

地面真相生成过程如图2所示。虽然目前的文本检测评估方法只针对水平文本，但我们提出了一种新的评估协议（详见[1]）。在我们的协议中使用最小面积矩形，因为它们（图2（b）中的绿色矩形）比轴对齐矩形（图2（b）中的红色矩形）更紧。

Figure 2. Ground truth generation. (a) Human annotations. The annotators are required to locate and bound each text line using a four-vertex polygon (red dots and yellow lines). (b) Ground truth rectangles (green). The ground truth rectangle is generated automatically by fitting a minimum area rectangle using the polygon.

特别是，为了适应文本检测算法难以处理的困难文本（太小、被遮挡、模糊或被截断），每个被认为是困难的文本实例都会被附加一个“困难”标签（请注意图1中的红色矩形）。对此类困难文本的检测失误将不会受到惩罚。

Format of the ground truth files

数据库中的每个图像对应一个地面真相文件，其中每行记录一个文本的信息。地面真相文件的格式如图3所示。

Figure 3. Illustration of the ground truth file format. The index field can be ignored. The difficult label is “1” if the text is labeled as “difficult” and “0” otherwise.

Related Tasks Text Detection in Natural Images

Purpose: To localize the positions and estimate the extents of texts in natural images

importance: Understanding text information embedded in natural scene is of great importance, as it has a large number of applications, for instance, image understanding, image and video search, geo-locating, and navigation

evaluation Protocol: The evaluation protocol is stated in detail in [1].

References

C. Yao, X. Bai, W. Liu, Y. Ma and Z. Tu. Detecting Texts of Arbitrary Orientations in Natural Images. CVPR 2012 (PDF)

Contact Author

Cong Yao
Huazhong University of Science and Technology
Email: yaocong2010@gmail.com

暂无相关内容。

分享你的想法

去分享你的想法~~

全部内容

欢迎交流分享

开始分享您的观点和意见，和大家一起交流分享.

数据使用声明：

一、数据来源与展示说明：

1、该数据来自于互联网数据采集或服务商的提供，本平台为用户提供数据集的展示与浏览。
2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
3、数据集基本信息来自数据原地址或数据提供方提供的信息，如数据集描述中有描述差异，请以数据原地址或服务商原地址为准。

二、所有权说明：

1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。

三、数据转载说明：

1、如您需要转载本站数据，请保留原数据地址及相关版权声明。

四、侵权与处理说明：

1、如本站中的部分数据涉及侵权展示，请及时联系本站，我们会安排进行数据下线。

所需积分：

10 去赚积分？

1889浏览
4下载
4点赞
收藏
分享

今日排行

本月搜索

Dataset Category