Select Language

AI社区

人工智能数据集交易平台

14,980张8种语言PPT OCR数据【数据堂】

14,980张8种语言PPT OCR数据【数据堂】

117 浏览
0 喜欢
0 条评论
14,980张 图像 可用于多国语言OCR任务

数据规模14,980张,8种语言采集环境包括会议室(会场)、会议厅语言种类法文,韩文,日文,西班牙文,德文,意大利文,葡萄牙文,......

README.md

  • 数据规模

  • 14,980张,8种语言

  • 采集环境

  • 包括会议室(会场)、会议厅

  • 语言种类

  • 法文,韩文,日文,西班牙文,德文,意大利文,葡萄牙文,俄文

  • 采集多样性

  • 涵盖多种场景、多种语言、不同拍摄角度、不同拍摄距离、不同光照条件

  • 采集设备

  • 手机

  • 采集角度

  • 正面,斜视(左、右)、仰视

  • 数据格式

  • 图像格式为.jpg,标注文档格式为.json

  • 标注内容

  • 行级四边形标注、行级四边形转写

  • 准确率

  • 四边形框顶点偏差不超过五个像素为正确检测,检测框精度不低于95%;文本转写精度不低于95%



0相关评论
数据堂(北京)科技股份有限公司 数据堂(北京)科技股份有限公司 VIP [VIP第1年]