自然语言处理
  • 医患对话

    5.25M

    1183

    4

    NLP,Medical

    医患对话
    Classification
    Fudan University
  • GitHub NLP分析的标题和描述 超过800万个GitHub发布了标题和描述

    2.85G

    914

    0

    NLP,Software

    GitHub NLP分析的标题和描述 超过800万个GitHub发布了标题和描述
    Classification
    David Shinn
  • 手写验证

    31.23M

    831

    0

    OCR/Text Detection

    手写验证
    Image Caption
    Mihir Chauhan and Mohammad Abuzar Shaikh and Sargur N. Srihari
  • 苏州科技大学超话情感分析 1000条数据

    0.09M

    814

    0

    NLP

    苏州科技大学超话情感分析 1000条数据
    Text
    xiaotian
  • 新闻分类数据集sample(thu)

    12M

    1157

    0

    NLP

    新闻分类数据集sample(thu)
    Text
    飞桨PaddleHub
  • 百科类问答json版,含有150万个预先过滤过的、高质量问题和答案

    1.5G

    1541

    6

    NLP

    百科类问答json版,含有150万个预先过滤过的、高质量问题和答案
    Text
    Thomas-yanxin
  • 街景房屋编号(SVHN)数据集,可用于对象识别算法的真实图像数据集

    3.91G

    2314

    3

    NLP,OCR/Text Detection,Business,Image Search

    街景房屋编号(SVHN)数据集,可用于对象识别算法的真实图像数据集
    2D Box
    iapr-tc11
  • NEOCR:自然环境OCR数据集,包含659幅真实世界的图像

    1.31G

    1104

    0

    NLP,Arts and Entertainment

    NEOCR:自然环境OCR数据集,包含659幅真实世界的图像
    2D Box,Classification
    Robert Nagy
  • 街景文本(SVT)数据集,来自谷歌街景的图像数据

    112.7M

    1819

    0

    NLP,Energy

    街景文本(SVT)数据集,来自谷歌街景的图像数据
    2D Box,Classification
    Kai Wang
  • KAIST场景文本数据库

    355M

    1091

    2

    NLP

    KAIST场景文本数据库
    Classification
    Prof. Jin Hyung Kim Seonghun Lee
  • MSRA文本检测500数据库(MSRA-TD500)

    96.05M

    1589

    3

    NLP

    MSRA文本检测500数据库(MSRA-TD500)
    2D Box
    Cong Yao
  • 自然场景图像的合成文本,包含80万张图像和大约800万个合成单词实例

    37.9G

    848

    1

    NLP,Animal

    自然场景图像的合成文本,包含80万张图像和大约800万个合成单词实例
    2D Box
    Ankush Gupta, Andrea Vedaldi and Andrew Zisserman
  • IIIT 5K word数据集,包含广告牌、招牌、门牌号、门牌、电影海报等查询词

    101M

    926

    0

    NLP

    IIIT 5K word数据集,包含广告牌、招牌、门牌号、门牌、电影海报等查询词
    Classification
    Anand Mishra
  • 国产剧豆瓣评论数据

    3.66M

    754

    2

    NLP

    国产剧豆瓣评论数据
    2D Box
    sam
  • 企业重大合同数据

    53.36M

    856

    0

    NLP

    企业重大合同数据
    N/A
    lopo_hui
  • 文字袋数据集 可用于了解路透社的哪些文章是关于“企业收购”的

    1.21M

    1138

    4

    NLP

    文字袋数据集 可用于了解路透社的哪些文章是关于“企业收购”的
    Classification
    University of California, Irvine
  • 僧伽罗语数字词汇(1.0版),字母A到M 数据集

    9.83M

    860

    1

    NLP

    僧伽罗语数字词汇(1.0版),字母A到M 数据集
    Classification
    Bianchini, Francesco,Gazzard, Katherine
  • 僧伽罗语数字词汇(2.0版),字母A到M

    9.88M

    908

    1

    NLP

    僧伽罗语数字词汇(2.0版),字母A到M
    Classification
    Bianchini, Francesco,Gazzard, Katherine
  • squad数据集

    34M

    1048

    0

    Action/Event Detection

    squad数据集
    Text
    斯坦福大学
  • MIMIC III 数据集

    66.62M

    854

    0

    Diseases

    MIMIC III 数据集
    Text
    MIKI