Home
公开数据集
小语种数据
数据集交易

注册登录

个人信息


账户详情

图像标注


数据集管理

安全设置

今日排行

15条结果WiKi
73条结果Fac
73条结果道
13条结果车道
32条结果眼
2条结果21日
267条结果教育
36条结果APP

本月搜索

451条结果模型
3条结果互动
654条结果医学
35条结果传感
95条结果记
8条结果小说
35条结果视频数据
2条结果帕金森语音数据集

公开数据集

Home
公开数据集
自然语言处理词库

选择频道搜索

公开数据集
人工智能数据集交易平台
全球小语种平行语料数据库

相关数据分类

MNIST

NLP

553

问答

对话

手写数据集

词库

语料库

词袋

OCR识别数据集

英文文本

字体

字符

多语言处理

印地语

德语

阿拉伯语

手语

日语

波斯语

法语

知识库

成语

摘要

汉字

唤醒词

WikiText 英语词库包含1亿个词汇的英文词库数据 WikiText英语词库数据（TheWikiTextLongTermDependencyLanguageModelingDataset）WikiText长期依赖语言建模数据集是一个包含1亿...NLP Text

373.28M 1908

Stephen Merity

JRC Names 实体专有名词库 JRC-Names是一个高度多语言的命名实体资源，用于个人和组织名称（称为“实体”）。它包含大量名称列表及其多种拼写变体（单个人...NLP Text

762.56M 2781

欧盟科学中心

PubMed医学数据集：包含提取的 3984 个医学句子该数据集包含从 PubMed 摘要中提取的 3984 个医学句子，并标注了不同医学术语之间的关系。该数据集主要关注“治疗”和“病因”关...NLP Classification

9.4M 1719

appen

THUCTC 中文文本分类数据集 THUCTC(THU Chinese Text Classification)是由清华大学自然语言处理实验室推出的中文文本分类工具包，能够自动高效地实现用户自...OCR/Text Detection Classification

1.1G 3833

清华大学自然语言处理与社会人文计算实验室

处理单词和物体时的fMRI图像数据 OpenfMRI数据库（Poldrack等人，2013年；Poldrack和Gorgolewski，2015年）是一个使用MRI和EEG技术收集的人脑成像数据库。它从201...Image Search Classification

3.14G 1391

robot

英文单词识别图像数据集 Text Recognition 是一个文字识别图像数据，包含 900万张图像，图像中有 9万多个英文单词，可用于进行光学字符识别任务（Optic...Image Search Classification

9.41G 1153

robot

UJI笔字符（第2版）数据集 F. Prat(*), M. J. Castro(+), D. Llorens(*), A. Marzal(*), and J. M. Vilar(*)* Departamento de Lenguajes y Sistemas Infor...Computer Classification

2.03M 1501

University of California, Irvine

预训练的 word2vec 模型，英语维基百科数据 # DatasetThis dataset was created by RabidBear# ContentsIt contains the following files:...Others Classification

3.2G 618

RabidBear

fastText 预训练词向量数据集 fastText Pre-trained word vectors English...Others Classification

8.49G 818

kambarakun

英语词频，⅓ 百万网络上最常见的英语单词 This dataset contains the counts of the 333,333 most commonly-used single words on the English language web, as derived...Languages Classification

4.73M 1323

Rachael Tatman

Hubber模型，各行业文本数据 Hubber模型，各行业文本数据...NLP,MNIST Classification

473.41M 730

NinadMohite

谷歌Word2Vec模型,包括 300 万个单词和短语的词汇表的单词向量 It’s 1.5GB! It includes word vectors for a vocabulary of 3 million words and phrases that they trained on roughly 100 b...Computer Science,Programming Classification

3.64G 606

Umberto

FastText 一个用于学习词嵌入和文本分类的库 fastText is a library for learning of word embeddings and text classification created by Facebook's AI Research (FAI...NLP,Computer Science Classification

6.6G 1417

Jia Yang

帕依提提介绍联系我们用户服务协议隐私政策人才招聘商务合作

合作伙伴：北京人工智能高质量数据集服务平台亮数据数据堂

今日排行

本月搜索

Dataset Category

公开数据集

相关数据分类