Select Language

AI社区

公开数据集

MSParS (V1.0):用于基于知识的问答的多视角语义解析数据集 MSParS是一个用于开放领域语义解析任务的大规模数据集。整个数据集由81,826个样本组成,这些样本由以英语为母语的人注释。我们对...MNIST Classification
4.94M 296
Chinese Word Analogy Lists 汉语词语类比数据集 Most word embedding methods take a word as a basic unit and learn embeddings according to words’ external contexts, ign...MNIST Classification
121.1M 284
67G 310
常识问答文本数据集(CommonsenseQA) CommonsenseQA 是一个新的多项选择问答数据集,需要不同类型的常识知识来预测正确答案。它包含 12,102 个问题,其中一个正确答案...MNIST Classification
1.04M 862
中文预训练词向量数据集 该项目提供使用不同表征(稀疏和密集)、上下文特征(单词、n-gram、字符等)以及语料库训练的中文词向量(嵌入)。在这里,你可...MNIST Classification
354K 358
多语概念词典 (1)中文概念词典(Chinese Concept Dictionary,CCD)实现了对WordNet1.6版本英语概念的汉语对应,概念总数接近10万(其中的词...MNIST Classification
7.8M 258
现代汉语语法信息词典 现代汉语语法信息词典,含8万词的360万项语法属性描述。数据引用:@data{DVN/EDQWIL_2017,author={Yu,ShiwenandZhu,Xuefeng},publ...MNIST Classification
68.5M 344
AI2推理挑战赛(ARC)2018数据集 ARC数据集包含从各种来源提取的7,787项科学考试问题,包括由AI2附属研究合作伙伴授权提供的科学问题。这些是纯文本的英语考试题...MNIST Classification
649.3M 307
实体和关系词标注数据集 实体和关系词标注数据集...MNIST Classification
275M 285
10W+知乎用户数据集 来自北京大学开放研究数据平台,利用scrapy作为工具,爬取了知乎平台上十万余条用户个人主页数据,涵盖了用户性别、所在地、个性...MNIST Classification
204.6M 333
69M 379
10.4G 320
科学知识图谱数据(SciKG),由概念、专家和论文组成 SciKG是一个以科研为中心的大规模知识图谱,目前包含计算机科学领域,由概念、专家和论文组成。其中,科技概念及其关系是从ACM计...NLP,MNIST Classification
1.3G 521
90.17M 467
227M 410
Quora 问答数据集 Quora 是一个获取和分享知识的问答平台,它能够促进人们互相学习,以更好地认识这个世界。每个月有超过 1 亿的人访问 Quora,所...NLP,MNIST Classification
381.2M 431
微软WikiQA语料库 MNIST Classification
0M 400
0M 284
微软软研究院问答语料库 MNIST Classification
0M 302
MSR抽象文本压缩数据集 MNIST Classification
17.5M 310