Select Language

AI社区

公开数据集

TREC2005-2007垃圾邮件数据集 TREC 2006 Spam Track Public Corpora:https://plg.uwaterloo.ca/~gvcormac/treccorpus06/about.html是一个公开的垃圾邮件语料...NLP,International Relations Classification,Text
1.6G 431
垃圾邮件数据集 Social-Spammer Social-Spammer-Heterogeneous 数据集是从 tagged.com 网站上收录的,它包含五百六十万的用户和八千五百万用户间的联系。数据集...OCR/Text Detection Classification
3.81G 650
Kitsune网络攻击数据集数据集 Data Set Information:==== Overview ====The are 9 network capture datasets in total, listed below. Viol. is the security...Computer Classification
17.7G 940
2019数据智能算法大赛-商家客户购买转化率预测数据集 购买转化率是品牌商家在电商平台运营时最关注的指标之一,本次大赛中云积互动提供了品牌商家的历史订单数据,参赛选手通过人工智...Business Classification
38.9M 412
Olist 的巴西电子商务公共数据集 该数据集由巴西市场最大的百货公司 Olist 慷慨提供。 Olist 将巴西各地的小型企业轻松连接到渠道,只需一份合同。这些商家可以通...Business Text
42.65M 371
大商场销售数据集,用于Big Mart 销售预测 Big Mart 的数据科学家收集了 2013 年不同城市 10 家门店的 1559 种产品的销售数据。此外,还定义了每个产品和商店的某些属性。...Business Text
306K 974
HARRISON 社交媒体图像数据集 HARRISON 是一个对Facebook、Twitter、Instagram社交媒体中的图片进行标签标注(tag)的图像数据集,包括 57383 张图片,每张图...Image Data Classification
5.58G 510
二十个新闻组数据集 Original Owner and Donor:Tom MitchellSchool of Computer Science Carnegie Mellon Universitytom.mitchell '@' cmu.e...Machine Learning Ethics Classification
18.3M 448
印度新闻标题数据集 ContextThis news dataset is a persistent historical archive of noteable events in the Indian subcontinent from start-200...OCR/Text Detection Classification
246.96M 373
宠物精灵图像数据集 从第1代到第7代的所有神奇宝贝的图像。来自两个不同口袋妖怪的新进化形式。从图像中预测口袋妖怪的主要和次要类型。根据预先发展...Image Search Classification
2.47M 613
希拉里邮件门数据集 2015年,希拉里被卷入了一场邮件门事件,原因是她在任职国务卿的时候,将个人邮件存储在非政府的服务器中。一些政策的专家以及她...OCR/Text Detection Classification
13.5M 545
谷歌应用商店应用信息数据集 Play商店应用数据具有巨大的潜力,可以推动应用制作业务取得成功。可以为开发人员提供可操作的见解,以便开发和捕获Android市场...OCR/Text Detection Classification
1.94M 439
用于推荐系统和协同过滤研究的Jester数据集 该数据集包含3个子数据集:dataset 1、dataset 3、dataset 4,如下所述:Dataset 1: 4.1 million ratingsValues from (-10.00 to...OCR/Text Detection Classification
16.77M 379
图书评分数据集-Book-Crossings Book-Crossings是由Cai-Nicolas Ziegler根据 bookcrossing.com 的数据编写的图书评分数据集。 它包含90000个用户的270000本书的1...OCR/Text Detection Classification
50.65M 463
“美味书签"网络书签数据集 该数据集包含社交网络,书签和标签信息来自美味社交书签系统的2K用户集。http://www.delicious.com该数据集在第二届国际研讨会上...OCR/Text Detection Classification
13.3M 386
亚马逊食品评论数据集, 50万条食品评论 Amazon Fine Food Reviews 数据集是对来自亚马逊的精美食品的评论组成的数据集,包含截止 2012 年 10 月份在 Amazon 网站上 5684...Action/Event Detection Classification
242.11M 473
20W微博用户的数据 2015年收集了20W新浪微博用户的公开数据。数据来自GitHub。...Action/Event Detection Classification
34.8M 555
乌云网公开漏洞信息数据集 数据格式为Sqlite格式。采集乌云已确认漏洞和已公开漏洞的状态、厂商、Rank等数据用于分析哪些是良心厂商。网上也有一个镜像网站...OCR/Text Detection Classification
2.3M 486
安然公司电子邮件数据集 该数据集由 CALO 项目(学习和组织的认知助手)收集和准备。它包含来自大约 150 名用户(主要是安然的高级管理人员)的数据,这...MNIST Classification
422.7M 349
MERL梅尔购物数据集 MERL 购物数据集由 106 个视频组成,每个视频的序列大约为 2 分钟。这些视频来自一个固定的头顶摄像头,向下看人们在杂货店购物...Business Classification
1.72G 442