Select Language

AI社区

公开数据集

相关搜索
您是不是在找?
今日排行
本周排行
本月排行
ChatGPT情绪分析,ChatGPT推文分类一个月 ChatGPT has been a major talk in the tech world. The tweets about chatgpt were gathered for a month and then the sentime...NLP Classification
35.27M 842
ChatGPT Twitter数据集 This dataset contains a collection of tweets with the hashtag #chatgpt. The tweets were scraped from Twitter and cover a...NLP Classification
0.4M 1011
Tweets on ChatGPT 数据集包ChatGPT上的推文 ChatGPT is a chatbot developed by OpenAI. It was launched in November 2022. The dataset contains tweets on #ChatGPT from...NLP Classification
133.86M 340
LFQA患者医生对话数据 What is Diagnose me?Diagnose me is an LFQA dataset of dialogues between patients and doctors based on factual conversati...NLP,Medical Classification
433.32M 268
医患对话 任务简介:针对互联网医患在线对话问诊的记录,该任务的目标是同时预测症状的归一化标签和类别标签。症状有共300余种归一化后的...NLP,Medical Classification
5.25M 301
2017病理切片识别AI挑战赛 初赛测试集 2017病理切片识别AI挑战赛 初赛测试集...Rail Transport 2D Instance Segmentation
1.85G 65
2017BOT大赛病理切片识别AI挑战赛初赛训练集(选手使用,压缩) 2017BOT大赛病理切片识别AI挑战赛初赛训练集(选手使用,压缩)...Rail Transport 2D Instance Segmentation
5.88G 56
GitHub NLP分析的标题和描述 超过800万个GitHub发布了标题和描述 Over 8 million GitHub issue titles and descriptions from 2017. Prepared from instructions at How To Create Data Products...NLP,Software Classification
2.85G 387
手写验证 XAI-AND数据集是一个公开的笔迹验证数据集,由15518个“AND”图像片段提取自CEDAR Letter Dataset[12],由1567位作家撰写。每个...OCR/Text Detection Image Caption
31.23M 63
SemanticKITTI 数据集,使用 LiDAR 序列进行义场景理解的数据集 SemanticKITTI 是自动驾驶领域的权威数据集,它基于 KITTI 数据集,对 KITTI Vision Odometry Benchmark 中的所有序列都进行了标...Action/Event Detection,Deep Learning 2D Box
82.8G 788
HAKE-HICO 义分割数据集 HAKE-HICO 是由上海交通大学发布,基于 HICO 数据集进行的改良版。该数据集的图像文件使用了 HICO 数据集中原始图片文件,在此基...Action/Event Detection,Deep Learning 2D Box
7.4G 440
HICO 图像义分割数据集 HICO 数据集是由密歇根大学发布,包含图片文件与一系列二进制数组用以表示标签,以二进制数来表示该图像是否存在这一系列行为动...Deep Learning 2D Box
7.4G 477
苏州科技大学超话情感分析 1000条数据 苏州科技大学超话情感分析内容情感得分分析结果#随手拍#苏农苏农0.436778733消极有话快说0.687524065积极马上第14周了,书本费不...NLP Text
0.09M 84
新闻分类数据集sample(thu) 新闻分类数据集sample(thu)...NLP Text
12M 639
百科类问答json版,含有150万个预先过滤过的、高质量问题和答案 本数据集含有150万个预先过滤过的、高质量的百科类问题和答案。数据集总共有492个类别,其中频率达到或超过10次的类别有434个。...NLP Text
1.5G 634
Deepfake检测挑战,通过面部或音操作识别视频 数据量高达472GB,包括了119,197个视频,每个视频时长都为10秒,但是帧率从15~30fps不等,分辨率也从320x240~3840x216...Person,Face 2D Box
471.84G 454
CN-Celeb 一个室外收集的大规模说话人识别数据集 This is a large-scale speaker recognition dataset collected 'in the wild'. The dataset consists of two subsets,...Common Audio
29.66G 1009
街景房屋编号(SVHN)数据集,可用于对象识别算法的真实图像数据集 SVHN是一个用于开发机器学习和对象识别算法的真实图像数据集,对数据预处理和格式化的要求最低。它可以被视为与MNIST在风格上相...NLP,OCR/Text Detection,Business,Image Search 2D Box
3.91G 1270
NEOCR:自然环境OCR数据集,包含659幅真实世界的图像 NEOCR数据集包含659幅真实世界的图像,带有5238个带注释的边界框(文本字段)。这些图像是由多人独立于数据集拍摄的,因此数据集...NLP,Arts and Entertainment 2D Box,Classification
1.31G 478
街景文本(SVT)数据集,来自谷歌街景的图像数据 The Street View Text (SVT) dataset was harvested from Google Street View. Image text in this data exhibits high variabil...NLP,Energy 2D Box,Classification
112.7M 812