提供模型训练、微调、评估阶段的数据产品

DatasetSeek+ 探索数据无限可能
AI DATA
image image image image image image image image image image
image
PYTT AI

通用指令微调&RL

image
3213213

微调 / 22222条

image
测试数据集56

预训练 / 1000000条

image
测试数据集562

预训练 / 1000000条

image
图形推理数据集

微调 / 300000条

  • 图片文本对 /
  • json
  • 购买
image
测试数据集56

微调 / 1000000条

  • 图片文本对 /
  • txt
  • 购买
image
头脑风暴测试数据集

微调 / 10000条

image
法律行业指令数据集

微调 / 10000条

image
教育行业指令数据集

微调 / 9000条

image
推理测试数据集yuan01

微调 / 10条

image
问答测试数据集

微调 / 20000条

image
6种语言代码问答数据集

微调 / 2000万条

image
编码测试数据集

微调 / 10000条

image
提取测试数据集

微调 / 20000条

image
生成测试数据集

微调 / 1000条

image
重写测试数据集

微调 / 2000条

image
摘要测试数据集

微调 / 1000条

image
分类测试数据集

微调 / 2000条

image
翻译测试数据集

微调 / 9000条

image
角色扮演测试数据集

微调 / 6000条

PYTT AI

多模态推理数据专区

image
多模态推理测试数据集

模型评估 / 10000条

image
上下文推理测试数据集

模型评估 / 10000条

image
多模态安全能力测试数据集

模型评估 / 20000条

image
文本安全能力测试数据集

模型评估 / 10000条

image
多任务测试数据集

模型评估 / 10000条

  • 图片文本对 /
  • xml
  • 购买
image
安全性数据集

模型评估 / 10000条

image
翻译测试数据集

模型评估 / 1000条

image
基础理解测试数据集

模型评估 / 1000条

image
学科测试数据集

模型评估 / 2000条

image
问答测试数据集yuan03

预训练 / 2000条

image
医疗问答数据集

预训练 / 1000000条

image
问答测试数据集yuan03

预训练 / 2000条

image
医疗问答数据集

预训练 / 1000000条

image image image image image
PYTT AI

行业高质量语料数据库

image

全球文献数据

超过3亿的多学科文献数据

image
image

全球研究类数据

覆盖专利、科研、文献等数据

image
image image

全球小语种文本数据库

提供超过20个国家的预料数据

image
image

多行业专业预料数据

覆盖科技、金融、工业等多类型数据

image
image

多语言音频数据库

多语言音频文本数据,覆盖对话、口播等多种类型

image
image image image image image image image

模型能力评估&价值观评测

image
测试数据集

预训练 / 1000000条

image
信息提取测试数据集

模型评估 / 10000条

image
文本摘要测试数据集

模型评估 / 2000条

image
对话能力测试数据集

模型评估 / 20000条

image
文本分类测试数据集

模型评估 / 20000条

image
语言理解测试数据集

模型评估 / 20000条

image
知识问答测试数据集

模型评估 / 20000条

image
内容创作测试数据集

模型评估 / 60000条

image
逻辑推理测试数据集

模型评估 / 20000条

image
23213213123

微调 / 1000000条

image
学科测试数据集

模型评估 / 2000条

image
image
PYTT AI

提供模型训练-微调-评估数据定制

image

数据产品设计

基于模型及行业要求进行数据产品设计

image

原数据构建与治理

基于业务需求构建原数据,并进行数据基础治理

PYTT AI PYTT AI PYTT AI

image

数据增强与合成

基于原数据进行数据增强设计、数据合成,满足业务要求

image

数据评测与验证

对数据进行质量检测与模型小范围验证,增强数据可用性

image
image image
PYTT AI

为模型提供全栈训练的数据产品

为人工智能实验室、大模型企业提供经过验证的数据、评估和结果。

联系我们
image