提供模型训练、微调、评估阶段的数据产品

DatasetSeek+ 探索数据无限可能
AI DATA
image image image image image image image image image image
image
PYTT AI

多类型通用训练类数据

image
信息处理类英文问答数据集

预训练 / 98000条

image
财税问答数据集

预训练 / 1500000条

image
创作类英文问答数据集

预训练 / 28000条

image
知识问答类英文问答

预训练 / 210000条

image
数学类英文问答数据集

预训练 / 150000条

image
老挝语电子书数据集

预训练 / 1000条

image
阿拉伯语电子书数据集

预训练 / 15500条

image
越南语电子书数据集

预训练 / 10000条

image
西班牙语电子书数据集

预训练 / 7000条

image
葡萄牙语电子书数据集

预训练 / 7000条

image
C语言编程数据集

预训练 / 690000条

image
Go语言编程数据集

预训练 / 1550000条

image
Java语言编程数据集

预训练 / 7500000条

image
Objective-C语言编程数据集

预训练 / 1450000条

image
C++语言编程数据集

预训练 / 1450000条

image
C#语言编程数据集

预训练 / 3900000条

image
JavaScript语言编程数据集

预训练 / 4000000条

image
CSS语言编程数据集

预训练 / 60000条

image
Shell语言编程数据集

预训练 / 350000条

image
知识百科-生活小窍门数据集

预训练 / 50000条

image
知识百科-个人护理数据集

预训练 / 178000条

image
知识百科-健康知识数据集

预训练 / 650000条

image
知识百科-烹饪技巧数据集

预训练 / 200000条

image
知识百科-生活常识数据集

预训练 / 250000条

image
知识百科-生活护理数据集

预训练 / 700000条

image
零售商品包装图数据集

预训练 / 30000条

image
办事类专项工作政务数据集

预训练 / 10000条

image
实拍零售商品图数据集

预训练 / 100000条

image
静态游戏特效图数据集

预训练 / 50000条

image
通知公告和新闻类政务数据集

预训练 / 10000000条

image
2009年-2024年金融研究报告数据集

预训练 / 2500000条

image image image image image
PYTT AI

行业高质量语料数据库

image

全球文献数据

超过3亿的多学科文献数据

image
image

全球研究类数据

覆盖专利、科研、文献等数据

image
image image

全球小语种文本数据库

提供超过20个国家的预料数据

image
image

多行业专业预料数据

覆盖科技、金融、工业等多类型数据

image
image

多语言音频数据库

多语言音频文本数据,覆盖对话、口播等多种类型

image
image image image image image image image

模型能力评估&性能测试

image
代码解释问答数据集

模型评估 / 20000条

image
代码生成问答数据集

模型评估 / 20000条

image
单元测试问答数据集

模型评估 / 20000条

image
代码转换问答数据集

模型评估 / 20000条

image
代码注释问答数据集

模型评估 / 20000条

image
代码修复问答数据集

模型评估 / 20000条

image
代码优化问答数据集

模型评估 / 20000条

image
代码补全问答数据集

模型评估 / 20000条

image
代码检查问答数据集

模型评估 / 20000条

image
image
PYTT AI

提供模型训练-微调-评估数据定制

image

数据产品设计

基于模型及行业要求进行数据产品设计

image

原数据构建与治理

基于业务需求构建原数据,并进行数据基础治理

PYTT AI PYTT AI PYTT AI

image

数据增强与合成

基于原数据进行数据增强设计、数据合成,满足业务要求

image

数据评测与验证

对数据进行质量检测与模型小范围验证,增强数据可用性

image
image image
PYTT AI

为模型提供全栈训练的数据产品

为人工智能实验室、大模型企业提供经过验证的数据、评估和结果。

联系我们
image