返回主站|会员中心|保存桌面

数据堂（北京）科技股份有限公司

数据堂 (北京) 科技股份有限公司成立于2011年，作为全球领先的人工智能数据服务商，致力于通过高质量...

MoreOpen Dataset

More成品数据集

10万对中文大模型通用领域指令跟随SFT文本数据集【数据堂】应用场景：用于训练提升大模型的指令跟随性规模：10万格式：文本	2,608段减肥前后对比视频数据【数据堂】应用场景：人体行为检测；减肥前后对比规模：2,608段格式：视频	114万组中希伯来语平行语料数据【数据堂】应用场景：机器翻译规模：114万对中希伯来平行语料数据，中文平均句长19.4个字符格式：文本	501万组汉藏平行语料数据【数据堂】应用场景：机器翻译规模：501万对汉藏平行语料数据，汉语平均句长20.8个字符格式：文本
98万组中文-乌尔都语平行语料数据【数据堂】应用场景：机器翻译规模：98万组中文-乌尔都语平行语料数据，中文平均句长19.9个字符格式：文本	199万组中文-捷克语平行语料数据【数据堂】应用场景：机器翻译规模：199万组中文-捷克语平行语料数据格式：文本	198万组中文-波兰语平行语料数据【数据堂】应用场景：机器翻译规模：198万组中文-波兰语平行语料数据格式：文本	10万组汉维平行语料数据【数据堂】应用场景：机器翻译规模：10万对汉维平行语料格式：文本
38万日英平行语料数据【数据堂】应用场景：机器翻译规模：38万对日英平行语料数据格式：文本	134万组英韩平行语料数据【数据堂】应用场景：机器翻译规模：134万对英韩平行语料数据格式：文本	100万组中俄平行语料数据【数据堂】应用场景：机器翻译规模：100万对中俄平行语料数据，中文句长平均14.6个字符格式：文本	108万条英俄平行语料数据【数据堂】应用场景：机器翻译规模：108万对英俄平行语料数据格式：文本
744万条中印地平行语料数据【数据堂】应用场景：机器翻译规模：744万对中印地平行语料数据格式：文本	531万中德平行语料数据【数据堂】应用场景：机器翻译规模：531万对中德平行语料数据格式：文本	6.78小时中文女声模仿童声合成库【数据堂】应用场景：TTS 规模：6.78小时格式：音频	10.1小时中文女声客服合成库【数据堂】应用场景：语音合成规模：10.1小时格式：音频
19.46小时美国英语女声合成库【数据堂】应用场景：语音合成规模：19.46小时格式：音频	26.1小时中文女声客服合成库【数据堂】应用场景：语音合成规模：26.1小时格式：音频	150人中文客服平均音色合成库【数据堂】应用场景：语音合成规模：150人格式：音频	50人中英混读客服平均音色合成库【数据堂】应用场景：语音合成规模：50人格式：音频

管理入口| 返回顶部 ©2024 数据堂（北京）科技股份有限公司技术支持：帕依提提-人工智能数据集开放平台访问量:318