公开数据集

相关搜索
您是不是在找?
今日排行
本周排行
本月排行
腾讯AI Lab开源大规模高质量中文词向量数据 腾讯AI Lab此次公开的中文词向量数据包含800多万中文词汇,其中每个词对应一个200维的向量。相比现有的中文词向量数据,腾讯AI L...NLP,MNIST Classification
39.4G 1094
中文预训练词向量数据集 该项目提供使用不同表征(稀疏和密集)、上下文特征(单词、n-gram、字符等)以及语料库训练的中文词向量(嵌入)。在这里,你可...MNIST Classification
354K 1004
空间向量网络lg #数据集该数据集由MatthewHonnibal创建,发布于CC by-SA 3.0目录下。它包含以下文件:...Others Classification
1.24G 772
FCC网络中立评论向量化样本 Others Classification
622.32M 693
fastText 预训练词向量数据集 fastText Pre-trained word vectors English...Others Classification
8.49G 747
支持向量机的图像训练 Arts and Entertainment Classification
87.55M 1166
谷歌新闻向量 Internet Classification
3475.44M 617
手套词向量 Others Classification
5384.67M 1063
emb向量 Others Classification
7357.75M 1229
谷歌Word2Vec模型,包括 300 万个单词和短语的词汇表的单词向量 It’s 1.5GB! It includes word vectors for a vocabulary of 3 million words and phrases that they trained on roughly 100 b...Computer Science,Programming Classification
3.64G 566
斯坦福大学的GloVe预训练的单词向量 GloVe is an unsupervised learning algorithm for obtaining vector representations for words. Training is performed on agg...Computer Science,Sports,Retail and Shopping Classification
989.9M 757
Erowid经验报告word2vec向量 Online Communities,NLP,Psychology,Clustering Classification
19.95M 373
快速文本对齐单词向量 Education,NLP Classification
18167.9M 1152
4316.7M 1012
4313.21M 983
Facebook发布的300维预训练FastText英语单词向量 300-dimensional pretrained FastText English word vectors released by Facebook.The first line of the file contains the nu...NLP,Arts and Entertainment,Games Classification
4.52G 563
手套6B 200d预训练词向量 Business,NLP Classification
661.31M 549
GloVe是一种无监督的学习算法 用于获得单词的向量表示 GloVe 是一种无监督学习算法,用于获取单词的向量表示。训练是在来自语料库的聚合全局词-词共现统计数据上执行的,结果表示展示...NLP,Deep Learning,Education Classification
1.5G 1228
Facebook 发布的300维预训练,在 Common Crawl 上训练的200万个词向量 300-dimensional pretrained FastText English word vectors released by Facebook.The first line of the file contains the nu...NLP,Arts and Entertainment Classification
650M 662