Select Language

AI社区

公开数据集

频率最高的9933个最常用汉字数据集

频率最高的9933个最常用汉字数据集

1M
545 浏览
0 喜欢
4 次下载
0 条讨论
MNIST Classification

数据结构 ? 1M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    数据的收集源于reddit用户areyde的一个简单的问题:“学习所有汉字意味着什么?”可以简化为“您可以为学习汉字制定什么目标?”

    在他看来,似乎最有用的是汉字出现的的频率。因此,他根据语料库 http://lingua.mtsu.edu/chinese-computing/statistics/char/list.php?Which=MO ,列出了所有的9,933个字符 。在本数据集中的每个汉字字符,其实都存储了以下信息:语料库中的出现次数,占该语料库的计算百分比,部首和字典代码,笔划数,发音和含义(如果存在)。

    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:0 去赚积分?
    • 545浏览
    • 4下载
    • 0点赞
    • 收藏
    • 分享