Select Language

AI社区

公开数据集

注释的命名实体识别数据集,用于预测化学实体的命名实体识别数据集

注释的命名实体识别数据集,用于预测化学实体的命名实体识别数据集

39.48M
375 浏览
0 喜欢
1 次下载
0 条讨论
Business Classification

This corpus is divided into training, validation and evaluation. All of them contains tokens extracted using ChemTok app......

数据结构 ? 39.48M

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    This corpus is divided into training, validation and evaluation. All of them contains tokens extracted using ChemTok applied on CHEMDNER corpora in IOB annotation. File contains the following content.

    • PMID_Type: PMID is Public Medical Identifier and Type is the Type of Medical Text i.e., Title (T) or Abstract(A).

    • Sentence_Index: It is the sentence index of each sentence in Medical text.

    • Token: It is the token extracted using ChemTok from each given sentence.

    • Tag: It is an IOB annotation given to the token.

    NOTE: Please refer README guide from the original corpora or links provided for in-depth information on this subject.

    Acknowledgements

    Krallinger, M. et al. The CHEMDNER corpus of chemicals and drugs and its annotation principles. J Cheminform, 2014


    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:8 去赚积分?
    • 375浏览
    • 1下载
    • 0点赞
    • 收藏
    • 分享