Select Language

公开数据集

酵母数据集

酵母数据集

Scene:

Life

Data Type:

Classification
所需积分:15 去赚积分?
  • 437浏览
  • 0下载
  • 1点赞
  • 收藏
  • 分享

Data Preview ? 17M

    Data Structure ?

    *数据结构实际以真实数据为准

    测属性:蛋白质定位位点。(非数字)。

    下面的参考文献描述了该数据集的前身及其开发。它们还提供基于规则的专家系统使用该版本数据集进行分类的结果(非交叉验证)。

    参考文献:“预测革兰氏阴性细菌蛋白质定位位点的专家系统”,Kenta Nakai&Minoru Kanehisa,《蛋白质:结构、功能和遗传学》11:95-1101991。

    参考文献:“预测真核细胞蛋白质定位位点的知识库”,Kenta Nakai&Minoru Kanehisa,基因组学14:897-911,1992。


    Attribute Information:

    1.序列名称:SWISS-PROT数据库的登录号
    2.mcg:McGeoch的信号序列识别方法。
    3.gvh:von Heijne的信号序列识别方法。
    4.alm:ALOM膜跨越区域预测程序的得分。
    5.mit:线粒体和非线粒体蛋白质N端区(20个残基长)氨基酸含量的判别分析得分。
    6.erl:存在“HDEL”亚串(被认为是内质网内腔滞留的信号)。二进制属性。
    7.pox:C末端的过氧化物酶体靶向信号。
    8.vac:液泡蛋白和细胞外蛋白氨基酸含量的判别分析得分。
    9nuc:核蛋白和非核蛋白的核定位信号判别分析得分。


    Relevant Papers:

    Paul Horton & Kenta Nakai, "A Probablistic Classification System for Predicting the Cellular Localization Sites of Proteins", Intelligent Systems in Molecular Biology, 109-115. St. Louis, USA 1996.
    [Web link]

    The references below describe a predecessor to this dataset and its  development. They also give results (not cross-validated) for classification by a rule-based expert system with that version of the dataset:

    Kenta Nakai & Minoru Kanehisa, "Expert Sytem for Predicting Protein Localization Sites in Gram-Negative Bacteria",  PROTEINS: Structure, Function, and Genetics 11:95-110, 1991.

    Kenta Nakai & Minoru Kanehisa, "A Knowledge base for Predicting Protein Localization Sites in Eukaryotic Cells", Genomics 14:897-911, 1992.
    [Web link]



    0相关评论
    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。