    该数据集是由Terry Sejnowski,现在在索尔克研究所和加利福尼亚大学圣地亚哥的基准集合。该数据集是与约翰·霍普金斯大学的钱宁合作开发的。

    Data Set Information:

    这是Ning Qian和Terry Sejnowski在研究中使用的数据集,他们使用神经网络预测某些球状蛋白质的二级结构[1]。这个想法是获取一个氨基酸的线性序列,并预测每个氨基酸在蛋白质中的二级结构。有三种选择:阿尔法螺旋,贝塔表,和随机线圈。该数据集既包含大量的训练数据,也包含一组独特的数据,可用于测试生成的网络。Qian和Sejnowski使用了一种类似Nettalk的方法,并报告测试集的准确率为64.3%,他们推测这是仅使用本地上下文所能做到的最好的方法。

    There is also a domain theory in the folder, donated and created by Jude Shavlik & Rich Maclin

    Attribute Information:


    Relevant Papers:

    Ning Qian and Terrnece J. Sejnowski (1988), "Predicting the Secondary Structure of Globular Proteins Using Neural Network Models" in Journal of Molecular Biology 202, 865-884.  Academic Press.
    Citation Request:

    Copyright (C) 1988 by Terrence J. Sejnowski.  Permission is hereby given to use the included data for non-commercial research purposes.  Contact the John Hopkins University, Cognitive Science Center, Baltimore MD, USA for information on commercial use.