Select Language

公开数据集

乳腺癌美国威斯康星州(诊断)数据集

乳腺癌美国威斯康星州(诊断)数据集

Scene:

Medical

Data Type:

Classification
所需积分:10 去赚积分?
  • 706浏览
  • 12下载
  • 0点赞
  • 收藏
  • 分享

贡献者查看主页

小小程序员

致力于人工智能业务的研究、数据集处理。

Data Preview ? 49K

    Data Structure ?

    *数据结构实际以真实数据为准

    预测癌症是良性还是恶性

    特征是从乳腺肿块的细针抽吸(FNA)的数字化图像计算得出的。它们描述了图像中存在的细胞核的特征。
    在3维空间中描述的空间如下:[KP Bennett和OL Mangasarian:“两个线性不可分集合的鲁棒线性编程判别”,优化方法和软件1,1992,23-34]。

    属性信息:

    1)ID号
    2)诊断(M =恶性,B =良性)
    3-32)

    为每个细胞核计算十个实值特征:

    a)半径(从中心到周边点的距离的平均值)
    b)纹理(灰度值的标准偏差)
    c)周边
    d)面积
    e)平滑度(半径长度的局部变化)
    f)紧密度(周长^ 2 /面积-1.0)
    g)凹度(轮廓凹部的严重程度)
    h)凹点(轮廓凹部的数量)
    i)对称性
    j)分形维数(“海岸线近似”-1)


    为每个图像计算这些特征的平均值,标准误以及“最差”或最大(三个最大值的平均值),
    从而得到30个特征。例如,字段3是平均半径,字段13是半径SE,字段23是最差半径。

    所有功能值都用四个有效数字重新编码。

    缺少属性值:无

    等级分配:357良性,212恶性

    0相关评论