Select Language

AI社区

公开数据集

保险公司基准(COIL2000)数据集

保险公司基准(COIL2000)数据集

439K
602 浏览
0 喜欢
3 次下载
0 条讨论
Social Regression

Data Set Information:客户信息由86个变量组成,包括产品使用数据和来自邮政区号的社会人口统计数据。该数据由荷兰数据挖掘公司S......

数据结构 ? 439K

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    Data Set Information:

    客户信息由86个变量组成,包括产品使用数据和来自邮政区号的社会人口统计数据。该数据由荷兰数据挖掘公司Senient Machine Research提供,并基于一个现实世界的商业问题。该培训集包含5000多个客户描述,包括他们是否有旅行队保险单的信息。一个测试集包含4000名客户,其中只有组织者知道他们是否有商队保险单。


    The data dictionary ([Web link]) describes the variables used and their values.

    注意:所有以M开头的变量都是zipcode变量。它们给出了该变量的分布信息,例如客户zipcode区域中的出租房屋。

                 

    具有制表符分隔字段的每行一个实例。

    TICDATA2000.txt:用于训练和验证预测模型并构建描述的数据集(5822条客户记录)。每个记录由86个属性组成,包含社会人口数据(属性1-43)和产品所有权(属性44-86)。社会人口数据来自邮政编码。居住在相同邮政编码地区的所有客户都具有相同的社会人口特征。属性86“商队:移动房屋政策数量”是目标变量。

    TICeval2000.txt:预测数据集(4000条客户记录)。它的格式与TICDATA2000.txt相同,只是缺少目标。参与者只需返回预测目标列表。所有数据集均采用制表符分隔格式。属性和属性值的含义如下所示。

    评估集的TICTGTS2000.txt目标。


    Attribute Information:

    N/A


    Relevant Papers:

    P. van der Putten and M. van Someren (eds). CoIL Challenge 2000: The Insurance Company Case. Published by Sentient Machine Research, Amsterdam. Also a Leiden Institute of Advanced Computer Science Technical Report 2000-09. June 22, 2000.
    [Web link]


    Papers That Cite This Data Set1:


    Bianca Zadrozny and Charles Elkan. Transforming classifier scores into accurate multiclass probability estimates. KDD. 2002.  [View Context].

    Stephen D. Bay and Dennis F. Kibler and Michael J. Pazzani and Padhraic Smyth. The UCI KDD Archive of Large Data Sets for Data Mining Research and Experimentation. SIGKDD Explorations, 2. 2000.  [View Context].

    Stefan R uping. A Simple Method For Estimating Conditional Probabilities For SVMs. CS Department, AI Unit Dortmund University.  [View Context].


    Citation Request:

    Data is (c) Sentient Machine Research 2000
    This dataset is owned and supplied by the Dutch datamining company Sentient Machine Research, and is based on real world business data. You are allowed to use this dataset and accompanying information for non commercial research and education purposes only. It is explicitly not allowed to use this dataset for commercial education or demonstration purposes.

    Please cite/acknowledge:

    P. van der Putten and M. van Someren (eds) . CoIL Challenge 2000: The Insurance Company Case. Published by Sentient Machine Research, Amsterdam. Also a Leiden Institute of Advanced Computer Science Technical Report 2000-09. June 22, 2000.
    [Web link]


    Original Owner and Donor:

    Peter van der Putten
    Sentient Machine Research
    Baarsjesweg 224
    1058 AA Amsterdam
    The Netherlands
    +31 20 6186927
    pvdputten '@' hotmail.com, putten '@' liacs.nl

    TIC Benchmark Homepage: http://www.liacs.nl/~putten/library/cc2000/

    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:10 去赚积分?
    • 602浏览
    • 3下载
    • 0点赞
    • 收藏
    • 分享