Select Language

AI社区

公开数据集

CNAE-9数据集 1080个巴西公司经济活动分析数据

CNAE-9数据集 1080个巴西公司经济活动分析数据

24K
488 浏览
0 喜欢
1 次下载
0 条讨论
Business Classification

Data Set Information:这是一个数据集,包含1080个巴西公司的自由文本业务描述文档,这些文档被归类为国家经济活动分类表(Class......

数据结构 ? 24K

    Data Structure ?

    * 以上分析是由系统提取分析形成的结果,具体实际数据为准。

    README.md

    Data Set Information:

    这是一个数据集,包含1080个巴西公司的自由文本业务描述文档,这些文档被归类为国家经济活动分类表(Classifica?§?£国家队
    艾维德经济学(micas-CNAE)。原始文本经过预处理以获得当前数据集:最初,仅保留该数据集字母,然后删除文本中的介词。接下来,这些词被转换成它们的标准形式。最后每个文档都表示为一个向量,其中每个单词的权重是其在文档中的频率。这个数据集是高度稀疏(99.22%的矩阵由零填充)。


    Attribute Information:

    In the data set there are 857 attributes, 1 attributes with the class of instance and 856 with word frequency:
    1. category: range 1 - 9 (integer)
    2 - 857. word frequency: (integer)


    Relevant Papers:

    Patrick Marques Ciarelli, Elias Oliveira, 'Agglomeration and Elimination of Terms for Dimensionality Reduction',
    Ninth International Conference on Intelligent Systems Design and Applications, pp.547-552, 2009

    Patrick Marques Ciarelli, Elias Oliveira, Evandro O. T. Salles, 'An Evolving System based on Probabilistic Neural Network',
    Brazilian Symposium on Artificial Neural Network, 2010


    Citation Request:

    If you have no special citation requests, please leave this field blank.


    Patrick Marques Ciarelli, pciarelli '@' lcad.inf.ufes.br, Department of Electrical Engineering, Federal University of Espirito Santo
    Elias Oliveira, elias '@' lcad.inf.ufes.br, Department of Information Science, Federal University of Espirito Santo

    ×

    帕依提提提温馨提示

    该数据集正在整理中,为您准备了其他渠道,请您使用

    注:部分数据正在处理中,未能直接提供下载,还请大家理解和支持。
    暂无相关内容。
    暂无相关内容。
    • 分享你的想法
    去分享你的想法~~

    全部内容

      欢迎交流分享
      开始分享您的观点和意见,和大家一起交流分享.
    所需积分:15 去赚积分?
    • 488浏览
    • 1下载
    • 0点赞
    • 收藏
    • 分享