公开数据集
数据结构 ? 10.4G
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
关系提取(RE)是在一对参数之间分配语义关系的任务。RE系统有两种形式:封闭域,使用一组封闭的关系短语来指定关系;开放域,使用任意短语可以描述参数之间的关系。RE系统的输出可用于各种下游应用程序,包括问题解答,信息提取等。尽管RE系统对于英语和其他少数几种语法分析工具(解析器,POS标记器,命名实体分析器)有效的语言正常工作如果没有可用的分析工具,那么为世界上大多数语言开发RE系统的工作很少。但是,我们确实有英语和许多其他语言之间的翻译系统。Faruqui和Kumar(2015)描述了一种用于多语言RE的跨语言投影算法,该算法通过将文本从外语翻译成英语,执行英语关系提取并将这些关系投影回外语来实现。本文介绍了该算法在从Wikipedia提取10种语言的多语言关系中的应用。本文还报告了针对三种语言的人类注释算法的性能:法语,俄语和印地语。该数据集提供了使用此算法获得的一组自动提取的关系,以及用于评估该算法的一组人类注释。用英语执行关系提取并将这些关系投影回外语。本文介绍了该算法在从Wikipedia提取10种语言的多语言关系中的应用。本文还报告了针对三种语言的人类注释算法的性能:法语,俄语和印地语。该数据集提供了使用此算法获得的一组自动提取的关系,以及用于评估该算法的一组人类注释。用英语执行关系提取并将这些关系投影回外语。本文介绍了该算法在从Wikipedia提取10种语言的多语言关系中的应用。本文还报告了针对三种语言的人类注释算法的性能:法语,俄语和印地语。该数据集提供了使用此算法获得的一组自动提取的关系,以及用于评估该算法的一组人类注释。
数据源 关系抽取是使用以下语言从多语种Wikipedia语料库的句子中执行的:法语,俄语,中文,阿拉伯语,印地语,印度尼西亚语,他加禄语,拉脱维亚语,斯瓦希里语和格鲁吉亚语。
更多介绍信息请查看Readme文件
帕依提提提温馨提示
该数据集正在整理中,为您准备了其他渠道,请您使用
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。