公开数据集

电影数据集

1.65M

1800 浏览

0 喜欢

4 次下载

0 条讨论

Music Analysis Classification

Data Set Information:数据以关系形式跨多个文件存储。中心文件（MAIN）是一个电影列表，每个电影都有一个唯一的标识符。这些标......

数据介绍
文件预览
相关论文
Code
分享讨论(0)
使用声明

启动Notebook开发

数据结构 ? 1.65M

* 以上分析是由系统提取分析形成的结果，具体实际数据为准。

README.md

Data Set Information:

数据以关系形式跨多个文件存储。中心文件（MAIN）是一个电影列表，每个电影都有一个唯一的标识符。这些标识符可能在后续版本中更改。这些电影的演员（演员）与他们的角色一起列在一个不同的文件中。关于单个参与者（actors）的更多信息在第三个文件中。所有主要的导演都列在第四个文件（人物）中，其中包括一些重要的制片人、作家和摄影师。第五个文件（重拍）链接了大量相互复制的电影。第六个文件（STUDIOS）提供了一些关于MAIN中显示的STUDIOS的信息。

最初的动机是数据库类练习，以取代枯燥的“玩具部门经理”查询。请注意，cast、reference MAIN和ACTORS在逻辑上与标准BOM表问题中的库存文件（reference to suppliers and assembly）相同。个人兴趣使得希区柯克所有电影和电视剧的数据库都变得完整。按类型和演员划分的相关电影逐渐增加。

对时态数据库的后续研究导致添加日期字段（仅年）。比如说，它允许测试演员的工作日期是否与演员关系所显示的主要电影的日期相符。如DOC中所述，可以使用具有多个和两个级别值的字段测试面向对象的数据库功能。

这些参赛作品是在1975年左右开始的课程工作中逐渐收集的，目前仍在更新中。大多数条目都是手工输入的。文档文件列出了使用的一些参考作品。更正和补充仍值得赞赏。

Detailed descriptions of the fields and their formats is provided in doc.html.

Missing Values:

Outside of key fields, missing values are common. Their encoding is described in DOC. Sometimes the data seems to be unavailable, sometimes it hasn't been entered. Some information, as `lived-with' is inherently incomplete.

Censored data:

Minor actors are ignored.

Dependencies:

Every MAIN film must have a director in PEOPLE. about 50 pseudo director names ahve been listed in PEOPLE to allow interesting films to with (yet) unknown directors to be entered. Every CASTS entry must relate to a MAIN film entry. Every ACTOR should appear in some CASTS entry, but not vice versa. See DOC for more type information.

Other Relevant Information:

Films are listed, if known, with their original language title. An Alt(T: ) field provides English translations, where known.

Data Format:

The current files are in HTML, to allow easy parsing to other formats. An XML version is being considered.

The approximate file sizes are:
DOC ....... 50K
MAIN ...... 1 145K 11 400 entries
PEOPLE .... 355K 3 290 entries
CASTS ..... 4 340K 46 000 entries
ACTORS .... 811K 6 800 entries
REMAKES ... 135K 1 278 entries
STUDIOS ... 26K 200 entries

Attribute Information:

N/A

Relevant Papers:

N/A

Papers That Cite This Data Set¹:

Harsha Nagesh and Sanjay Goil and Alok N. Choudhary. Adaptive Grids for Clustering Massive Data Sets. Department of Energy ASCI. [View Context].

Citation Request:

Copyright held by Gio Wiederhold, 1990-1999. This data may not be used for commercial resale.

Please acknowledge the source when used: Gio Wiederhold, Stanford University.

Original Owner and Donor

Gio Wiederhold
Stanford University
650-725-8363
gio '@' cs.stanford.edu

暂无相关内容。

分享你的想法

去分享你的想法~~

全部内容

欢迎交流分享

开始分享您的观点和意见，和大家一起交流分享.

数据使用声明：

一、数据来源与展示说明：

1、该数据来自于互联网数据采集或服务商的提供，本平台为用户提供数据集的展示与浏览。
2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
3、数据集基本信息来自数据原地址或数据提供方提供的信息，如数据集描述中有描述差异，请以数据原地址或服务商原地址为准。

二、所有权说明：

1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。

三、数据转载说明：

1、如您需要转载本站数据，请保留原数据地址及相关版权声明。

四、侵权与处理说明：

1、如本站中的部分数据涉及侵权展示，请及时联系本站，我们会安排进行数据下线。

所需积分：

10 去赚积分？

1800浏览
4下载
0点赞
收藏
分享

今日排行

本月搜索

Dataset Category