具有多个表的数据集

数据挖掘 数据集 数据库
2022-02-28 23:49:39

我想检查一种学习数据库中不同表之间连接的算法。

我在哪里可以找到由多个表(即超过 5 个)组合而成的数据集,这些表之间存在连接?

我在网上(主要在 Kaggle.com)上能找到的只有 1 个或 2 个表的数据集。

我知道我的问题有点离题,但我仍然相信它可以帮助和我有同样问题的人

2个回答

你有什么理由不能自己创建它们吗?我假设您的算法正在执行诸如查找主键和外键之类的操作,因此表中的实际数据并不重要。

我会将其视为数据扩充中的一个练习,并只是合成一系列具有各种键的表。有些将具有整数键,其他 GUID,其他某种哈希列等等。创建一个脚本可以相当简单地创建可以为您创建任意数量的具有匹配键的表,例如。