我想到了一种回归技术,我想在几个数据集上尝试。我希望这些数据集具有以下属性:
- 成为表格数据集(无图像)。
- 至少有 20k 行,最好是 100k 左右。
- 有一些具有多个级别的分类变量(至少一个具有 100 个或更多级别的变量)。
- 理想情况下,目标应该有长尾巴。
有没有人有任何具有这些属性的公共数据集?我发现堆栈溢出开发人员调查对我有用,但我希望有更多具有这种结构的数据集。
我想到了一种回归技术,我想在几个数据集上尝试。我希望这些数据集具有以下属性:
有没有人有任何具有这些属性的公共数据集?我发现堆栈溢出开发人员调查对我有用,但我希望有更多具有这种结构的数据集。