有哪些数据集可以在简单任务上训练 MLP?

人工智能 神经网络 机器学习 数据集 多层感知器
2021-11-11 03:07:55

我已经实现了一个 MLP。现在,我想训练它来解决简单的任务。

是否有任何数据集可以在简单任务上训练 MLP,即具有少量输入和输出的任务?

我想训练它来解决比 XOR 问题稍微复杂的问题。

4个回答

有大量的示例数据集可供您使用。在数据集包中使用 R 安装了一堆好的。幸运的是,如果您不是 R 用户,您可以独立下载它们。试试 https://vincentarelbundock.github.io/Rdatasets/datasets.html

您可能还对MNIST 数据库感兴趣,它是手写识别研究中使用的规范数据库之一。

除此之外,您可以查看/询问http://datasets.reddit.com和/或http://opendata.reddit.com,您会发现各种有用的数据集。

最后,不要忽视UCI 机器学习存储库

一个流行的数据集是fisher iris 数据集。它由 150 个样本组成,每个样本的维度为 4。您可以在 http://archive.ics.uci.edu/ml/datasets/Iris找到它

如果要解决多类分类问题,可以使用著名的鸢尾花数据集,该数据集由 Fisher 在 1936 年引入在这个数据集中,每朵花都有(仅)4特征(输入),即

  • 花瓣长度,
  • 花瓣宽度,
  • 萼片长度,和
  • 萼片宽度

3类(输出)

  • 鸢尾花,
  • 鸢尾属弗吉尼亚,和
  • 鸢尾花

而且一共有150观察(或记录)。

鸢尾花数据集可在sklearn. 例如,参见Iris 植物数据集

要搜索其他数据集,您还可以使用https://toolbox.google.com/datasetsearch

近三年后,这个问题仍然有意义。

让我也添加一些:

深度学习数据集

来自上述链接的数据集可用于对深度学习算法进行基准测试。

STL-10 数据集

受CIFAR-10 数据集启发的图像数据集