我发现 Project Euler http://projecteuler.net/在学习编程语言方面非常有用。有没有类似的机器学习网站?
我确实看到了http://www.kaggle.com/,但是对于初学者来说,它不像 Project Euler 那样容易上手。
我发现 Project Euler http://projecteuler.net/在学习编程语言方面非常有用。有没有类似的机器学习网站?
我确实看到了http://www.kaggle.com/,但是对于初学者来说,它不像 Project Euler 那样容易上手。
正如您所指出的,尽管风险高于 Project Euler,但 Kaggle 是您自己的实验中使用的极好数据来源。他们的许多比赛都要求您登录才能访问数据集(用于法律协议等),但如果您实际上没有完成参赛作品,据我所知,没有任何处罚。
话虽如此,如果您寻找特定于测试统计程序的数据集,例如普林斯顿大学的数据集,您可以在不同的网络架构上测试数据,并将其与普通回归等作为基准进行比较。
另请参阅此处以获取完整列表,其中包括所有Google 自然语言处理数据。
因此,Project Euler 针对特定问题提供了出色的服务,但在机器学习的情况下,您可以将现有数据集与您创建的架构一起使用,并将“答案”与在线或研究论文中提出的结论进行比较。
UCI因其数据集存储库而在机器学习社区中广为人知。许多期刊文章都包含了他们在一些 UCI 数据集上的技术结果,因此您可以自己尝试一下,看看效果如何。
怎么样:http ://www.ml-class.org/ ?它有很好的介绍和一些编程练习。AFAIK Euler 有更复杂的示例,但 ml-class 仍然是一个好的开始。
正如评论中指出的那样,本课程有下一版:http: //jan2012.ml-class.org/#