AWS 机器学习预测架构问题

数据挖掘 机器学习 aws
2021-09-18 20:51:58

我用这里的训练数据训练了一个 AWS 机器学习模型:https ://www.kaggle.com/c/titanic/data

我现在正在尝试使用来自同一源的测试数据运行批量预测,但是当我尝试加载数据时出现以下错误:“此数据文件中的架构必须与用于创建 ML 模型 ml 的数据源匹配-xxxxxxxxx。确保您使用的数据文件与架构结构匹配。”

据我所知,架构是相同的。我已经尝试过使用和不使用“幸存”列,这是我试图预测的值。我什至使用相同的训练集进行了尝试,该训练集显然具有相同的模式并得到了相同的错误。

我究竟做错了什么?

2个回答

我今天遇到了同样的问题,尝试在谷歌上搜索有同样问题的人并找到了你的问题。

我通过首先创建数据源然后从那里运行预测来解决我的问题。因此,不要选择以下选项,

Batch Predictions > Create new batch prediction > ML model for batch prediction > My data is in S3, and I need to create a datasource

失败了,我首先做了:

Datasources > Create a new datasource...

接下来,我成功地从现有数据源运行批量预测。

模式不匹配的一个常见原因是,如果您使用 AML 服务来推断属性。我刚刚在我的两个数据集中发现这是根本原因。在我的测试文件中,有几个属性被推断为数字或二进制 - 当它们相反时。请务必使用训练数据集中的模式来检查后续(测试、评估等)数据源的推断模式。