假设我有数以万计的数据集(行),每列包含 300 列整数、双精度和字符串(无图像,无音频)。其中五个目标列代表我要预测的每个数据集(行)表示的产品的有趣结果属性(整数)。
我目前的想法是为每个目标列创建类并组合这些类:column1 有 1-5 类,column2 也有 1-5 类……所以我得到了“11111”、“15312”、“43151”形式的组合目标类”、“55555”。现在,对于每个可能是 ANN 输出的数据集(行),我只有一个目标“标签”。这种方法至少有两个缺点:
- 一些组合类只有少量数据集,并且
- 仅在五个类别中对每列进行分箱会降低精度。
如果我增加每列的类数,我会在某些组合类中得到更少的数据集。
所以我的问题是我应该继续采用这种方法还是有更好的想法?可以使用 ANN 同时预测多个属性(即类)吗?