假设 Morpheus 有多个用户提供彩色药丸(来自无限的彩色药丸),Morpheus 总共可以提供 3 种独特的彩色药丸(红色、蓝色、绿色)。诀窍是,Morpheus 只能向用户提供一种药丸,而用户可以选择服用或拒绝服用。(另外,用户的决定是相互独立的)
现在,Morpheus 想对他的提议变得聪明,并希望对用户进行建模,以便用户选择他提供的药丸。用户喜怒无常,不确定他们会随机选择。
拒绝可能是由于多种未知原因,例如I didn't like the color of the pill, I will choose the pill later, I want to understand more about this pill,Show me other pills before I decide
现在有两种方法可以考虑建模:
- 将此视为二元分类
- 将其视为多类分类
当我将其视为二元分类时,我将pill color作为特征与其他特征一起传递user features给模型,我的输出是用户服用或拒绝给定药丸颜色的药丸的概率。然后,Morpheus 可以提供最高概率的药丸颜色。这将在建模时同时使用用户Accept的Reject决策,但存在一些不确定性,同一类型的用户可以随机接受或拒绝。
当我将其视为多类分类时,我尝试预测药丸颜色本身。我不会在训练中使用被拒绝的案例,只会考虑用户选择某些东西的案例。这样,我可以减少这种情况下的不确定性,但必须完全忽略被拒绝的情况。然后,Morpheus 可以对每个类使用 softmax 或 sigmoid,并使用 argmax 来获得提供的最佳选择。
我不确定是否有其他方法可以对这个问题进行建模,但是在这两种方法中哪一种可能是更好的方法?
