考虑如下示例。
我正在运行一个移动应用程序,允许用户在应用程序上申请贷款。
假设一个人登录了我的应用程序以使用他的手机申请贷款。
通话事件:
A = 一个人有一部智能手机
B = 默认
首先,我P(B)=0.8在没有任何信息的情况下为这个人分配(只是保守一点)。
假设在我国P(A) = 0.5,即只有 50% 的人口拥有智能手机。
假设P(A|B) = 1,即当我查看我的数据库时,所有到目前为止没有还款的人都拥有智能手机,这很明显,因为用户需要智能手机来安装我的应用程序。
所以应用贝叶斯:
P(B|A) = P(A|B) * P (B) / P(A) = 1 * 0.8 / 0.5 = 1.6
这里确实存在两个问题:
1) P(B|A) > 1。我知道 StackExchange 上不止一个线程在理论上讨论了这个问题,以证明P(B|A) <= 1在所有情况下,但找不到我的推理错误的原因。
2)多加一点信息,比如“这个人有智能手机”,根据我的贝叶斯推理,实际上会增加他的案例违约的概率,而在我的直观推理中,它并没有带来任何信息,因为我知道我所有的客户都已经拥有智能手机。怎么解释?