我对 AI/ML 领域比较陌生,但来自编程背景。
问题:我有一个用户交易数据集,他们从单个贷款提供商那里获得了短期贷款,我需要将贷款还款与特定的贷款收据相匹配。
示例数据集如下:
交易日期 | 金额 | 贷记借记
2017-09-01 | 500 | 信用
2017-09-08 | 250 | 借记
2017-09-17 | 294 | 借记
2017-12-11 | 300 | 信用
2017-12-15 | 150 | 借记
2018-01-07 | 200 | 信用
2018-01-12 | 398.8 | 借记
2018-01-19 | 200 | 借记
2018-02-02 | 150 | 借方
这里 creditDebit 列的“Credit”值表示收到的贷款,“Debit”表示之前收到的一些贷款的偿还。
如您所见,前 3 行很容易匹配,因为有 1 个贷方(金额为 500),然后是 2 个借方(金额为 250 和 294)。
从第 4 行开始,我无法弄清楚如何最好地匹配。
- 2017-12-11 有一笔贷款的信用交易
- 2017-12-15 已部分偿还这笔贷款
- 然后是新贷款的另一个信用
- 2018-01-12 是之前2笔贷款的部分还款
- 最后的2个借记也是部分还款
我已经能够手动确定哪种还款对哪种贷款最有意义,但是在我看来,尝试将其写到 if-else 函数中会非常困难,而且不是最好的。例如,最难的部分是确定 2018 年 1 月 12 日的借方,这是先前收到的两笔贷款的合并还款交易。对于 2017 年 12 月 11 日收到的贷款和 228 年 2018 年 1 月 11 日收到的贷款,我手动计算了此借方的合理拆分。
是否有一些模型/算法可以用来匹配哪些借方交易最有可能偿还哪些信用交易,以及如果还款交易看起来像是对多个先前贷款的复合还款 - 那么借方的合理分割是什么?满足信用交易?
我不知道这对你是否有意义..
我尝试考虑如何使用聚类算法,但我不能,因为聚类不会指示贷记交易和借记交易的匹配,尤其是复合还款借记。
任何关于如何解决这个问题的想法都非常感谢!