我有一个 Excel 格式的数据集,其中包含帐户名称、报告的症状、确定的根本原因以及每一行的月年格式的日期。我正在尝试实现一个类似 mahout 的系统,目的是通过执行基于用户的相似性事情来确定帐户可以报告的可能性症状。从技术上讲,我只是希望将推荐系统调整为确定性系统,以发现帐户可以报告的可能症状。我可以通过帐户获取症状的频率,而不是评级。是否可以使用编程语言或任何其他软件来构建这样的系统?
这是一个例子:
帐户:X症状:AB、AD、AB、AB
帐户:Y 症状:AE、AE、AB、AB、EA
为了这个例子,我们假设所有的日期都是这个月。
O/P:账户:X 症状:AE
在这里,他们俩都报告了AB 2 次或更多次。我可以将这样的数字固定为寻找可能症状的阈值。