我是 StackExchange 的新用户和数据科学的新学习者。我正在努力更好地理解如何估计收集的结果,特别是从运行某些分析的数据集中提取的假用户。
使用特定的算法,我找到了一些用户
User_Alg
user1
user2
user3
user28
user76
user67
我想估计我的算法与包含所有手动标记的假用户的数据集相比的准确性:
User_Dat
user1
user5
user28
user76
user67
user2
user29
如您所见,在我提取的列表 ( User_Alg
) 中有一些用户丢失了,即未包含在手动标记的列表中(数据集中的所有假用户User_Dat
;我曾想过使用混淆矩阵来检查准确性,但我想从比我更有统计和机器学习经验的人那里了解这种方法是否可行以及它的外观如何,或者您是否推荐另一种方法.
感谢您的关注和时间。