假设我为带有N元素的二元分类生成了一组随机目标标签,并且正类 (1) 的某个频率,例如 10%:
targets = [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, ...]
我现在想生成虚假的分类预测,以使整体预测大致满足所需的精度和召回值,例如precision = 0.8和recall = 0.2。我不需要确切的值,但喜欢接近,例如0.78and 0.25。
predictions = [ 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, ...]
有没有办法在 python/numpy 中有效地做到这一点,理想情况下,我可以通过使用不同的随机种子重复生成过程来产生多组预测?