我有如下所示的产品购买计数数据:
user item1 item2
a 2 4
b 1 3
c 5 6
... ... ...
这些数据被导入到python
using 中numpy.genfromtxt
。现在我想处理它以获得item1
购买金额和item2
购买金额之间的相关性——基本上对于每个值x
,item1
我想找到所有购买数量的用户,item1
然后对相同用户x
进行平均。item2
做这个的最好方式是什么?我可以通过使用for
循环来做到这一点,但我认为可能有比这更有效的方法。谢谢!