我有一个结构如下的 Pandas DataFrame:
user_id movie_id rating
0 1 1193 5
1 2 1193 5
2 12 1193 4
3 15 1193 4
4 17 1193 5
5 18 1193 4
6 19 1193 5
7 24 1193 5
8 28 1193 3
每行对应于用户为电影rating执行的一个事件。例如,第一行表示用户对电影的评分为。user_idmovie_id111935
该数据来自MovieLens项目。
我的目标是找到所有满足这两个条件的用户:
588评分为的电影53578评分为的电影3
对于上述每个条件,我想出了两个过滤的 DataFrame 对象:
ratings_588_5 = data[(data.movie_id == 588) & (data.rating == 5]
ratings_3578_3 = data[(data.movie_id == 3578) & (data.rating == 3)]
分别导致:
>>> ratings_588_5
user_id movie_id rating
438 588 5
758 588 5
913 588 5
1024 588 5
1214 588 5
>>> ratings_3578_3
user_id movie_id rating
45 3578 3
321 3578 3
467 3578 3
758 3578 3
1024 3578 3
1381 3578 3
在 Pandas 中,如何计算出现在两个 DataFrame 中list的所有数据?user_id
在这个例子中,我想要得到的结果是:
[758, 1024]