我有一个包含许多列的 df,这些列代表组成索引的公司的市值。数据框的索引是日期。公司在进入指数之前或离开指数之后,df 中公司的市值为零。
我想知道指数不变的平均天数。
例如:
[in]:
df = pd.DataFrame(np.array([[1, 1,np.nan], [np.nan,2, 10], [1,3, 100],[4,np.nan, 100]]),
columns=['a', 'b','c'])
df
[out]:
a b c
0 1.0 1.0 NaN
1 NaN 2.0 10.0
2 1.0 3.0 100.0
3 4.0 NaN 100.0
我想知道的是有多少行有来自同一列的条目。
例如,第 0 行包含来自列 a 和 b 的条目。b 和 c 列的第 1 行。a、b 和 c 列的第 2 行。a 和 c 列的第 3 行。因此有 4 行具有唯一的列组合和 4 个更改。那么平均值为1。