dataframe.columns.difference() 使用

数据挖掘 熊猫 数据框 不同之处
2021-09-30 08:31:01

我试图找到工作,dataframe.columns.difference()但找不到令人满意的解释。谁能详细解释这种方法的工作原理?

1个回答

该函数dataframe.columns.difference()为您提供作为参数提供的值的补充。它可用于从现有数据框创建新的数据框,并排除某些列。让我们看一个例子:

In [2]: import pandas as pd

In [3]: import numpy as np

In [4]: df = pd.DataFrame(np.random.randn(5, 4), columns=list('ABCD'))

In [5]: df
Out[5]: 
          A         B         C         D
0 -1.023134 -0.130241 -0.675639 -0.985182
1  0.270465 -1.099458 -1.114871  3.203371
2 -0.340572  0.913594 -0.387428  0.867702
3 -0.487784  0.465429 -1.344002  1.216967
4  1.433862 -0.172795 -1.656147  0.061359

In [6]: df_new = df[df.columns.difference(['B', 'D'])]

In [7]: df_new
Out[7]: 
          A         C
0 -1.023134 -0.675639
1  0.270465 -1.114871
2 -0.340572 -0.387428
3 -0.487784 -1.344002
4  1.433862 -1.656147

该函数从现有列中返回一个新的列列表作为输出,不包括作为参数给出的列。您还可以检查它:

In [8]: df.columns.difference(['B', 'D'])
Out[8]: Index(['A', 'C'], dtype='object')

我建议你看看这里的官方文档。