我试图找到工作,dataframe.columns.difference()但找不到令人满意的解释。谁能详细解释这种方法的工作原理?
dataframe.columns.difference() 使用
数据挖掘
熊猫
数据框
不同之处
2021-09-30 08:31:01
1个回答
该函数dataframe.columns.difference()为您提供作为参数提供的值的补充。它可用于从现有数据框创建新的数据框,并排除某些列。让我们看一个例子:
In [2]: import pandas as pd
In [3]: import numpy as np
In [4]: df = pd.DataFrame(np.random.randn(5, 4), columns=list('ABCD'))
In [5]: df
Out[5]:
A B C D
0 -1.023134 -0.130241 -0.675639 -0.985182
1 0.270465 -1.099458 -1.114871 3.203371
2 -0.340572 0.913594 -0.387428 0.867702
3 -0.487784 0.465429 -1.344002 1.216967
4 1.433862 -0.172795 -1.656147 0.061359
In [6]: df_new = df[df.columns.difference(['B', 'D'])]
In [7]: df_new
Out[7]:
A C
0 -1.023134 -0.675639
1 0.270465 -1.114871
2 -0.340572 -0.387428
3 -0.487784 -1.344002
4 1.433862 -1.656147
该函数从现有列中返回一个新的列列表作为输出,不包括作为参数给出的列。您还可以检查它:
In [8]: df.columns.difference(['B', 'D'])
Out[8]: Index(['A', 'C'], dtype='object')
我建议你看看这里的官方文档。
其它你可能感兴趣的问题