在 Jupyter Notebook 中组合两个 CSV

数据挖掘 数据集 数据挖掘 数据 数据清理 数据科学模型
2022-03-04 10:10:26

表格1

表 2

我想结合基于 Column1 的两个 CSV 文件,当结合两个 csv 的 Column1 的每个元素时,也应该匹配每一行,或者请建议如何根据另一个 csv 重新排序 Column1。在 Jupyter Notebook 谢谢!

3个回答

您可以尝试以下代码来合并两个文件:

import pandas as pd
df1 = pd.read_csv(‘first.csv’)
df2 = pd.read_csv(‘second.csv’)
df = df1.merge(df2, on=‘Column1’)

您可以使用inner join

import pandas as pd
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
df = pd.merge(df1, df2, on="Column1", how="inner")

有很多方法可以连接两种不同类型的数据集


  • Python Pandas - 合并/加入
  • left - 一个 DataFrame 对象。
  • right - 另一个 DataFrame 对象。
  • on - 要加入的列(名称)。...
  • left_on - 左侧 DataFrame 中用作键的列。...
  • right_on - 右侧 DataFrame 中用作键的列。...
  • left_index - 如果为 True,则使用左侧 DataFrame 中的索引(行标签)作为其连接键。

句法

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

回答

pd.merge( firstDF, secondDF ,on='Column1')

更多资源: Padas 数据合并/加入资源