我有两个电子表格,其中一个正在更新另一个。
如何使用pandas库更新这些数据?
示例,其中“b”更新“a”:
a = {'field': ['a', 'b', 'c'], 'value': ["", None, 1]}
b = {'field': ['a', 'b', 'd'], 'value': [1, 2, 1]}
预期结果:
c = {'field': ['a', 'b', 'c', 'd'], 'value': [1, 2, 1, 1]}
我有两个电子表格,其中一个正在更新另一个。
如何使用pandas库更新这些数据?
示例,其中“b”更新“a”:
a = {'field': ['a', 'b', 'c'], 'value': ["", None, 1]}
b = {'field': ['a', 'b', 'd'], 'value': [1, 2, 1]}
预期结果:
c = {'field': ['a', 'b', 'c', 'd'], 'value': [1, 2, 1, 1]}
df_a = pandas.DataFrame(a)
df_b = pandas.DataFrame(b)
c = pandas.concat([df_a, df_b], ignore_index=True).drop_duplicates(subset=['field'], keep='last')
这将是解决它的一种方法。
x = a['field']
y = b['field']
c = {}
c['field'] = set(x+y)
我不确定您在寻找“价值”键的结果。它将“无”值和空值消除为“”,并获取两个列表中存在的所有值。是对的吗?