我有一个熊猫数据框 df,其中一列 z 填充了设定值
我想删除重复的行,当它们具有相同的列 z 值(它们是集合)时,2 行被认为是彼此的重复版本。
import pandas as pd
lnks = [ ( 'a' , 'b' , { 'a' , 'b' } ) , ( 'b' , 'c' , { 'b' , 'c' } ) , ( 'b' , 'a' , { 'a' , 'b' } ) ]
lbls = [ 'x' , 'y' , 'z' ]
df = pd.DataFrame.from_records( lnks , columns = lbls )
尝试根据列 z 值删除重复的行:
df.drop_duplicates( subset = 'z' , keep='first')
我收到错误消息:
TypeError: unhashable type: 'set'
有没有办法根据不可散列的类型列删除重复的行?