此数据整理过程的技术名称?多列变成多因素单列

数据挖掘 r 数据集 数据清理 数据争吵
2022-02-25 20:44:41

以下数据整理过程的技术名称是什么?我想将表 A 折叠到表 B 中。(使数据适合 ANOVA。)

表 A:

ArmyVet_ID  Served_WW2  Served_KoreanWar    Served_VietnamWar
110001          1              0                    0
110002          1              0                    0
110004          0              1                    0
110005          0              1                    0
110009          0              0                    1
110010          0              0                    1

表 B:

ArmyVet_ID    Served
110001          WW2
110002          WW2
110004          KoreanWar
110005          KoreanWar
110009          VietnamWar
110010          VietnamWar    

此外,关于如何使用 R 进行上述转换的问题已在 SO 上被问死。但是,似乎有太多方法可以做到这一点。如果有人想出了绝对最好的方法(最快,最简单),我将不胜感激。

正确答案后更新如下:原来表A称为“宽格式”,B称为“长格式”。

2个回答

它通常被称为重塑!有关该过程的详细描述,请参阅此演练,或阅读 Hadley Wickham 的软件包reshape文档

df['Served'] = (df.iloc[:, 1:] == 1).idxmax(1)