这是数据
PlayerID, Characters, Win or Lose
我可以让它看起来像这样
8PYPY0LLQ,valkyrie5 , chr_witch4 , hog_rider5 , zapMachine1 , mega_minion3 , baby_dragon2 , bomber7 , skeleton_horde1, 0
或者像这样
2GRG822L9,"barbarians8, valkyrie5, chr_balloon3, fire_spirits8, minion8, firespirit_hut6, rage4, skeleton_horde3,",1
第二列是 70+ n 个字符的 8 个字符组合。
我需要将变量编码为虚拟变量,因此每个字符都有自己的列。有没有办法在 python/R 中做到这一点?我假设您必须将第二列保留为字符串,而不是输出看起来像这样的 csv 文件。
2GRG822L9,barbarians8, valkyrie5, chr_balloon3, fire_spirits8, minion8, firespirit_hut6, rage4, skeleton_horde3,1
8PYPY0LLQ,valkyrie5 , chr_witch4 , hog_rider5 , zapMachine1 , mega_minion3 , baby_dragon2 , bomber7 , skeleton_horde1,0
在虚拟编码之前它应该看起来像这样(我可以去掉字符串中的逗号)
2GRG822L9,"barbarians8, valkyrie5, chr_balloon3, fire_spirits8, minion8, firespirit_hut6, rage4, skeleton_horde3,",1
8PYPY0LLQ,"valkyrie5 , chr_witch4 , hog_rider5 , zapMachine1 , mega_minion3 , baby_dragon2 , bomber7 , skeleton_horde1,",0