有没有类似于 R tidyr 工具的 python/pandas 数据整理工具?

数据挖掘 r Python 数据集 数据清理 熊猫
2021-09-25 23:25:00

我正在处理 Kaggle 挑战,其中一些变量由行而不是列表示(Telstra Network Disruption)。我目前正在寻找,和的等价物gather()可以在 R工具中找到。separate()spread()tidyr

4个回答

我将从melt()熊猫中的功能开始。我写了一篇关于它的文章:

https://www.ibm.com/developerworks/community/blogs/jfp/entry/Tidy_Data_In_Python?lang=en

R的gather()本质上是从宽到长。所以,

  1. 检查熊猫页面以了解如何使用pandas.wide_to_long()
  2. 查看此博客以获取有关在 Python 中获得类似优雅gather的函数的讨论。

我试图在一个名为 tidypython 的包中从语法上模仿 python 中的 tidyr 包。我使它与 dplython 包兼容,其中包括使用 >> 运算符来链接命令。

它尚未经过全面测试,但应该可以很好地工作:

https://github.com/durrantmm/tidypython

请让我知道这对你有没有用。

tidyr在python中有一个端口:

https://github.com/pwwang/datar

免责声明:我是作者。