从 R 迁移到 python:具体问题

数据挖掘 机器学习 Python scikit-学习
2021-10-06 16:34:32

我一直在使用 R 和 RStudio 进行原型设计和模型构建,由于一些持续存在的问题(仅适用于我使用的环境),我们决定使用 python。我想知道:

  1. 有没有像“RStudio Server”这样的python开发环境?
  2. 在 Python 中启用多线程/多核处理以进行决策树/梯度提升有多容易/难?
  3. 数据可以保存在 python 开发环境服务器中吗?含义:我可以用代码和数据框保存开发环境,并在第二天回来访问/拿起我离开的地方吗?

  4. 你能从 Python 连接到 Oracle 数据库吗?

  5. 有没有办法可以将 .RData 导入 python 开发环境?

为什么要在这里问这些问题?

在查找搜索引擎时,我得到的大多是不可靠的结果、培训机构的促销活动、过时的博客和行业巨头的白皮书。我需要一个可靠的答案。

2个回答

1) Anaconda Spyder,也许

2)sklearn,随机森林有一个选择作业数量的选项,它会处理并行化

3)我不这么认为,但你可以腌制物体并加载它们。你可能可以做一些事情,比如创建一个 variable_name - value 字典,然后腌制它

4)从未尝试过

5)根据https://stackoverflow.com/questions/21288133/loading-rdata-files-into-python,我不这么认为

我可以尝试回答第三个问题。您可以使用 Jupyter + Python Kernel(安装Anaconda以使用带有 python 内核的 conda 命令)。Jupyter 允许将您的代码、笔记和图表保存在一个笔记本中并保存。