需要一些关于从该领域的特定编程语言开始的技巧,重点是数据可视化

数据挖掘 r Python 可视化
2022-03-14 15:07:02

我有相当丰富的开发经验,但我是数据科学的新手。我一直在努力让自己熟悉主要概念,并在 R 和 Python 之间做出决定以投入时间。

我知道您可以在 R 中编写 Python,反之亦然,但是由于将来以优美的方式进行数据可视化对我来说将是一个非常高的优先级,并且 Python 和 R 都使用额外的包和库来表示数据,所以我并不完全确定在将代码集成到彼此时是否可以使用其他库。

如果有人能给我一些建议,并在数据可视化方面为我提供一些关于最佳方法、实践和工具的一般提示,我将不胜感激。

1个回答

R是一个更紧凑、面向目标的包。如果您想专注于非常具体的任务(通常是科学的),那就太好了。另一方面,Python是一种通用语言。

话虽如此,显然这是一个见仁见智的问题,如果您是一位经验丰富的开发人员,请选择 Python。您将在库中拥有更多选择,并拥有更大的构建大型软件的潜力。

2D 科学绘图库的一些示例:

3D 科学绘图库的一些示例

Python中数据科学中通常使用的一些库示例:

还要检查其他相关Scikit 包的列表。

至于启动软件,我建议您使用任何已经准备好的 Python 发行版,这些发行版中已经附带了一堆科学库以及 IDE 等软件。一些例子是:

由于可移植性,我个人是 WinPython 的用户(Python XY 的前用户,两者都很棒)。无论如何,这些发行版将大大简化准备科学 Python 环境(可以这么说)的任务。你只需要编码。Spyder是一种已知对科学家特别有用的 IDE 然而,这些也将起作用:

至于数据可视化技巧,你会看到上面提到的库中最常见的函数也是使用最广泛的。例如,像 Pandas 这样的库可以让您直接从对象调用绘图,因此已经有一种直观的数据可视化方法。像 scikit-learn(查看网站)这样的库已经展示了示例,然后是结果的数据可视化。我不会太在意这一点。您只需浏览一下库文档(示例)即可学习。