由于有许多工具可用于数据科学任务,安装所有东西并建立一个完美的系统是很麻烦的。
是否有安装了 Python、R 和其他开源数据科学工具并可供人们立即使用的 Linux/Mac OS 映像?安装了最新版本的 Python、R(包括 IDE)和其他开源数据可视化工具的 Ubuntu 或轻量级操作系统将是理想的选择。我在 Google 上的快速搜索中没有遇到过。
请让我知道是否有任何人或是否有人为自己创建了一个?我假设一些大学可能有自己的 VM 映像。请分享此类链接。
由于有许多工具可用于数据科学任务,安装所有东西并建立一个完美的系统是很麻烦的。
是否有安装了 Python、R 和其他开源数据科学工具并可供人们立即使用的 Linux/Mac OS 映像?安装了最新版本的 Python、R(包括 IDE)和其他开源数据可视化工具的 Ubuntu 或轻量级操作系统将是理想的选择。我在 Google 上的快速搜索中没有遇到过。
请让我知道是否有任何人或是否有人为自己创建了一个?我假设一些大学可能有自己的 VM 映像。请分享此类链接。
还有一个最近流行的选择:docker( https://www.docker.com )。Docker 是一个容器,让您可以非常轻松快速地创建/维护一个工作环境。
希望对您有所帮助。
如果您正在寻找预装了许多工具的 VM,请尝试使用Data Science Toolbox。
虽然Docker镜像现在更流行,但我个人认为Docker技术对用户并不友好,即使对于高级用户也是如此。如果您可以使用非本地VM 映像并且可以使用Amazon Web Services (AWS) EC2,请考虑由 Louis Aslett 预先构建的数据科学项目的专注于 R 的映像。这些图像包含最新的(如果不是最新的)版本的Ubuntu LTS、R和RStudio Server。您可以在此处访问它们。
除了我上面列出的主要组件之外,这些图像还包含许多内置的有用数据科学工具。例如,图像支持 LaTeX、ODBC、OpenGL、Git、优化的数值库等。
您是否尝试过 Cloudera 的 QuickStart VM?:
我发现它运行起来非常容易,它包括Mahout和Spark等开源软件。