我想在Google Go中编写一个数据挖掘服务,它通过抓取和 API 收集数据。
然而,由于 Go 缺乏良好的 ML 支持,我想在 Python 中做 ML 的工作。
有网络背景,我会用 RPC 之类的东西连接这两个服务,但我相信这是数据科学中的一个常见问题,我认为有一些更好的解决方案。
例如,大多数(网络)协议缺乏:
- 进程之间的缓冲
- 集群在多个实例上
那么数据科学家使用什么(库类型)来连接不同的语言/流程?
博多
我想在Google Go中编写一个数据挖掘服务,它通过抓取和 API 收集数据。
然而,由于 Go 缺乏良好的 ML 支持,我想在 Python 中做 ML 的工作。
有网络背景,我会用 RPC 之类的东西连接这两个服务,但我相信这是数据科学中的一个常见问题,我认为有一些更好的解决方案。
例如,大多数(网络)协议缺乏:
那么数据科学家使用什么(库类型)来连接不同的语言/流程?
博多
TheData Science Toolkit
是一个功能强大的库(或技术上的库集合),提供多种语言版本。例如,我使用RDSTK
R中调用的实现。
对于您的首选语言 Google Go,这里有一个与网络相关的库列表,看起来非常有用。