对于涉及采用自然语言处理的数据密集型算法的应用程序,Java 或 Python 是更好的选择吗?

数据挖掘 机器学习 Python 大数据 数据清理 爪哇
2021-09-28 22:58:23

我是一名拥有 9 年经验的专业 Java 开发人员。从未使用过 Python,但是我没有任何限制学习它。

我仍然需要澄清几个方面。我希望如果有人可以提供帮助,它会清除我脑海中的蜘蛛网。我正在寻找开发一个机器学习项目:

  • 通过 Web 界面呈现交互式分析图表和视图。
  • 使用网络爬虫收集结构化和非结构化数据。
  • 后端处理使用机器学习、人工智能和自然语言处理算法收集的数据。

在探索可用选项时,我发现 Python 和 Java 都有广泛的支持和框架/库/模块可用于利用机器学习实现。

然而,使用 Java 给我一种强类型编程的感觉,它可以通过其强大的多线程 API 来利用底层 CPU 内核。另一方面,Python 是脚本语言,在处理与自然语言处理有关的大量数据的复杂逻辑时,从表面上看效率较低。

我可能完全错了,因为我对 Python 生态系统不是很熟悉。

如果我牢记执行速度、可维护性和旨在开发大型、可扩展和强大的机器学习/人工智能应用程序的社区支持,任何人都可以帮助我理解 Java 和 Python 之间的选择吗?

2个回答

每天都在大数据环境中python工作。java

python绝对是我在研究、试验和拟合模型时选择的语言。 有大量非常有用的库,python例如spacy,这使得探索非常容易,尤其是在.nltksklearnjupyter notebook

在生产环境中运行代码时,如果考虑性能,我们仅在java.

java 更适合生产,对打包、测试、部署有很好的支持。

数据强度是一个关键因素,但仅凭该因素不足以选择编程语言。请从您的用例角度阅读本文,您可以更轻松地使用 Java 评估 Python:https ://togglebrains.wordpress.com/2017/11/05/select-programming-language-for-machine-learning/