如何知道最先进的数据科学推荐方法?

数据挖掘 机器学习 nlp 数据挖掘 可视化
2022-02-27 01:39:33

数据科学、人工智能、自然语言处理和可视化变化如此之快。我想知道是否有一种方法/博客可以分享最新更新并推荐使用某些技术或避免使用其他技术。例如,许多 NLP 书籍很旧,它们会提供使用 TF-IDF 的示例。然而,现在有更好的方法,但它们也在快速变化。我希望找到一些可以说使用这些新技术并避免使用这些旧技术的来源。搜索网络会有所帮助,但会带来很多噪音。

1个回答

几点评论:

  • 没有“数据科学”的科学领域,而是与数据科学相关的多个领域:统计学、机器学习、自然语言处理、计算机视觉、信号处理……以及许多其他重叠和/或关注的领域特定应用,例如生物信息学。所有这些领域都是高度活跃和专业化的,因此不可能监控每一个可能的进展。
  • 没有唯一推荐的方法:首先,人们一直不同意做 X 的最佳方法。其次,一种方法完全过时的情况很少见。例如,TFIDF 在许多用例中仍然是有意义的,例如使用低资源语言或存在效率限制时。
  • 为了全面了解最新技术,必须遵循研究出版物。充其量它对于特定领域是可行的,例如,通过浏览主要会议可以或多或少地了解 NLP 中发生的事情更现实的选择是等待主流专业人士取得进展,例如定期浏览 DataScienceSE 和/或CrossValidated
  • 最后的建议:旧书对于完全理解为什么/如何以某种方式完成事情非常有用。我们经常在 DataScienceSE 上看到错误,这是由于人们试图在不理解方法的情况下应用方法。