预训练模型

数据挖掘 机器学习 计算机视觉 nlp
2022-03-03 00:14:12

我从机器学习开始,所以有人可以告诉是否有某个站点可以找到当前性能最佳的训练模型,以解决任何特定问题,例如情绪分析或异议检测或任何此类机器学习问题?

4个回答

这将非常方便,但我不知道有任何这样的网站。

此外,通常很难就当前性能最佳的模型达成一致,因为这取决于数据集、注释方式和评估方法。更不用说语言的多样性,因为特定的模型通常是特定于语言的。当然,要跟上不断发布的新方法和数据集是很困难的。

请参阅https://www.tensorflow.org/hub
https://pytorch.org/hub

在那里,您可以找到带有权重的最先进的预训练模型。

我认为您要问的问题有一个两步解决方案:

  1. 识别性能最佳的模型:paperswithcode是一个网站,其中包含针对不同任务和不同数据集的最佳性能模型。对于任何特定任务(例如情绪分析),您可以转到站点中的相应部分,并尝试确定与您所面临的场景最相似的基准数据集。

  2. 一旦你确定了合适的模型,你可能会在不同的地方找到它的预训练权重:

    • 在与模型相关的文章中(在论文和代码中链接),作者可以指定他们已经在 github 存储库或他们实验室的网页中发布了模型。
    • 在特定于框架的存储库中,例如Tensorflow HubPytorch Hub,可能会有已发布的模型。
    • 在特定主题的库中,例如NLP 的Huggingface Transformers,您可能会找到预训练的模型。

我同意尔万的观点。您需要记住的主要事情是训练统计模型涉及找到一组“伪真实参数”(阅读:模型中关系的最佳值)。为此,您需要定义一个您希望最小化的标准,例如,当模型预测训练样本中的观察值时,模型的均方误差。当使用不同的准确度度量(例如平均绝对误差)时,即使训练样本无限增长,这些值也会不同。我们说这是两组伪真极限参数,分别最小化极限 MSE 和 MAE 标准(根据问题,标准有更多选项)。从这个意义上说,没有“最佳模型”,所有适合训练样本的模型都是“ 给定它们的约束和标准函数。此外,火车组也很重要。如果你训练一个决策树集成或神经网络来识别蝴蝶,那么它在识别狗方面将毫无用处。同样,如果您训练一个时间序列模型来预测一只股票的波动率,那么它可能无法预测另一只股票的波动率。如果您有特定的任务(例如面部识别)并且您不想花费大量时间训练网络,那么 ashukid 的建议似乎很有趣。祝您未来的机器学习工作好运!如果您训练时间序列模型来预测一只股票的波动率,那么它可能无法预测另一只股票的波动率。如果您有特定的任务(例如面部识别)并且您不想花费大量时间训练网络,那么 ashukid 的建议似乎很有趣。祝您未来的机器学习工作好运!如果您训练时间序列模型来预测一只股票的波动率,那么它可能无法预测另一只股票的波动率。如果您有特定的任务(例如面部识别)并且您不想花费大量时间训练网络,那么 ashukid 的建议似乎很有趣。祝您未来的机器学习工作好运!