数据挖掘 - 如何在线性回归模型中使用正确的权重 - 吾爱随笔录

我试图了解我们能否实现一个简单的线性回归模型。

假设我们正在预测价格货币。我们想知道货币是否会上涨。

据我了解，我们需要为此定义两个向量：

$x=[1,2,3,4,5,6,7,8,9,10,11,12]$ - 月

$y=[2.30,2.33,2.29,2.30,2.36,2.40,2.46,2.50,2.48, 2.43,2.38,2.35]$ - 平均价格。

让我们绘制这个：

在 sigmoid 分隔符之前，我将尝试一个简单的线性分隔符。

我猜首先，我需要选择一些随机斜率（并且偏差将是向量中的最小标量）。

$f(x) = 0.026x+2.3$

如我们所见，分离器不准确，让我们尝试 f(1) 处的二次成本函数：

$C = \frac{1}{N} \sum_{i=0}^{N}(\hat{y} - y)^2$

$C = \frac{1}{1} \sum_{i=0}^{1}(2.3259999999999996-2.30)^2=0.0006759999999999897$

一开始它似乎是准确的，但随着它的进展它变得更糟，所以我需要以某种方式改进它。

据我所知，下一步是求函数的导数。

通常，梯度下降算法用于此，但在这里找到切线的斜率非常容易：

$\frac{dy}{dx} = 0.026$

你下一步怎么做？我如何使用这个导数来使用适当的权重来最小化成本函数？