我有一个数据集并想找到参数使得它最小化总和
那是
我有一个数据集并想找到参数使得它最小化总和
可能您要求证明中位数可以解决问题?好吧,这可以这样做:
目标是分段线性的,因此除了点之外是可微的。目标的斜率是多少是某个点?好吧,斜率是映射这是(对于)或(对于)。因此,斜率表示有多少小于。如果有同样多的小于和大于(对于偶数个),您会看到斜率为零。如果有奇数个's 那么斜率是“中间”一个左侧的-1和它右侧的+1,因此中间的一个是最小值。
中位数方面的显式解决方案是正确的,但针对 mayenew 的评论,这是另一种方法。
众所周知,最小化问题,特别是后置问题,可以通过线性规划来解决。
以下 LP 公式将适用于未知数的给定练习:
显然必须等于至少,因此这要求将误差的绝对值之和最小化。
显示这一点的过度凸分析方法只是采用次梯度。事实上,这相当于其他一些涉及斜率的答案中使用的推理。
优化问题是凸的(因为目标是凸的并且没有约束。)另外,是
-1 如果
[-1,1] 如果
+1 如果。
由于当且仅当凸函数的子梯度包含零时,凸函数才被最小化,并且凸函数和的子梯度是子梯度的(集合)和,因此当且仅当是中位数 x_k 。