MATLAB 感知器

数据挖掘 机器学习 matlab
2021-10-04 20:57:29

我似乎无法弄清楚为什么我的错误百分比很高。

我试图在 X1 和 X2 之间获得一个感知器,它们是具有不同均值和相同协方差的高斯分布数据集。

下面是我的代码:

N=200;
C= [2 1; 1 2]; %Covariance
m1=[0 2];
m2=[1.5 0];%mean
X1 = mvnrnd(m1, C, N/2);
X2 = mvnrnd(m2, C, N/2);

X = [X1; X2];
X = [X ones(N,1)]; %bias
y = [-1*ones(N/2,1); ones(N/2,1)]; %classification

%Split data into training and test 
ii = randperm(N);
Xtr = X(ii(1:N/2),:);
ytr = X(ii(1:N/2),:);
Xts = X(ii(N/2+1:N),:);
yts = y(ii(N/2+1:N),:);
Nts = N/2;

w = randn(3,1);
eta = 0.001;
%learn from training set
for iter=1:500 
j = ceil(rand*N/2);
if( ytr(j)*Xtr(j,:)*w < 0)
w = w + eta*Xtr(j,:)'; 
end
end

%apply what you have learnt to test set
yhts = Xts * w;
disp([yts yhts])
PercentageError = 100*sum(yts .*yhts < 0)/Nts;

我做错了什么,我该如何应对这一挑战?

2个回答

对于负面情况,您正在以错误的方向改变权重。

线

w = w + eta*Xtr(j,:)';

应该

w = w + eta*Xtr(j,:)'*ytr(j);

有了这个改变,我得到了 12% 的错误。

我认为这条线是错误的:

ytr = X(ii(1:N/2),:);

ytr 应该是训练数据的标签。在这种情况下,应该是

ytr = y(ii(1:N/2),:);