改进卷积神经网络的指南?
机器算法验证
卷积神经网络
超参数
2022-03-21 06:12:18
3个回答
除了尝试之外,有人会知道如何解决为 CNN 寻找好的参数(包括架构)的问题吗?
不。因此,它们通过“研究生血统”进行了优化:)
mnist 的标准架构是 lenet-5,以及密切相关的变体,例如 Karpathy 的 convnetjs实现,它使用以下层:
type:'input', out_sx:24, out_sy:24, out_depth:1
type:'conv', sx:5, filters:8, stride:1, pad:2, activation:'relu'
type:'pool', sx:2, stride:2
type:'conv', sx:5, filters:16, stride:1, pad:2, activation:'relu'
type:'pool', sx:3, stride:3
type:'softmax', num_classes:10
(我认为它通过从原始 28x28 图像中切割随机 24x24 补丁来增强数据,这是在这个(微小的)数据集上获得更高准确度的关键部分)。
有元学习技术,这是一个开放的研究领域。例如,Barret Zoph 和 Quoc Le 于 2016 年撰写的“使用强化学习进行神经架构搜索” ,使用强化学习来尝试不同的架构,找出效果良好的架构。它以自动化的方式执行此操作,无需人工干预。当然,这需要大量的 GPU 能力......
您可能首先使用 PCA 对数据进行去相关,然后将对象钳制到您的输入节点(即,将 PCA 从 PCA 输入到 CNN)。您选择了任何功能,还是使用了所有功能?(不知道功能是否被预先选择,用户是否应该使用所有东西?)。
其它你可能感兴趣的问题
