首先,免责声明:我不确定这是否是这个问题的正确 Stack Exchange,但我不知道机器学习特定的 SE。
我正在研究表征高能物理学中的粒子射流。我正在尝试使用图像识别技术,特别是卷积神经网络将喷气机分为两类。
这些类可以通过以下特征进行区分:
- 检测器层之间的命中数突然“跳跃”
- 命中集中半径
- 沉积在每一层的能量
我正在使用 123x123x4 图像。每个通道中的每个像素代表沉积在探测器层中的能量水平。我担心在深度学习方法中甚至可能无法做到这一点,因为每张图像中通常只有 150-300 个像素。
我想使用 ConvNet 对两种不同类型的喷气机进行分类。但是,我不确定要使用什么架构。
还有其他变量在分类中可能很重要,我也希望能够包括这些变量(可能在输出之前的密集层中)。
我尝试了以下架构,并使用 Ada、Admax 和 Adadelta 进行了训练,但没有收敛:
___________ _________ _________ _________ ________ ______
| Conv | | Max | | Conv | | Max | | | | |
Image --> | Layer 1 | --> | Pool 1 | --> | Layer 2 | --> | Pool 2 | -->| | | |
|_________| |________| |_________| |________| | Dense | | Out |
| Layer |-->|_____|
Other ------------------------------------------------------------>| |
Data | |
|_______|
对我应该尝试的架构有什么建议吗?