我有以下数据集,我正在考虑使用 RNN/LSTM 对协议进行分类。数据包含来自数据包捕获的特征,只有两个提供的字段:设备 MAC 地址的 OUI 和特定协议的数据包的到达间隔时间 (IAT)。
例如,从特定设备类型的角度来看,http 和 ntp 的标记数据如下所示:
# MAC, ConnectivityIAT -> protocol
ff:f1:f2, 10, -> http
ff:f1:f2, 20, -> http
ff:f1:f2, 30, -> http
ff:f1:f2, 0, -> http
ff:f1:f2, 3, -> ntp
ff:f1:f2, 6, -> ntp
ff:f1:f2, 9, -> ntp
任务是在以下情况下预测正确的类别:
ff:ff1:f2, 10 -> ?
可见。
问题:
- 如何将 OUI 的分类值转换为数字实体
- 如何使用 NN 解决方案?