使用机器学习技术对时间序列传感器数据进行建模?

机器算法验证 机器学习 时间序列 造型
2022-04-17 04:37:37

我从事空气质量传感器的工作,其中一些是电化学气体传感器。作为背景,这些传感器受到恒电位仪电路的刺激,恒电位仪电路施加偏置电压,然后测量流过传感器的电流(通常为纳安级)。流过传感器的电流量与传感器暴露的目标气体的浓度有关。电流还与压力、相对湿度、温度和暴露于交叉敏感气体有关,这是我存在的祸根。

根据传感器制造商的建议,我们传统上使用数据建模方法将传感器测量的电流解释为目标气体的浓度。我们通过测量对清洁空气和温度范围的响应来做到这一点,然后使用该特征来解释与目标气体暴露有关的特征基线响应的偏差。

我们没有办法真正评估该模型的质量,因为我们既没有参考仪器,也没有将传感器暴露在受控气体浓度下的方法,但我们能够按顺序将传感器暴露在目标气体中确认它们对目标气体有明显反应。

我遇到的挑战是,由上述特征参数化的数据模型,在更长的时间段(即一周)内,并在温度、相对湿度和压力自然发生的变化下受到清洁空气的影响,产生的跨度为解释浓度的变化过大。它不是嘈杂,而是在漂移。这让我相信数据模型非常缺乏。

这使我认为算法(机器学习)方法可能会产生更好的结果。鉴于我有清洁空气条件下温度、相对湿度、压力和传感器电流(均为实值)的一分钟分辨率数据,哪些工具最适合将传感器电流建模为温度、相对湿度的函数,和压力?我最担心的是我们实际上无法创建代表输入空间合理横截面的条件。

然后,我将使用传统数据模型来解释与预测基线的偏差以估计气体浓度。

附带说明的是,温度和相对湿度在物理上是相关的,尽管我可以从数学上将绝对湿度与温度、相对湿度和压力相抵消,我认为这会使它不相关。

更新/澄清

如果上述内容不清楚,我们的目标是能够估计传感器在清洁空气环境中不同压力、湿度和温度条件下产生的基线电压——作为使用偏转的一种手段预测基线作为计算目标物质气体浓度时感兴趣的信号。所以基本上我正在研究仪器领域中通常称为零校准的替代方法。

如果我有关于目标物种的真实数据,在我看来,我似乎可以跳过关于偏离预测基线的业务,直接从电压、温度、湿度和压力时间向量估计浓度。

1个回答

编辑和 TL;DR 版本:这可以被视为调解/主持人分析问题,但这仍然需要独立测量来校准设备。

这听起来像是一个调解/调节分析问题,而不是机器学习。

让 M1 是洁净空气条件下的电压模型,它是 p、v 和湿度的函数。与 M1 本身的偏差不会给你一个集中估计。它会给你一个气体存在并干扰传感器的可能性。对于每个 p、v 和湿度值,某个偏差(残差值)不会表示目标气体的相同浓度,因为气体影响电压的方式随其他参数而变化。同样,假设从 2mV 到 4mV 的偏差并不一定意味着浓度翻了一番——比例可能是非线性的,比例本身可能会受到其他变量的影响。换句话说,查看测量值与 M1 预测值之间的差异是个好主意,

另一种更接近实际情况的看待它的方法是将浓度视为自变量,将传感器电压视为因变量,将 p、t 和 hum 视为调节变量。您需要诱导不同浓度的气体并在不同的 t、p 和 hum 值下进行测量,以使其正常工作。

以下是一些资源:

顺便说一句,这是一个有趣的、几乎是哲学问题的圣诞假期,所以如果你有一个真实或模拟的数据集想要添加到你的问题中,我会看看它。

结语

我把这篇文章和数据展示给了一位测量专家和一位同时也是测量理论专家的工程师,他们都说“拿到带有校准设备的手提箱”。只是没有办法解决它。