我正在尝试编写一个识别 SQL 查询模式的应用程序。该程序将跟踪数据库中执行的所有查询。当它识别出数据库中有相当大的模式变化时,它会要求 DBA 调整数据库。我的追踪数据看起来像这样。
图像显示了 2 个不同月份的查询执行计数。根据图像,查询执行中有相当大的模式变化。Query2 大部分时间在第一个数据集中执行,Query3 大部分时间在第二个数据集中执行。我想数学计算这种模式差异。我能想到的一种解决方案是计算每个查询的执行计数的百分比差异并将其全部加起来。如果该值大于预定义的阈值,我可以向 DBA 发送通知。有没有更好的方法来做到这一点?任何可以应用的数据分析技术?有没有图书馆可以做到这一点?

