图：和的值的互相关矩阵

asimj1 · Post by **asimj1** » Thu Feb 20, 2025 10:00 am

步骤：机器学习
一旦我们探索了数据并确信预处理产生了正确的结果，我们就会进入工作流程的实际机器学习部分。当我们查看目标变量的分布时，我们意识到我们的数据集高度不平衡。在超过的情况下，没有采取任何行动，这并不奇怪，但对大多数机器学习方法来说是一个问题。我们只需删除“无聊事件”即可获得稍微更平衡的分布。无聊事件是指没有添加或移除自行阿塞拜疆电话号码数据车且当前负载比在到之间的事件。以下步骤是标准步骤（图）：将数据拆分为训练数据集和保留数据集，并在保留集上评估学习到的模型。

我们看到，在保留数据集上的表现还不错，但同样，在生产环境中，我们会在工作流程的这一部分投入更多精力，并且很可能在这个时间序列数据上尝试类似循环神经网络的东西。

图：一个非常基本的机器学习设置。
步骤：将警报写回
工作流程的最后一部分展示了如何使用先前学习的模型在中发出警报。请记住，我们的目标变量是预测未来一小时内何时需要添加或从站点移除自行车。因此，每当预测到此类事件时，我们都会发出警报，以便可以触发发出警报的相应站点的补货流程。

图显示了我们如何从检索原始数据，以与训练数据相同的方式对其进行预处理，然后将学习到的模型应用于它。我们发出警报的部分非常简单：每当模型预测补货事件时，我们就会发出警报。请注意，这仍然假设事件独立，这当然不是真的。实际上，我们会每小时至少对自上次运行以来发生变化的数据运行一次工作流程的这一部分。使用该设置，下次运行工作流程时，补货事件将反映在数据中，并且在将模型应用于新数据时将考虑更新的负载率。

图 ： 和 的值的互相关矩阵

图 ： 和 的值的互相关矩阵

图：和的值的互相关矩阵

图：和的值的互相关矩阵