我想调查航空公司的定价行为——特别是航空公司对竞争对手定价的反应。
正如我所说,我对更复杂分析的了解非常有限,我已经完成了大部分基本方法来收集数据的整体视图。这包括已经有助于识别相似模式的简单图表。我也在使用 SAS Enterprise 9.4。
但是我正在寻找一种基于数字的方法。
数据集
我正在使用的(自己)收集的数据集包含大约 54.000 票价。所有票价均在 60 天的时间窗口内每天收集(每晚 00:00)。
因此,该时间窗口内的所有票价都会发生时间取决于票价的可用性以及航班的出发日期,当它超过票价的收取日期时。 (当航班的出发日期为过去时,您无法收取该航班的票价)
未格式化的基本上是这样的:(假数据)
+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32 | 16APR2015:10:50:02 | 23APR2015:21:55:04 | XA |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32 | 16APR2015:13:20:02 | 23APR2015:19:00:04 | XY |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32 | 16APR2015:13:20:02 | 23APR2015:21:55:04 | XH |
+--------------------+-----------+--------------------+--------------------------+---------------+
“DaysBeforeDeparture”通过以下方式计算在哪里
- I & 间隔(出发前几天)
- s & 票价日期(航班出发)
- c & 收取票价的日期
以下是 I (DaysBeforeDep.) 分组数据集的示例(假数据!):
+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 880.68 | 477.99 | 2,245.23 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 904.89 | 477.99 | 2,534.55 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 1,044.39 | 920.99 | 2,119.09 | LH |
+-----------------+------------------+------------------+------------------+------------------+
到目前为止我想出了什么
查看折线图,我已经可以估计几条线将具有很高的相关因子。因此,我尝试首先对分组数据使用相关性分析。但这是正确的方法吗?基本上我现在尝试对平均值而不是单个价格进行相关性?还有其他方法吗?
我不确定哪个回归模型适合这里,因为价格不会以任何线性形式移动并且看起来是非线性的。我是否需要为航空公司的每个价格发展拟合一个模型
PS:这是一堵长长的文字墙。如果我需要澄清任何事情,请告诉我。我是这个潜艇的新手。
任何人的线索?:-)