我想调查航空公司的定价行为-特别是航空公司对竞争对手定价的反应。
就像我说的那样,我对更复杂的分析的知识是非常有限的,我几乎已经完成了所有基本方法来收集数据的整体视图。这包括简单的图形,这些图形已经有助于识别相似的模式。我也在使用SAS Enterprise 9.4。
但是,我正在寻找一种基于数字的方法。
数据集
我正在使用的(自己)收集的数据集包含大约54.000的车费。每天(每天晚上00:00)在60天的时间范围内收集所有票价。
因此,该时间窗口内的每个票价都会出现次,这要取决于票价的可用性以及航班的出发日期(如果超过了票价的收取日期)。 (如果航班的出发日期是过去的日期,则无法为该航班收取票价)
未经格式化的基本上看起来像这样:(伪数据)
+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32 | 16APR2015:10:50:02 | 23APR2015:21:55:04 | XA |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32 | 16APR2015:13:20:02 | 23APR2015:19:00:04 | XY |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32 | 16APR2015:13:20:02 | 23APR2015:21:55:04 | XH |
+--------------------+-----------+--------------------+--------------------------+---------------+
通过计算“ DaysBeforeDeparture” ,其中
- 我和时间间隔(出发前几天)
- 票价的日期和日期(航班出发)
- 收取车费的日期和日期
这是一个由I(DaysBeforeDep。)设置的分组数据的示例(伪数据!):
+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 880.68 | 477.99 | 2,245.23 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 904.89 | 477.99 | 2,534.55 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 1,044.39 | 920.99 | 2,119.09 | LH |
+-----------------+------------------+------------------+------------------+------------------+
到目前为止我想出了什么
查看折线图,我已经可以估计出几条线将具有较高的相关系数。因此,我尝试首先对分组数据使用相关性分析。但这是正确的方法吗?基本上,我现在尝试在平均值上而不是在单个价格上进行关联?还有其他方法吗?
我不确定哪种回归模型适合此处,因为价格不会以任何线性形式移动并呈现非线性。我是否需要对航空公司的价格发展进行模型拟合
PS:这是一堵长文字墙。如果我需要澄清任何事情,请告诉我。我是这个新手。
有人知道吗?:-)