航空公司票价-应该使用什么分析方法来检测竞争性的价格制定行为和价格相关性?


12

我想调查航空公司的定价行为-特别是航空公司对竞争对手定价的反应。

就像我说的那样,我对更复杂的分析的知识是非常有限的,我几乎已经完成了所有基本方法来收集数据的整体视图。这包括简单的图形,这些图形已经有助于识别相似的模式。我也在使用SAS Enterprise 9.4。

但是,我正在寻找一种基于数字的方法。

数据集

我正在使用的(自己)收集的数据集包含大约54.000的车费。每天(每天晚上00:00)在60天的时间范围内收集所有票价。收集方式

因此,该时间窗口内的每个票价都会出现次,这要取决于票价的可用性以及航班的出发日期(如果超过了票价的收取日期)。 (如果航班的出发日期是过去的日期,则无法为该航班收取票价)n

未经格式化的基本上看起来像这样:(伪数据)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

通过计算“ DaysBeforeDeparture” ,其中I=sc

  • 我和时间间隔(出发前几天)
  • 票价的日期和日期(航班出发)
  • 收取车费的日期和日期

这是一个由I(DaysBeforeDep。)设置的分组数据的示例(伪数据!):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

到目前为止我想出了什么

查看折线图,我已经可以估计出几条线将具有较高的相关系数。因此,我尝试首先对分组数据使用相关性分析。但这是正确的方法吗?基本上,我现在尝试在平均值上而不是在单个价格上进行关联?还有其他方法吗?

我不确定哪种回归模型适合此处,因为价格不会以任何线性形式移动并呈现非线性。我是否需要对航空公司的价格发展进行模型拟合

PS:这是一堵长文字墙。如果我需要澄清任何事情,请告诉我。我是这个新手。

有人知道吗?:-)

Answers:


9

一位前航空公司收入管理分析师的警告语:您可能会用这种方法树错了树。抱歉,后面的文字墙很抱歉,但是此数据比乍看起来时要复杂得多,而且嘈杂,因此想对它的生成方式做一个简短的描述。有备则无患。

航空公司票价包含两个组成部分:航空公司在某条航线上可使用的所有实际票价(包括票价规则以及您所拥有的一切),其中大多数是由航空公司资费发行公司发布的(一些特殊用途的票价是并非例外,而是例外,而不是规则),以及航空公司日常执行的实际库存管理。

票价可以每天四次,按设定的时间间隔提交给ATPCO,而航空公司这样做时,通常会包括对现有票价的增,减和修改。当航空公司发起定价行动时(假设其竞争对手未尝试在此采取自己的举动),他们通常必须等到下一次更新后才能查看其竞争对手是否遵循/响应。相反,当竞争对手发起定价行动时,航空公司不得不等到下一次更新之后,他们才能做出回应。

现在,就票价而言,这一切都很好,但问题是,由于这一切都已在ATPCO中发布,所以票价是公共信息中的第二好事物……所有竞争对手都可以看到您的所作所为进入您的武器库,因此进行混淆的尝试并非闻所未闻,例如发布实际上不会分配任何库存的票价,将所有票价列为出发日期等。

在许多方面,秘密的秘诀在于实际的库存分配,即您愿意为给定的票价在每个航班上出售多少个座位,并且该信息无法公开获得。您可以通过抓取网络信息来了解一下情况,但是出发时间/日期和票价规则的潜在组合非常多,并且可能迅速升级,超出了您轻松跟踪的能力。

通常情况下,航空公司只会愿意以极低的票价出售少量座位,而那些被绑住的人则必须提前预订,以免票价规则将他们拒之门外,否则其他旅客只会打败他们。航空公司将愿意出售更多座位以提高票价,依此类推。他们会很乐意以所获得的最高票价出售所有座位,但这通常是不可行的。

离出发日期越近,票价越高,您所看到的只是一个自然的过程,即廉价座位被预订得越远,而剩余库存逐渐变得越贵。当然,这里有一些警告。风险管理流程受到积极管理,并且人为干预非常普遍,因为风险管理团队通常会努力实现其收入目标,并在每次航班上实现收入最大化。这样,可以通过关闭低价机票来“收紧”快速补满的航班。通过为较低的票价分配更多的座位,可能会“放松”预订缓慢的航班。

在这一地区,航空公司之间存在着持续不断的相互作用和竞争,但是您不太可能仅从折价中获得实际的动态。别误会,我们可以使用这些工具,尽管有它们的局限性,它们还是很有价值的,但它们只是决策过程中的一个数据源。您将需要访问RM团队每天做出的数百个(如果不是数千个)运营决策,以及他们当时所看到的最新状态信息。如果找不到与之合作的航空公司合作伙伴来获取此数据,则可能需要考虑备用数据源。

我建议您考虑从《官方航空公司指南》(或其竞争对手之一)访问O&D票价数据,并尝试将其用于分析。它是基于样本的(约占售出机票的10%),并且聚合程度高于理想水平,因此必须谨慎选择航线(我建议您选择多家航空公司,每天多次不间断飞行,大型飞机),但您可能可以更好地了解实际售出的商品(平均票价)以及售出的数量(载客率),而不是在特定时间点可以买到的东西。利用这些信息,您可能更有利于至少探索航空公司定价策略的结果,并从那里进行推断。


感谢您的详尽解释。我同意你的看法,这种仅基于价格的分析非常有限。这也特别包括票价规则(可退款机票,最短停留时间等)。可以通过收集始终相同的票价以进行比较来克服某些限制。但是,一个重要的信息-如您提到的那样,缺少可用的座位数(可以是!=飞机上的座位)以及实际售出的机票数量。
s1x 2015年

对此类数据的访问非常有限,并且如果已过时(例如,来自美国DOT的数据库1B)。daccess-ods.un.org daccess-ods.un.org Clark R.和Vincent N.(2012)容量或价格链接等研究包括此类数据,并提供了更好的见解。我意识到了这些限制(希望;-)),正如您所提到的,因为有更多信息会影响价格。不过,当您观察特定市场时,您仍然可以感觉到发生了什么。您可以查看是否存在竞争行为和不同的定价策略方法。但是,您将永远无法找到原因。
s1x 2015年

1
@ s1x-我同意,也希望有个不错的选择,但是,正如您了解到的那样,详细的收入数据是任何一家航空公司最忌妒的秘密。只是想确保您知道这一点以及数据生成过程中涉及的内容。除此之外,我喜欢您要尝试做的事情,我认为另一个答案是在技术上朝着正确方向迈出的一步。如果我可以建议的话,您也可以在数据探索过程中使用各种TS之间的互相关性,因为它对于识别链接的TS之间的模式通常很有价值。
哈布2015年

4

除了描述性和视觉探索性数据分析(EDA)外,我还将尝试使用时间序列分析作为更全面,更复杂的分析。具体来说,我将执行时间序列回归分析。时间序列分析是一个庞大的研究和实践领域,因此,如果您不熟悉基础知识,我建议从上面链接的Wikipedia文章开始,逐步搜索更具体的主题并阅读相应的文章,论文和书籍。

由于时间序列分析是一种非常流行的方法,因此大多数开源和闭源商业数据科学统计 环境(软件)都支持这种方法,例如RPythonSASSPSS等。如果要为此使用R,请检查我有关常规时间序列分析以及时间序列分类和聚类的答案。我希望这会有所帮助。


感谢您的回答@Aleksandr Blekh-非常感谢。病到此为止。可能是一个愚蠢的问题,但是如果我在这里错了,请在这里纠正我:一种关联分析,同时使用一个航空公司作为关联变量。到目前为止,一些航空公司特别支持该结果。那些有代码共享协议的人的价格相似。如此高的相关性吗?例如:ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 我假设这样的结果表明相似的价格模式。通过回归分析,我会发现什么?
s1x

@ s1x:非常欢迎(当然,如果您重视答案,并在获得足够的声誉时也可以随意投票/接受)。现在,关于您的问题。正如我所说,TS分析更加复杂和全面。特别是TS回归,说明了所谓的自回归和其他TS复杂性。因此,我的建议是使用TS回归分析代替简单的传统回归分析。另外,无论您打算执行哪种数据分析,您都应该始终从EDA开始(实际上,EDA通常会更改您的计划)。
Aleksandr Blekh
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.