在不影响峰度的情况下改变偏斜的转换?


11

我很好奇是否存在可以在不影响峰度的情况下改变随机变量的偏斜的变换。这将类似于RV的仿射变换如何影响均值和方差,但不影响偏斜和峰度(部分原因是,偏斜和峰度被定义为不随尺度变化而变化)。这是一个已知问题吗?


您是否还要求标准偏差在此变换中保持恒定?
russellpierce

不,我希望不会,但是过量峰度应保持固定。我希望变换是单调的,最好是确定性的。
shabbychef

1
Yikes-对想要证明不确定性函数的人来说是单调的。
russellpierce

该线程可能使读者感兴趣:进行转换以增加正常rv的峰度和偏度
gung-恢复莫妮卡

Answers:


6

我的回答是全面入侵的开始,但是我不知道有什么行之有效的方法来执行您的要求。

我的第一步是对数据集进行排序,您可以在数据集中找到比例位置,然后将其转换为正态分布,此方法在Reynolds&Hewitt,1996中使用。请参见下面PROCMiracle中的示例R代码。

分布正常后,问题就开始浮现-调整峰度的问题,而不是倾斜的问题。谷歌搜索表明,可以按照John&Draper,1980的方法来调整峰度,但不能调整偏斜-但我无法复制该结果。

我尝试开发一个粗略的扩散/缩小函数,该函数采用输入(规格化)值并与该变量在正常标度上的位置成比例地增加或减去该值,但会导致单调调整,但实际上倾向于创建具有希望的偏度和峰度值的双峰分布。

我意识到这不是一个完整的答案,但我认为这可能会朝正确的方向迈出一步。

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

我一直在做这样的事情:排列,然后使用g-h变换获得固定的峰度和偏度。但是,该技术假设我实际上知道人口峰度,我可以估计,但是从哲学
上讲

@shabbychef:哦,那么抱歉,没有添加任何新内容。但是,您添加了一些新内容,我以前从未听说过g-h公式。您有免费提供的引文吗?我偶然发现了一篇说明清楚的论文(fic.wharton.upenn.edu/fic/papers/02/0225.pdf),但是这种概念对我来说有点陌生(特别是e ^ Z ^ g或其他东西) )?我这样尝试过...但结果似乎很奇怪... a + b *(e ^ g ^ z-1)*(exp((h * z ^ 2)/ 2)/ g)。
russellpierce

1
@drnexus:我不想通过提及我的技术来偏向结果。我从Haynes等人那里了解了g-h和g-k分布。al,dx.doi.org / 10.1016
S0378-3758

1

ññ-1个2样本订单统计信息和转换版本之间的标准受制于给定的约束。但是,这是一种古怪的方法。在最初的问题中,我正在寻找更基本和更基础的东西。我也隐式地在寻找一种可以应用于单个观测的技术,而与整个样本队列无关。


0

我宁愿使用leptokurtic分布而不是使用数据转换来对该数据集建模。我喜欢来自Biometrika的Jones和Pewsey(2009)的sinh-arcsinh分布。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.