Questions tagged «spatial»

有关统计方法的研究领域,这些统计方法在其数学计算中直接使用空间和空间关系(例如距离,面积,体积,长度,高度,方向,中心和/或其他数据空间特征)。

1
克里格插值如何工作?
我正在研究一个问题,我需要使用克里金法基于周围的一些变量来预测某些变量的值。我想自己实现它的代码。因此,我阅读了太多文档以了解其工作原理,但我感到非常困惑。通常,我知道它是加权平均值,但是我无法完全理解计算权重然后预测变量值的过程。 谁能简单地向我解释这种插值方法的数学方面及其工作原理?

1
固有的空间平稳性:它仅适用于小滞后吗?
根据固有平稳性的定义: Ë[ Z(x )− Z(x − h )] = 0E[Z(x)−Z(x−h)]=0E[Z(x)-Z(x-h)] = 0 例如,该假设用于普通克里金法,而不是假设整个空间的均值是恒定的,而是假设均值在局部是恒定的。 如果该平均值在附近是恒定的,则逻辑上我们期望彼此接近的两个度量之间的差异为零。但是随着均值随空间的变化而变化,我们不期望彼此相距遥远的值之差为零吗? 因此,固有平稳性的假设不应该是: Ë[ Z(x )− Z(x− h )] = 0E[Z(x)−Z(x−h)]=0E[Z(x)-Z(x-h)] = 0对于h → 0h→0h \to 0
10 spatial 

1
如何在ARIMA模型的观察值48中加入创新的离群值?
我正在处理数据集。使用一些模型识别技术后,我得出了一个ARIMA(0,2,1)模型。 我使用R detectIO包TSA中的函数在对原始数据集进行第48次观察时检测到创新的离群值(IO)。 如何将这个离群值合并到模型中,以便将其用于预测?我不想使用ARIMAX模型,因为我可能无法根据R中的模型做出任何预测。还有其他方法可以做到吗? 以下是我的价值观: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

4
R中的离散时间事件历史(生存)模型
我正在尝试在R中拟合离散时间模型,但不确定如何执行。 我读过您可以将因变量组织在不同的行中,每个时间观察行一个,并将该glm函数与logit或cloglog链接一起使用。从这个意义上讲,我有三列:ID,Event(在每个时间范围内为1或0)和Time Elapsed(自观察开始以来)以及其他协变量。 如何编写适合模型的代码?哪个因变量?我想我可以将其Event用作因变量,并将其包括Time Elapsed在协变量中。但是,会发生什么ID呢?我需要吗? 谢谢。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
如何在线性模型中说明空间协方差?
背景 我有一项实地研究的数据,在该研究中,两个模块中的每个模块有四个处理级别和六个重复项。(4x6x2 = 48个观察值) 街区相距约1英里,街区内有42个2m x 4m地块的网格和1m宽的人行道。我的研究在每个区块中仅使用了24个地块。 我想评估评估空间协方差。 这是一个使用单个块中的数据进行分析的示例,其中不考虑空间协方差。在数据集中,plot图的id是图的ID,图1的中心位于0,0的每个图x的x位置和yy位置。level是处理级别,并且response是响应变量。 layout <- structure(list(plot = c(1L, 3L, 5L, 7L, 8L, 11L, 12L, 15L, 16L, 17L, 18L, 22L, 23L, 26L, 28L, 30L, 31L, 32L, 35L, 36L, 37L, 39L, 40L, 42L), level = c(0L, 10L, 1L, 4L, 10L, 0L, 4L, 10L, 0L, 4L, 0L, …

2
从“均匀间隔”的样本开始在单位磁盘上进行回归
我需要解决单位磁盘上的一个复杂的回归问题。最初的问题吸引了一些有趣的评论,但不幸的是没有答案。同时,我学到了更多有关此问题的知识,因此,我将尝试将原始问题分解为子问题,并查看这次是否运气更好。 我有40个温度传感器,它们定期以单位圆盘内的窄环间隔开: 这些传感器会及时获取温度。但是,由于时间变化远小于空间变化,因此我们通过忽略时间变化来简化问题,并假设每个传感器只给我一个时间平均值。这意味着我有40个样本(每个传感器一个),并且没有重复的样本。 我想根据传感器数据建立回归曲面。回归有两个目标:Ť= f(ρ ,θ )+ ϵT=f(ρ,θ)+ϵT=f(\rho,\theta)+\epsilon 我需要估算平均径向温度曲线。通过线性回归,我已经估算出了一个表面,该表面是平均温度表面,因此,我只需要针对积分我的表面,对吗?如果我使用多项式进行回归,那么这一步应该是小菜一碟。θŤ米Ë 一个Ñ= 克1个(ρ )+ ϵTmean=g1(ρ)+ϵT_{mean}=g_1(\rho)+\epsilonθθ\theta 我需要估算径向温度曲线,这样在每个径向位置。P (Ť (ρ )&lt; Ť 95(ρ ))= 0.95Ť95= 克2(ρ )+ ϵT95=g2(ρ)+ϵT_{95}=g_2(\rho)+\epsilonP(T(ρ )&lt; T95(ρ ))= 0.95P(T(ρ)&lt;T95(ρ))=.95P(T(\rho)<T_{95}(\rho))=.95 给定这两个目标,我应该使用哪种技术对单位磁盘进行回归?当然,高斯过程通常用于空间回归。但是,为单位磁盘定义一个好的内核并不是一件容易的事,因此,我想保持简单并使用多项式,除非您认为这是一个失败的策略。我读过有关Zernike多项式的信息。Zernike多项式似乎适用于单位圆上的回归,因为它们在是周期性的。θθ\theta 选择模型后,我需要选择一种估算程序。由于这是一个空间回归问题,因此应将不同位置的错误关联起来。普通最小二乘法假设存在不相关的错误,因此我想广义最小二乘会更合适。假设gls标准R分布中有一个函数,则GLS似乎是一种相对普遍的统计技术。但是,我从未使用过GLS,并且对此表示怀疑。例如,如何估计协方差矩阵?一个可行的示例,即使只有几个传感器,也将是很棒的。 PS我选择使用Zernike多项式和GLS,因为在我看来这样做是合乎逻辑的。但是,我不是专家,如果您觉得我走错了方向,请随意使用完全不同的方法。

1
克里金法时为什么必须提供方差图模型?
我对空间统计非常陌生,并观看了很多教程, 但是我真的不明白为什么您在克里格时必须提供一个变异函数模型。 我在R中使用gstat包,这是他们提供的示例: library(sp) data(meuse) coordinates(meuse) = ~x+y data(meuse.grid) str(meuse.grid) gridded(meuse.grid) = ~x+y m &lt;- vgm(.59, "Sph", 874, .04) print(m) # ordinary kriging: x &lt;- krige(log(zinc)~1, meuse, meuse.grid, model = m) 有谁能在几行中解释为什么您首先必须提供vgm?以及如何设置参数? 先感谢您!卡斯珀
9 spatial 


1
通过以坐标作为预测变量进行回归建模空间趋势
我打算将坐标作为协变量包括在回归方程中,以便针对数据中存在的空间趋势进行调整。之后,我想测试随机变化中空间自相关的残差。我有几个问题: 我应该执行线性回归,其中仅自变量是和坐标,然后测试空间自相关的残差,还是应该不仅包括坐标作为协变量,还包括其他变量,然后测试残差。xxxyyy 如果我期望具有二次趋势,然后不仅包括,还包括,和,那么其中的一些(和)的值将大于阈值-我应该排除那些值较高的变量不重要吗?那我该如何解释趋势,它肯定不再是二次方了?x,yx,yx,yxyxyxyx2x2x^2y2y2y^2xyxyxyy2y2y^2pppppp 我想我应该将和坐标视为其他任何协变量,并通过构造部分残差图来测试它们是否与因变量具有线性关系...但是一旦我对它们进行了变换(如果它们显示它们需要变换),那将不会不再是那种趋势(特别是如果我将,和在二次趋势中)。例如,它可能表明需要转换,而则不需要转换?在这些情况下我应该如何应对?xxxyyyxyxyxyx2x2x^2y2y2y^2x2x2x^2xxx 谢谢。

3
GPS跟踪中的估计问题
问题:考虑两辆汽车(被称为点对象),分别命名为“领导者和“跟随者,它们都配备有相互通信的GPS设备。的目的是随着在平面上任意移动而尽可能接近假定所有GPS设备都具有规定的均值和规定的协方差矩阵的误差的圆形误差概率(CEP)分布。大号LLFFFFFF大号LLμ = (μX,μÿ)μ=(μx,μy)\mu = (\mu_x,\mu_y)Σ2 × 2Σ2×2\Sigma_{2\times 2} 假设遍历平面中的(分段平滑)曲线,则遍历的期望曲线是什么?此外,路径的分布是什么?LLLCCCFFFFFF 在一段时间内估算的最佳方法是什么?FFFLLL 背景:这是我在实验工作中遇到的实际问题,绝不是家庭作业。我知道诸如卡尔曼滤波之类的工具可以在面对白噪声时实现最佳状态估计,但不确定如何将其扩展到这种情况。我也想知道有关的研究文献。


3
如何使用1%的微数据样本大规模地模拟小区域的人口普查微数据,以及如何在小区域尺度上进行汇总统计?
我想在较小的地理汇总水平(澳大利亚人口普查收集区)中执行个人级别的多元分析。显然,出于隐私原因,无法在这些较小的汇总级别进行人口普查,因此我正在研究其他替代方案。几乎所有感兴趣的变量都是分类变量。我有两个数据集可供使用: 1%的人口普查样本可用于更高级别的空间聚集(一个人口约为190,000且人口统计学的空间分隔较大的区域)。 我在小区域级别上感兴趣的变量的频率表(500个小区域,平均pop = 385,sd = 319,中位数= 355)。 如何使用这两个数据集在小面积级别模拟尽可能接近小面积实际人口的人口分布? 我很欣赏可能有常规的方法来执行此操作;如果是这样,将非常感谢您提供教科书或相关期刊文章的指针。

2
R中基于噪声的应用程序基于密度的空间聚类(DBSCAN)聚类
这个问题开始于“ 在R中聚集空间数据 ”,现在移到了DBSCAN问题。 正如对第一个问题的回答所建议的那样,我搜索了有关DBSCAN的信息并阅读了一些有关的文档。出现了新的问题。 DBSCAN需要一些参数,其中之一是“距离”。由于我的数据是三维,经度,纬度和温度,我应该使用哪个“距离”?哪个尺寸与该距离有关?我想应该是温度。如何找到R的最小距离? 另一个参数是形成聚类的最小点数。有没有找到该号码的方法?不幸的是我没有找到。 我在类似我的数据集中找不到使用dbscan的R示例,您知道有这样的示例的网站吗?因此,我可以阅读并尝试适应我的情况。 最后一个问题是我对DBSCAN的第一次R尝试(没有对先前问题的正确回答)导致内存问题。R说它不能分配向量。我从一个4 km的网格开始,该网格具有779191个点,在删除无效的SST点时,该点以大约300000行x 3列(纬度,经度和温度)结束。解决此内存问题的任何提示。它取决于我的计算机还是DBSCAN本身? 感谢您耐心阅读冗长且可能很无聊的消息以及您的帮助。
9 r  clustering  spatial 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.