Questions tagged «functional-data-analysis»

3
对数转换的预测变量和/或响应的解释
我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。 考虑以下情况 log(DV) = Intercept + B1*IV + Error 我可以将IV解释为百分比增长,但是当我拥有 log(DV) = Intercept + B1*log(IV) + Error 或当我有 DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
是否存在两个分布之间的Hellinger距离的无偏估计量?
在一个观察密度为的分布的分布的环境中,我想知道是否存在一个对密度为另一分布即 的Hellinger距离的无偏估计量(基于)。X1,…,XnX1,…,XnX_1,\ldots,X_nfffXiXiX_if0f0f_0H(f,f0)={1−∫Xf(x)f0(x)−−−−−−−−√dx}1/2.H(f,f0)={1−∫Xf(x)f0(x)dx}1/2. \mathfrak{H}(f,f_0) = \left\{ 1 - \int_\mathcal{X} \sqrt{f(x)f_0(x)} \text{d}x \right\}^{1/2}\,.

2
从统计角度看:傅立叶变换与基于傅立叶基础的回归
我试图了解离散傅里叶变换是否使用傅里叶基础给出与回归相同的曲线表示。例如, library(fda) Y=daily$tempav[,1] ## my data length(Y) ## =365 ## create Fourier basis and estimate the coefficients mybasis=create.fourier.basis(c(0,365),365) basisMat=eval.basis(1:365,mybasis) regcoef=coef(lm(Y~basisMat-1)) ## using Fourier transform fftcoef=fft(Y) ## compare head(fftcoef) head(regcoef) FFT给出一个复数,而回归给出一个实数。 他们传达相同的信息吗?两组数字之间是否存在一对一的映射? (如果答案是从统计学家的角度而不是工程师的角度写的,我将不胜感激。我可以找到许多在线资料,到处都有工程术语,这使它们对我而言不太可口。)

2
如何模拟功能数据?
我正在尝试测试各种功能数据分析方法。理想情况下,我想测试关于模拟功能数据的方法。我试图使用一种基于求和高斯噪声(以下代码)的方法来生成模拟FD,但与真实物体相比,所得曲线看起来过于坚固。 我想知道是否有人指向函数/思想以生成更逼真的模拟功能数据。特别地,这些应该是平滑的。我是该领域的新手,欢迎任何建议。 library("MASS") library("caTools") VCM<-function(cont,theta=0.99){ Sigma<-matrix(rep(0,length(cont)^2),nrow=length(cont)) for(i in 1:nrow(Sigma)){ for (j in 1:ncol(Sigma)) Sigma[i,j]<-theta^(abs(cont[i]-cont[j])) } return(Sigma) } t1<-1:120 CVC<-runmean(cumsum(rnorm(length(t1))),k=10) VMC<-VCM(cont=t1,theta=0.99) sig<-runif(ncol(VMC)) VMC<-diag(sig)%*%VMC%*%diag(sig) DTA<-mvrnorm(100,rep(0,ncol(VMC)),VMC) DTA<-sweep(DTA,2,CVC) DTA<-apply(DTA,2,runmean,k=5) matplot(t(DTA),type="l",col=1,lty=1)

1
PROC Mixed和LME / LMER在R自由度上的区别
注意:这个问题是一个转贴,因为我的上一个问题出于法律原因不得不删除。 在比较SAS的PROC MIXED与R中lme的nlme软件包的功能时,我偶然发现了一些相当混乱的差异。更具体地说,不同测试的自由度在PROC MIXED和之间有所不同lme,我想知道为什么。 从以下数据集(以下给出的R代码)开始: ind:指示进行测量的个人的因子 fac:进行测量的器官 trt:表示治疗的因素 y:一些连续响应变量 这个想法是建立以下简单模型: y ~ trt + (ind):ind作为随机因子 y ~ trt + (fac(ind)):fac嵌套在ind作为随机因子 需要注意的是最后一个模型应引起奇异性,因为只有1的值y对每一个组合ind和fac。 第一模型 在SAS中,我建立以下模型: PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; 根据教程,R中使用的相同模型nlme应为: > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 两种模型对系数及其SE均给出相同的估计,但是在对F的影响进行F检验时trt,它们使用的自由度不同: SAS : Type …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

3
密度函数的预测
我正在做一些有关预测概率密度函数的时间序列的研究。我们的目标是根据历史观察到的(通常是估计的)PDF来预测PDF。我们正在开发的预测方法在模拟研究中表现良好。 但是,我需要一个来自实际应用的数值示例来进一步说明我们的方法。因此,在应用程序(金融,经济学,生物学,工程学等)中是否有适当的示例,这些示例收集了PDF的时间序列,并且预测这样一个时间序列既重要又难于预测?

1
使用R中的fda包预测新曲线的响应
基本上,我要做的就是使用一些曲线来预测标量响应。我已经做完了回归(使用fda包中的fRegress进行回归),但不知道如何将结果应用于一组新曲线(用于预测)。 我有N = 536曲线和536标量响应。到目前为止,这是我所做的: 我为曲线创建了基础。 我创建了一个fdPar对象来引入罚款 我已经使用smooth.basis创建了fd对象,以在指定的基础上以选定的代价对曲线进行平滑处理。 我使用fRegress()进行了回归,对标量响应上的曲线进行回归。 现在,我要做的就是使用该回归为我拥有的一组新数据生成预测。我似乎找不到简单的方法来做到这一点。 干杯

1
动态时间规整和规范化
我正在使用动态时间规整来匹配“查询”和“模板”曲线,到目前为止取得了一定的成功,但是我有一些基本问题: 我正在通过评估DTW结果是否小于我启发式得出的某个阈值来评估“匹配”。这是使用DTW确定“匹配”的一般方法吗?如果没有,请说明... 假设(1)的答案是“是”,那么我感到困惑,因为DTW结果对a)曲线幅度的差异和b)查询向量的长度以及“模板”矢量。 我正在使用对称步长函数,因此对于(b),我通过除以M + N(DTW矩阵的宽度+高度)来归一化我的DTW结果。这似乎有些有效,但是似乎会惩罚距离对角线更远的DTW匹配(即,通过DTW矩阵的路径更长)。对于“规范化”方法来说,这似乎是任意的。除以通过矩阵的步数似乎有直觉的意义,但根据文献,这似乎并不是解决问题的方法。 那么,是否有更好的方法来针对查询和模板矢量的大小调整DTW结果? 最后,如何针对查询和模板向量之间的幅度差异归一化DTW结果? 实际上,由于缺乏可靠的归一化技术(或我缺乏理解),在处理样本数据以识别用于定义“匹配”的最佳阈值水平时,似乎需要大量的人工工作。我想念什么吗?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.