Questions tagged «interpolation»

给定一组二元数据(x,y),如果x的值在的测量值范围内,则将与没有测量y的x的值对应的y的值推算为插值X。

4
外推v。内插
外推法和内插法有什么区别,使用这些术语的最精确方法是什么? 例如,我在论文中看到了一个使用插值的语句: “该过程在bin点之间插入估计函数的形状” 同时使用外推法和内插法的句子例如: 在上一步中,我们使用内核方法将内插函数外推到左侧和右侧的温度尾部。 有人可以提供一种清晰易用的方法来区分它们,并通过示例指导如何正确使用这些术语吗?


1
我如何找到统计表中未给出的值?
人们通常使用程序来获取p值,但有时出于某种原因(可能出于某种原因)可能需要从一组表中获取临界值。 给定具有有限数量的显着性水平和有限数量的自由度的统计表,我如何在其他显着性水平或自由度下获得近似临界值(例如使用,卡方或表) ?tŤtFFF 也就是说,如何在表中的值之间找到“值”?

8
插值与回归概念有何关系?
简单解释一下插值的含义。它与回归的概念有什么关系? 插值法是一种在表的各行之间阅读的技巧,在基本数学中,该术语通常表示从该函数的一组给定值或表格值中计算出函数中间值的过程。 我不能回答第二个问题。请帮忙

3
拟合多元自然三次样条
注:用了一个月后,没有正确的答案,我要重新发布SO 背景 我有一个模型fff,其中Y=f(X)Y=f(X)Y=f(\textbf{X}) 是来自 m个参数的样本的 n × m矩阵, Y是模型输出的 n × 1向量。XX\textbf{X}n×mn×mn \times mmmmYYYn×1n×1n \times 1 是计算密集型的,因此我想使用多变量三次样条曲线通过(X ,Y )点来近似 f,以便可以在更多点上评估 Y。ffffff(X,Y)(X,Y)(X,Y)YYY 题 是否有R函数可以计算X和Y之间的任意关系? 具体来说,我正在寻找该splinefun函数的多元版本,该版本针对单变量情况生成样条函数。 例如这是 splinefun单变量情况下的工作方式 x <- 1:10 y <- runif(10) foo <- splinefun(x,y) foo(1:10) #returns y, as example all(y == foo(1:10)) ## TRUE 我尝试过的 我已经审查了mda软件包,并且似乎应该可以进行以下操作: library(mda) x <- …

2
插值的统计依据是什么?
假设我们有两个点(下图:黑色圆圈),并且我们想在它们之间找到第三个点的值(十字)。实际上,我们将根据实验结果(黑点)对其进行估算。最简单的情况是画一条线然后找到该值(即线性插值)。如果我们有支持点,例如,两侧都有棕色点,我们希望从中受益并拟合非线性曲线(绿色曲线)。 问题是,将红十字标记为解决方案的统计推理是什么?为什么其他十字架(例如黄色十字架)在可能的地方没有答案?什么样的推论或(?)促使我们接受红色的? 我将基于针对这个非常简单的问题的答案来提出我的原始问题。

4
插值可保留每周平均值的流感数据
编辑 我找到了一篇准确描述我所需程序的论文。唯一的不同是,论文将每月均值数据插值到每日,同时保留了每月均值。我很难在中实施该方法R。任何提示表示赞赏。 原版的 对于每周,我有以下计数数据(每周一个值): 医生会诊数 流感病例数 我的目标是通过插值获得每日数据(我想到了线性或截断的样条曲线)。重要的是,我要保留每周平均值,即每日内插数据的平均值应等于本周的记录值。此外,插值应平滑。可能出现的一个问题是某个星期少于7天(例如,在一年的开始或结束时)。 对此,我将不胜感激。 非常感谢。 以下是1995年的示例数据集(已更新): structure(list(daily.ts = structure(c(9131, 9132, 9133, 9134, 9135, 9136, 9137, 9138, 9139, 9140, 9141, 9142, 9143, 9144, 9145, 9146, 9147, 9148, 9149, 9150, 9151, 9152, 9153, 9154, 9155, 9156, 9157, 9158, 9159, 9160, 9161, 9162, 9163, 9164, 9165, 9166, 9167, 9168, …

1
套索的LARS与坐标下降
使用LARS [1]与使用坐标下降来拟合L1正则化线性回归有什么优缺点? 我主要对性能方面感兴趣(我的问题往往有N成千上万且p小于20。)但是,任何其他见解也将受到赞赏。 编辑:自从我发布问题以来,chl亲切地指出了Friedman等人的论文[2],其中坐标下降比其他方法快得多。如果是这样,作为执业医生,我是否应该忘掉LARS来支持协调下降? [1]埃弗隆·布拉德利;海蒂·特雷弗;约翰·斯通,伊恩和蒂布希拉尼·罗伯特(2004)。“最小角度回归”。统计年鉴32(2):第407-499页。 [2] Jerome H. Friedman,Trevor Hastie,Rob Tibshirani,“通过坐标下降的广义线性模型的正则化路径”,《统计软件》,第1卷。33,第1期,2010年2月。

5
如何在大量数据点中进行值的插补?
我的数据集非常大,大约缺少5%的随机值。这些变量相互关联。以下示例R数据集只是一个具有虚拟相关数据的玩具示例。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
克里格插值如何工作?
我正在研究一个问题,我需要使用克里金法基于周围的一些变量来预测某些变量的值。我想自己实现它的代码。因此,我阅读了太多文档以了解其工作原理,但我感到非常困惑。通常,我知道它是加权平均值,但是我无法完全理解计算权重然后预测变量值的过程。 谁能简单地向我解释这种插值方法的数学方面及其工作原理?

1
傅里叶/三角插值
背景 在Epstein(1991)的一篇论文中:在从月均值获取每日气候值时,给出了用于计算周期值和偶数值的傅里叶插值的公式和算法。 在本文中,目标是通过插值从每月平均值中获取每日值。 简而言之,假设可以用谐波分量之和表示未知的每日值: 在论文中,(时间)以月表示。ÿ(t )=一个0+∑Ĵ[一个Ĵcos(2 πj t / 12 )+bĴ罪(2 πĴ t / 12 )]ÿ(Ť)=一个0+∑Ĵ[一个Ĵcos⁡(2πĴŤ/12)+bĴ罪⁡(2πĴŤ/12)] y(t) = a_{0} + \sum_{j}\left[a_{j}\,\cos(2\pi jt/12)+b_{j}\,\sin(2\pi jt/12)\right] ŤŤt 经过一些推导,显示出这些项可以通过以下方式计算: 其中表示每月平均值,表示月份。一个0一个ĴbĴ一个6b6=∑ŤÿŤ/ 12= [ (πj / 12 )/罪(πj / 12 )] ×∑Ť[ÿŤcos(2 πĴ Ť/12)/6] j=1,…,5=[(πj/12)/sin(πj/12)]×∑T[YTsin(2πjT/12)/6] j=1,…,5=[(πj/12)/sin(πj/12)]×∑T[YTcos(πT)/12]=0a0=∑TYT/12aj=[(πj/12)/sin⁡(πj/12)]×∑T[YTcos⁡(2πjT/12)/6] j=1,…,5bj=[(πj/12)/sin⁡(πj/12)]×∑T[YTsin⁡(2πjT/12)/6] j=1,…,5a6=[(πj/12)/sin⁡(πj/12)]×∑T[YTcos⁡(πT)/12]b6=0 \begin{align} a_{0} &= \sum_{T}Y_{T}/12 \\ a_{j} &= \left[ …

2
关于克里金的困惑
我正在阅读这篇有关克里金法的维基百科文章。我不明白那部分,当它说 克里格计算最佳线性无偏估计,,的使得克里格的与所述无偏性条件最小化方差。我没有得到推导,也没有得到方差如何最小化。有什么建议么?Z^(x0)ž^(X0)\hat Z (x_0)Z(x0)ž(X0)Z(x_0) 特别地,在没有偏见的情况下,我没有得到尽量减少应用的部分。 我认为应该 是E [Z'(x0)-Z(x0)]而不是E [Z'(x)-Z(x)]。'等同于Wiki文章中的hat。我也没有得到克里金法误差的推导方式

2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.