Questions tagged «data-augmentation»

3
手动计算逻辑回归95%置信区间与在R中使用confint()函数之间为什么会有区别?
亲爱的大家-我注意到我无法解释的怪事,可以吗?总之:在logistic回归模型中计算置信区间的手动方法和R函数confint()得出不同的结果。 我一直在研究Hosmer&Lemeshow的Applied Logistic回归(第二版)。在第3章中,有一个计算比值比和95%置信区间的示例。使用R,我可以轻松地重现模型: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
通用数据集的数据增强技术?
在许多机器学习应用程序中,所谓的数据增强方法已允许构建更好的模型。例如,假设训练集包含张猫和狗的图像。通过旋转,镜像,调整对比度等,可以从原始图像生成其他图像。100100100 对于图像,数据扩充相对简单。但是,假设(例如)一个训练集包含样本和代表不同事物的数百个连续变量。数据扩充似乎不再那么直观。在这种情况下该怎么办?100100100

3
如何进行数据扩充和训练验证拆分?
我正在使用机器学习进行图像分类。 假设我有一些训练数据(图像),并将其分为训练和验证集。我还想通过随机旋转和噪声注入来增强数据(从原始图像生成新图像)。扩充是离线完成的。 进行数据扩充的正确方法是哪种? 首先将数据分为训练和验证集,然后对训练和验证集进行数据扩充。 首先将数据分为训练集和验证集,然后仅对训练集进行数据扩充。 首先对数据进行数据扩充,然后将数据分为训练和验证集。

3
时间序列预测的数据增强策略
我正在考虑两种策略来对时间序列进行“数据增强”。 首先,有一点背景知识。预测时间序列下一步的预测变量PPP通常取决于以下两个函数:时间序列的过去状态,以及预测变量的过去状态:{ 一一世}{一个一世}\lbrace A_i\rbrace P({ 甲我≤ Ť - 1} ,P小号t − 1)P({一个一世≤Ť-1个},P小号Ť-1个)P(\lbrace A_{i\leq t-1}\rbrace,P_{S_{t-1}}) 如果我们想调整/训练我们的系统以获得一个好的,那么我们将需要足够的数据。有时可用数据还不够,因此我们考虑进行数据扩充。PPP 第一种方法 假设我们有时间序列,具有。并且还假设我们有满足以下条件:。{ 一一世}{一个一世}\lbrace A_i \rbrace1个≤ 我≤ Ñ1个≤一世≤ñ1 \leq i \leq nϵϵ\epsilon0 &lt; ϵ &lt; | 一个我+ 1− A一世| ∀我∈{1,...,Ñ}0&lt;ϵ&lt;|一个一世+1个-一个一世|∀一世∈{1个,…,ñ}0<\epsilon < |A_{i+1} - A_i| \forall i \in \lbrace 1, \ldots,n\rbrace 我们可以构造一个新的时间序列,其中是分布。{ B一世= A一世+ r一世}{乙一世=一个一世+[R一世}\lbrace B_i = …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.