Questions tagged «java»

5
研究生统计课程提供的用于统计的开源Java库
我正在应用统计专业的研究生课程中学习,该课程使用以下教科书(以使您了解所涵盖的材料的水平):统计概念和方法,由GK Bhattacharyya和RA Johnson撰写。 教授要求我们对家庭作业使用SAS。 我的问题是:是否有一个Java库可以代替SAS用于此类类中常见的问题。 我目前正在尝试使用Apache Math Commons,尽管该库给我留下了深刻的印象(它的易用性和易理解性),但它似乎甚至缺少一些简单的东西,例如绘制直方图的能力(将其与图表库结合的想法) )。 我看过柯尔特,但最初的兴趣很快就消失了。 我们将不胜感激-我已经在Stackoverflow上查看了类似的问题,但没有发现任何令人信服的内容。 注意:我知道R,SciPy和Octave以及对它们进行调用的Java库-我正在寻找Java本机库或一组库,它们可以一起提供我要寻找的功能。 注意:此类课程中涉及的主题通常包括:单样本和两样本检验以及均值和中位数的置信区间,描述性统计量,拟合优度检验,单向和双向方差分析,同时推断,检验方差,回归分析和分类数据分析。
15 r  sas  java 

4
平滑时间序列数据
我正在构建一个Android应用程序,该应用程序在睡眠期间记录加速度计数据,以便分析睡眠趋势并有选择地在轻度睡眠期间将用户唤醒在所需时间附近。 我已经建立了收集和存储数据以及警报的组件。我仍然需要以一种非常有意义和清晰的方式来应对显示和保存睡眠数据的难题,最好也可以进行分析。 几张图片说了两千个字:(由于重复率低,我只能发布一个链接) 这是未过滤的数据,以30秒为间隔收集的移动总和 和相同的数据,通过我自己的移动平均平滑表现进行了平滑 编辑)这两个图表都反映了校准-有一个最小的``噪声''过滤器和一个最大截止过滤器以及一个警报触发电平(白线) 不幸的是,这些都不是最优的解决方案-第一个对于普通用户来说有点难以理解,第二个更容易理解,却隐藏了很多实际情况。特别是,平均消除了运动中尖峰的细节,我认为这些可能是有意义的。 那么,为什么这些图表如此重要?这些时间序列会在整个晚上作为对用户的反馈进行显示,并将在以后存储以供查看/分析。平滑处理将理想地降低内存成本(RAM和存储),并使这些资源匮乏的电话/设备上的渲染速度更快。 显然,有一种更好的方法来平滑数据-我有一些模糊的想法,例如使用线性回归来找出运动中的“尖锐”变化,并据此修改移动平均值的平滑度。在深入研究可以更优化地解决问题之前,我确实需要更多指导和意见。 谢谢!

1
R / mgcv:为什么te()和ti()张量积产生不同的曲面?
的mgcv软件包R具有两个功能,用于拟合张量积相互作用:te()和ti()。我了解两者之间的基本分工(拟合非线性交互与将这种交互分解为主要效果和交互)。我不明白的是为什么te(x1, x2)而ti(x1) + ti(x2) + ti(x1, x2)可能产生(略)不同的结果。 MWE(改编自?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
如何从数据确定韦布尔参数?
我有风速数据的直方图,通常使用韦伯分布来表示。我想计算出最适合直方图的weibull形状和比例因子。 我需要一个数值解决方案(与图形解决方案相对),因为目标是通过编程确定weibull形式。 编辑: 每10分钟收集一次样本,风速在10分钟内取平均值。样本还包括每个时间间隔内记录的最大和最小风速,目前暂时忽略,但我想稍后介绍。料斗宽度为0.5 m / s

3
当n,p都大时,PCA太慢:替代方案?
问题设定 我有高维度(4096)的数据点(图像),我正尝试以2D方式进行可视化。为此,我以类似于以下Karpathy示例代码的方式使用t- sne。 该scikit学习文档,建议使用PCA先降低数据的维度: 如果特征数量非常多,强烈建议使用另一种降维方法(例如,对于密集数据使用PCA或对于稀疏数据使用TruncatedSVD)将尺寸数量减少到合理的数量(例如50个)。 我正在使用Darks.Liu的以下代码在Java中执行PCA: //C=X*X^t / m DoubleMatrix covMatrix = source.mmul(source.transpose()).div(source.columns); ComplexDoubleMatrix eigVal = Eigen.eigenvalues(covMatrix); ComplexDoubleMatrix[] eigVectorsVal = Eigen.eigenvectors(covMatrix); ComplexDoubleMatrix eigVectors = eigVectorsVal[0]; //Sort sigen vector from big to small by eigen values List<PCABean> beans = new ArrayList<PCA.PCABean>(); for (int i = 0; i < eigVectors.columns; i++) { …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.