Questions tagged «software»

确保您的问题与统计,机器学习或数据分析有关,而不仅仅是与编程,支持或错误有关。包括涉及所涉及统计问题的其他标签。

8
关于“实验室笔记本”软件的想法?
因此,这很奇怪,尽管实际上我认为这对任何站点都非常合适,所以我认为我会在我的数据处理专家中尝试一下。 我从生物学学到流行病学和生物统计学,但仍然肯定有该领域的一些习惯。其中之一是保留实验室笔记本。它对于记录思想,决策,关于分析的沉思等等很有用。所有这些都集中在一个地方,所有的事情都发生了,所以我以后可以回顾分析并了解我的所作所为。 但是,最好将其转移到21世纪。特别是因为即使实验室笔记本系统对于一个人来说足够体面并记录决策,还是能够附加来自EDA的图表,来自讨论特定数据集的数据管理员的电子邮件等,这还是很好的。 我猜想这将涉及从许多不同的地方联合起来组装我自己的系统,但是目前有人在使用系统并有任何建议吗?

14
易于强大的数据探索软件
在抵制电子表格混乱的尝试中,我经常宣扬福音,寻求更强大的工具,例如真正的统计软件(R,Stata等)。最近,有人断然地说他们根本不会学习编程,这使我对这种观点提出了挑战。我想为他们提供不需要编程的数据分析工具(但理想情况下,如果他们决定以后将脚趾浸入水中,则可以扩展到编程)。我可以推荐什么样的数据探索软件包?

3
半监督学习,主动学习和深度学习进行分类
最终编辑,所有资源已更新: 对于一个项目,我正在应用机器学习算法进行分类。 挑战: 有限的标记数据和更多的未标记数据。 目标: 应用半监督分类 应用某种程度上的半监督式标签过程(称为主动学习) 我从研究论文中发现了很多信息,例如应用EM,Transductive SVM或S3VM(半监督SVM),或者以某种方式使用LDA等。关于该主题的书籍也很少。 问题: 实现方式和实际来源在哪里? 最终更新(基于mpiktas,bayer和Dikran Marsupial提供的帮助) 半监督学习: TSVM:位于SVMligth和SVMlin中。 EM朴素贝叶斯(Python) EM在LinePipe项目中 主动学习: 二元论:一种主动学习的实现,带有文本分类源代码 该网页很好地概述了主动学习。 实验设计研讨会:此处。 深度学习: 此处的介绍性视频。 一般网站。 斯坦福无监督特征学习和深度学习教程。

3
你们中的某些人是否使用Google Docs电子表格来进行和与他人共享统计工作?
我知道你们大多数人可能会觉得Google文档仍然是一种原始工具。它不是Matlab或R,甚至不是Excel。但是,我对这种基于Web的软件的强大功能感到困惑,该软件仅使用浏览器的操作功能(并且与许多工作方式非常不同的浏览器兼容)。 活跃在该论坛中的Mike Lawrence已使用Google Docs与我们共享了一个电子表格,并在其中做了一些漂亮的工作。我个人已经复制了一个非常全面的假设测试框架(包括众多参数和非参数测试),最初是在Google文档的Excel中完成的。 我很想知道您是否尝试过Google文档,并在有趣的应用程序中将其推到了极限。我也很想听听您在使用Google文档时遇到的错误或缺陷 我将这个问题指定为“用于社区Wiki”,表示对此没有最佳答案。它比任何东西都更重要。


1
用于相等和不等式约束的约束优化库
对选择适合我的优化功能的约束优化库有什么建议吗?我正在最小化ai)具有线性等式和不等式约束的非线性函数,并且ii)具有函数的梯度和粗麻布。 如果有帮助,我要最小化的函数是Kullback-Liebler散度。 constrOptim仅处理不平等约束。Quadprog处理二次方。信任不支持约束。因此,KL差异不适合这些解决方案。 R Cran任务页面上有很多用于优化的解决方案。我能够使用fmincon()函数在MATLAB中执行优化,该函数似乎使用了内部点或信任区域反射。理想情况下,有一个非常适合定义的问题的库。



9
用于集群的可视化软件
已锁定。该问题及其答案被锁定,因为该问题是题外话,但具有历史意义。它目前不接受新的答案或互动。 我想聚集〜22000点。许多聚类算法可以在较高质量的初始猜测下更好地工作。有哪些工具可以使我对数据的大致形状有所了解? 我确实希望能够选择自己的距离度量标准,因此我可以输入成对距离列表的程序就可以了。我希望能够做一些事情,例如在显示器上突出显示一个区域或群集,并获得该区域中哪些数据点的列表。 首选自由软件,但我已经拥有SAS和MATLAB。

3
Ruby作为统计工作台
这也是一个与Python作为统计工作台和excel作为统计工作台非常相关的问题。我知道关于Ruby与Python的讨论很多,但这不是这个问题的重点。我认为Ruby比Python快并且语法非常自然,这可以使我理解统计数据,并且可以很好地替代R(这也是我感兴趣的,在我对R的其他问题中也提到过)。例如,在我见过的一次Google Tech讲座中(引用了这里的链接问题,讲师抱怨R在创建for循环时速度很慢)。有了Ruby,也有了Rails,因此也许也有可能将两者结合在一起(Python确实有Django,但我不再赘述)。 因此,对于我来说,问题与Ruby相同: 如果我想使用Ruby作为“统计工作台”来代替R,SPSS,Python,Excel等,您能推荐什么? 根据您的经验,我会有什么得失? 请注意,我正在基于先前的Python和Excel问题来考虑此问题。如果您认为使用Ruby和Python(或Excel)会产生相同的影响,请这么说并指向任何先前问题的论点,该问题的目的是不要为相同的答案复制先前的问题。但是,我确实相信存在差异(例如语言和语法的速度),但是我也特别想知道针对Ruby的建议,或者是否有比它说的少得多的可用建议。 Python或Excel。因此,对于其他非常相似的问题,但对于其他语言/程序,请考虑先前的答案。 编辑:只是要突出显示,因为答案似乎是相反的,所以我一直在寻找答案,例如我链接到的Python问题中选择的答案。它不是与Ruby一起学习统计信息。我确实指出了用R学习统计的问题。如果可能的话,但是我不希望同时使用Ruby学习统计信息。您可以假设此问题的统计背景。
13 r  python  software  ruby 

4
数据匿名化软件
已锁定。该问题及其答案被锁定,因为该问题是题外话,但具有历史意义。它目前不接受新的答案或互动。 有谁知道好的数据匿名软件?或者也许是用于R的数据匿名包?显然,不要指望不可破解的匿名化-只是想让它变得困难。
13 software 

3
从使用统计软件过渡到理解数学方程式?
内容: 我是心理学博士研究生。与许多心理学博士生一样,我知道如何使用统计软件进行各种统计分析,以及PCA,分类树和聚类分析等技术。但这并不能真正令人满意,因为尽管我可以解释为什么进行分析以及指标的含义,但无法解释该技术的工作原理。 真正的问题是,掌握统计软件很容易,但是却受到限制。要学习文章中的新技术,我需要了解如何阅读数学方程式。目前,我无法计算特征值或K均值。方程对我来说就像一门外语。 题: 是否有全面的指南可帮助您理解期刊文章中的方程式? 编辑: 我认为这个问题将更加自我解释:在一定的复杂性之上,统计符号对我来说变得毫无意义。假设我想用R或C ++编写自己的函数以了解一种技术,但是有一个障碍。我无法将方程式转换为程序。确实:我不知道美国博士学位学校的情况,但是在我的(法国),我唯一可以学习的课程是大约16世纪的文学运动...

5
您建议使用哪种编程语言来原型化机器学习问题?
当前在Octave中工作,但是由于文档不佳,进度非常慢。 哪种语言易于学习和使用,并且有充分的文献记载来解决机器学习问题?我希望在一个小的数据集(成千上万的示例)上建立原型,因此速度并不重要。 编辑:我正在开发一个推荐引擎。因此,我对使用正则化线性回归,神经网络,SVN或协作过滤感兴趣。

8
哪种统计软件适合教授社会科学专业的统计学入门课程?
我正在寻找一种统计软件包,可以在社会科学学习计划的统计学入门课程中使用。这些学生没有统计学的先验知识,也没有编程语言的经验。目的是向他们介绍基本的统计概念(例如均值,方差,平方和,p值,...,最后是线性回归),并使他们能够使用示例数据集自行进行基本分析。本课程应该是通过统计来学习概念,而不是记住公式(尽管我认为公式很重要)。 因此,我正在寻找一种替代常规语法(如普通R)或点击(如SPSS或Rcmdr)驱动软件的方法。该软件应易于学习,并且应具有清晰的图形用户界面,以可视化数据集并提供标准图形和表格。最好的办法是可视化分析的所有不同步骤(例如,读取和处理数据,描述性度量的计算,制作描述性表和图形,推论性度量的计算,推论性图形的绘制,导出到报告)。 您是否有适合学习和首次实践统计的(开源或免费)统计软件的建议? 编辑 感谢您的建议。我研究了gretl,以及在我自己的在线查询中发现的其他两个程序:RapidMiner和Statistics Lab。[1] 我发现gretl的接口和输出比Rcmdr,SPSS或Stata更加清晰和集中。因此,从我的角度来看,它是开始教授统计学的一个很好的工具。 但是,流程图GUI的RapidMiner和Statistical Lab当他们可视化统计分析的单个步骤(从加载数据开始)时,我印象深刻。我认为这可能对许多通常专注于数学解释的学生有所帮助。当然,对我来说,RapidMiner似乎对初学者来说功能,菜单和按钮太重了,而统计实验室则更加专注。统计实验室的最大优势是带有控制台的“ R计算器”和“ R代码向导”,可帮助产生真正的R语法,因为统计实验室依赖R其计算。 最后,我决定在第一学期开始统计实验室,同时介绍基本概念,并在第二学期切换到RStudio(和Rcmdr)。 [1]:在我看来,Gnumeric,SciPy,Scilab,GNU Octave等似乎都不是针对社会科学的。

1
R和EViews AR(1)估算值的差异
主要问题是:我无法使用EViews和R获得类似的参数估计。 由于我自己不了解的原因,我需要使用EViews估算某些数据的参数。这是通过选择NLS(非线性最小二乘)选项并使用以下公式来完成的:indep_var c dep_var ar(1) 的EViews 权利要求:它们估计线性AR(1)处理,诸如 其中错误被定义为: 通过使用等效等式(带有一些代数替换): 此外,该线程在EViews论坛上,建议他们的NLS估计值是由Marquardt算法生成的。ÿŤ= α + βXŤ+ 你ŤÿŤ=α+βXŤ+üŤ Y_t = \alpha + \beta X_t + u_t üŤüŤu_tüŤ= ρ ·&ùt − 1+εut=ρ⋅ut−1+ε u_t = \rho \cdot u_{t-1} + \varepsilon Yt= (1 -ρ)α+ρYt−1+βXt−ρβXt−1+εŤYt=(1-ρ)α+ρÿŤ-1个+βXŤ-ρβXŤ-1个+εŤ Y_t = (1 - \rho) \alpha + \rho Y_{t - 1} + \beta …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.