R vs SAS,为什么私有公司更喜欢SAS?


143

我学会了R,但似乎公司对SAS经验更感兴趣。SAS相对于R有何优势?


17
这是悲剧,但我确实害怕...

19
一位医学统计学家曾经告诉我,他们之所以使用SAS,是因为如果他们由于软件错误而犯错,并且涉及诉讼,则SAS将对其进行赔偿。R不带保修。
Momo 2012年

42
@Momo R确实没有保修,但是我想看到SAS具有如此强大的参考。我在他们的网站上找不到SAS许可证文本,但能够找到一个组件的某些内容:support.sas.com/documentation/onlinedoc/sasc/doc650/common/…在媒体上有90天的保修,即随附软件,并完全拒绝任何其他保证。请提供“有人曾经告诉我”以外的参考。
Brian Diggs 2012年

13
只是作为轶事,我喜欢这一评论的实用犬儒主义。但是很高兴您检查了一下,我从不在乎。
Momo 2012年

36
SAS具有与R相同的保修:无。
Frank Harrell

Answers:


139

我认为有几个问题(按有效性的升序排列):

  1. 传统/习惯:人们已经习惯了SAS,并且不想学习新知识。(这使您在SAS和R中的思维方式变得更加困难。这可能适用于可能需要向您发送代码或阅读/使用您的代码的任何人,包括经理和同事。
  2. 对免费软件的不信任:我有几个人说他们不愿意接受R的结果,因为您没有一家营利性公司审查该代码以确保在将其提供给客户之前能够提供正确的结果,以免他们最终失去生意。
  3. 大数据:R对内存中的所有内容执行操作,而SAS不一定。因此,如果您的数据接近内存的极限,则会出现问题。

就个人而言,我认为#3具有任何合理的优点,尽管已经有一些方法是用R开发的。#1的问题不言而喻。我认为#2忽略了几个事实:R正在进行一些审查,许多主要软件包都是由统计学中的一些大人物撰写的,并且有研究比较了不同统计软件的准确性,当然具有竞争力。


41
如果在惯性标语下还包括“现有基础结构”,则Point 1将获得更多合法性。如果存在已经使用SAS的现有业务流程,那么转换时会产生过渡成本。在这种情况下,不是在SAS和R之间进行选择,而是在保留SAS和更改为R之间进行选择,这可能会有不同的结论。
Brian Diggs 2012年

25
要点2的要点是,尽管某些R软件包是由专家编写的,但其他软件包却不是。谁为他们担保?谁来测试他们?(我知道他们已经测试过它们是否可以运行,但是谁可以测试它们是否正常工作?)我知道,您可以查看代码,但这以查看其他人的代码并进行验证的时间和能力为前提,通常是使用以下方法:非常复杂。
彼得·富勒姆

18
@PeterFlom,您提出了一个合理的观点。随着包装变得更加神秘,与基本产品相比,提供的保证越来越少。但是您必须走多远?即使是非常先进的SEM,也是由John Fox用R编写的。另外,StasK在实践中很好地说明了对统计软件进行审查的现实。最后,R比其他任何东西都更加全面,因此,当您想使用其他软件来做深奥的事情时,您大多需要自己编写代码。谁保证该代码的准确性?
gung

33
谁在审核SAS,Stata,SPSS,代码?有没有办法知道他们提供的结果(按照他们说的使用的方法)是否正确实施?我从下面的lme4邮件列表中知道,与SAS的比较经常出现。但是不可能知道我们是否应该进行这样的比较。如果无法访问源代码,我们必须让那些公司信服,他们的软件产生的结果实际上是有效的。坦白说,我更喜欢能够查看我使用的软件代码。
杰森·摩根

28
是的,但是很难对统计计算系统的全面性进行惩罚。换句话说,R做某事的方法比另一系统不做某事的方法更好。
Frank Harrell

105

除了到目前为止的好答案之外,我还要添加尴尬因素。如果去年您在SAS和SAS支持上花费了数十万美元,并且您建议在支持价格极低(革命等)的情况下为R不花任何钱,那么产业链上的某人会问为什么。去年存在R时,去年花那么多钱是错误的吗?还是放弃由一群志愿者创建的东西的专业软件是错误的吗?

一旦以这种方式解决问题,这就是一个输球的命题,所以最好不要提出来。


47
这也许是交叉验证中最愤世嫉俗的答案。+1
概率

11
@probabilityislogic:谢谢!需要明确的是,这更多是对较差的高层管理人员的评论,而不是对使用软件的人员的评论。我曾在确实有较高态度的地方工作过,“嗯……您并没有花掉我们今年预算给您的所有资金。显然您可以用更少的钱来赚钱,所以我们正在削减您明年的预算,并将多余的钱分配给超支的部门。” 迪尔伯特规则。
韦恩(Wayne)

11
“您没有花这笔钱...”-从我的第一手资料得知,这正是苏联计划系统过去的工作方式。
StasK 2013年

5
有人需要解释一下,只需花费SAS许可证成本的一小部分,您就可以在具有16个内核和256 GB RAM的AWS虚拟机上安装R Studio Server-由2位优秀的R程序员来完成,而且功能比SAS强大。想一想十亿条记录之间的模糊匹配速度有多快!或就此而言,即使是带有Python + PERL的开源PostgreSQL也可以实现一小部分成本。
vagabond 2015年

1
“或者为一群志愿者创造的东西放弃专业软件是错误的吗?” 这是错误的二分法!
kjetil b halvorsen

54

最重要的是在这里正确识别,企业界最大的问题就是遗产。并且,当您拥有可以完成这项工作的高质量生产代码时,就无需更改它。SAS自1970年代问世以来,当时是按当时的标准编写脚本统计语言的唯一有效方法。从那时起,在制药和政府部门的SAS中积累的生产代码数量是难以想象的,是数十年的历史。用R或Stata重写它会花费几年时间,结果代码将变得更灵活,更高效,更透明,更易于维护且更便宜,但是没人愿意为这种重构付费。(我这样做的经验是,我的Stata代码通常短了大约三倍;我曾经有一个将SPSS代码转换为Stata的项目,在那里我将它缩短了约20倍。

从某种意义上讲,这与学术出版商是类似的故事:他们正乘着最终用户的潮流,维持不必要的订阅;没有订阅自然的大学并不是真正的大学。通过专业协会免费发布将使其价格便宜,如今人们在LaTeX中准备提交的内容,因此他们可以使用相机,并且同一个人将提供同行评审,因此在任何方面都不会受到质量挫折。但是...在线期刊背后没有品牌名称和影响因素。

总结一下:http : //scatter.wordpress.com/2011/06/28/stata-12/。Stata在经济学和政策相关领域比较受青睐,而且我学习SAS越多,我就越喜欢Stata。


38
SAS的语法令人震惊,其开头类似于JCL(IBM的作业控制语言),可在一天之内提交打孔卡批处理作业。确实,人们仍在使用它确实是令人惊讶的。
韦恩

6
+1在散布图帖子中,我特别喜欢BlackBerry:iOS:Android:Nokia作为SAS:Stata:R:SPSS的类比。
jthetzel

6
韦恩,如果您曾经对CARDS语句有过其他想法,您将意识到SAS是可与打孔卡一起使用的统计软件包。Stata使用矩形数据集。R与对象一起使用。因此,根据您必须处理哪种数据格式,一种可能会比其他更好。
StasK

3
遗产中的一大要点是诸如FDA批准或类似法规之类的事情。我所谈到的行业在他们通过之后不会碰到任何东西,以确保他们不必再次经历整个过程。就金钱而言,这是一个很大的争论。
cbeleites 2012年

48

在过去的七年中,我一直有效地担任SAS程序员,在我旁边的一位同事对SAS的编程时间比我活着的时间还要长。如此处所述,SAS背后有大量的惯性/传统;但是SAS和R一样,是一种手段,不是手段本身。

SAS在顺序数据访问方面非常高效,而通过SQL进行的数据库访问则非常集成。PROC的文档非常齐全,但不幸的是,它并不是完全用符号标准化的(PROC OPTMODEL和IML是两个示例)。在编写复杂的代码时有点笨拙,而对于并行代码则不那么优雅。我还发现导入csv文件有时会带来极大的痛苦,并且更喜欢先将其转储到R,然后再转储到数据库。

尽管SAS确实具有共享对象和dll的接口,但是您无法很好地访问任何头文件或类似的文件,并且通过幸福的软件包也无法进行代码分发。

但是,几乎没有人担心您的代码中包括一些现在已经不存在或已损坏的软件包,而现在您需要维护这些软件包,并且SAS中的代码质量趋向于一致(R核心代码也很好,而且可以自由使用)可供任何人使用)。

如前所述,SAS也是非常昂贵的,但是当我知道有一个罐装程序可以很好地满足我的需求时,它就是一个很好的工具。

R + SAS + mysql加上一点点Perl可以将它们粘合在一起,效果惊人:)


11
对于用户编写的宏或sas尚未更新的旧proc,有关维护旧软件包的说明也是如此。
概率

4
R也最近通过dplyr库获得了很好的SQL支持-将R / dplyr语法转换为SQL并调用数据库,您可以使用相同的语法cran.r-project
蒂姆

41

因此,我同时使用R和SAS(在学术界是公认的),但是有时我倾向于使用SAS的原因有两个:

  1. 更好的文档。R在这方面做得越来越好,但是文档,尤其是官方文档,通常是很糟糕且不透明的。除此之外,SAS还受到大量书籍基础结构的支持-使用R!系列在R中帮助了这一点,但是还不存在。我可以谈谈Paul Allison的使用SAS进行生存分析,或使用SAS进行分类数据分析,或者我使用SAS编写的有关蒙特卡洛方法的书,并且我有一本书清楚地以所用语言的一致风格书写。
  2. 惯性。这不仅仅是“公司懒惰”-惯性也有价值。有机构知识。某某某类的代码可以做到这一点-并且做得很好。
  3. 包装。R中的某些程序包很棒。有些软件包不是。您必须去找到它们,对它们进行评估,即使如此,仍然存在一些信念上的问题,因为该程序包仅与编写该程序包的人一样好。很难相信这一点。SAS本质上具有“ SAS研究所的全部信念和信誉”,并拥有相当可靠的记录。
  4. 单源支持。如果SAS损坏,请致电SAS。如果R损坏,您打电话....?

21
“如果R坏了,你打电话。。。?” 布赖恩·里普利(Brian Ripley):
chl 2012年

6
关于4),我认为概念存在混淆。如果您使用程序并且程序中断,则通常有两个选择。您可以支付支持费用,也可以寻求免费的支持(在线社区,文献资料,您自己)。R和SAS可以作为统计编程语言进行比较。两者都有免费的支持,也可以进行比较。R和SAS不能作为付费支持解决方案进行比较……
jthetzel 2012年

7
... SAS Institute为SAS提供有偿支持。诸如Revolution Analytics和TIBCO(S +)之类的公司为R提供付费支持。如果要比较R和SAS的付费支持解决方案,则应将SAS Institute与Revolution Analytics和TIBCO而不是R进行比较。我认为,这种混淆是由SAS语言与SAS Institute的紧密集成以及R语言与R相关的公司支持和教育的不集成。
jthetzel 2012年

3
@jthetzel我不认为它的“混乱”。SAS语言与SAS服务紧密结合。SAS可以使用的任何平台都可以从SAS获得支持。对于R,情况并非如此-支持和语言是分离的,根据平台的不同,可能对您没有帮助(有时在不使用Windows或RHEL的情况下尝试与Revolution交流...),他们不一定要承担责任RandomPackage的错误,其中SAS将支持PROC Arbitrary。
Fomite,2012年

2
@probabilityislogic,我认为它不必评估它是否适合您的分析。是的,两者都可能是错误的,并且都需要进行评估。但是,我对SAS质量控制团队的信任比我对我自己的信任更重要。
Fomite 2013年

39

没有人提出首选它的原因是白痴。这是我最近遇到的两句话:

“使用R之类的开源软件是不可能的–我们不能保证完全可重复的结果”

“由于它是开源软件,我们将无法提供任何支持”

与这些人呆两分钟,将向他们展示他们的错误。


3
与哪两个人在一起?没有引用,就好像您只是引用了这些引用一样。
David Heffernan

4
理事会IT部门的第二句话似乎很好,不能期望它们支持客户可能使用的所有可能的开源软件,因此发出了警告。我认为我听到的最糟糕的反开源消息是从SAS那里听到的,诸如“您是否愿意相信采用开源设计的巨型喷气式飞机,发动机可能会掉下来”这样的
说法

5
@PaulHurleyuk:+1的话是“我们有为飞机制造发动机的客户。我通过在SAS市场营销总监,他们没有使用免费软件时,我得到一个喷气”快乐R上这家位于纽约时报的文章。SAS代表在后来的博客文章中澄清了她的言论
jthetzel

4
@PaulHurleyuk:同样,不能期望理事会支持客户可能想要使用的任何专有软件。开放不是原因。如果他们说他们无法支持受支持的软件集以外的任何内容,那就很好。
Spacedman

5
在我引用的两个案例中,很可能会有一个理性的决定,但是给出的原因显然不是那些原因。一个合理的原因可能是“我们已经支持SAS,而我们负担不起支持两个统计信息包”。但是“我们不能支持它,因为它是开源的”是不言而喻的。这两个部分可能是正确的,但结论并不成立。就像说“伊丽莎白是女王,因为天空是蓝色的”。
Spacedman

23

似乎尚未明确解决一个问题:掩盖屁股。如果您使用SAS,但事情一发不可收拾,决策者总是可以说他购买了最先进的软件,他怎么知道它会崩溃?如果他决定和R一起去,这个论点将更难提出。是的,这与此处已经提到的惯性参数有关。

几十年前,他们曾经说过“ noboby曾经因为收购IBM而被解雇”,这被称为有史以来最伟大的营销短语。


2
虽然,我不确定R是否比SAS更先进(就许多程序而言,我的印象是R 比SAS 先进。)我的猜测是许多SAS用户对此一无所知……
Patrick Coulombe

21

作为SAS和R的用户,我想说我们在R上使用SAS的最大原因(当我们这样做时)是其顺序处理能力。我们只需要不超过4GB RAM的计算机即可处理15年的数据。我将需要一台更大的使用stock R的机器,而我还没有尝试迁移SAS代码以与Revolution R一起运行。


8
+1,尽管值得注意的是,有几种方法可以处理R中大于内存的数据集(bigmemoryff,来自数据库的分块数据,多种分布式计算选项)。但是,所有这些都需要进行设置。SAS确实会随心所欲,这是真正的优势。
马特·帕克

21

他们正在改变的时代

截至2015年,年龄在35岁以下的精算师更喜欢使用R-教科书同时使用R和SAS代码。年龄较大的精算师从未学会使用R而更喜欢使用SAS,并且不使用R。在SAS中实际编码的精算师的比例将会下降。

如果您在Google学者中搜索有关SAS的论文,那么在过去的几年中,您会发现每年有550种稳定的出版物。如果您使用R(“ R统计计算基础”)搜索论文,则2014年有25,100,截至2015年7月中旬有16,700。绘制速率-增长非常快!

几年来,SAS并没有向大学索要高额的许可费,而这已经被他们扭转了。但现在为时已晚,许多大学已转换为使用R而非SAS进行教学。

结合R软件包在论文中发表了新的统计技术。多年来,在R基础中使用的某些技术仍未在SAS中出现。现在,您可以在SAS内部使用R。

总而言之,事情正在发生变化,并且变化迅速。


19

在制药行业中,使用SAS是因为FDA使用并喜欢它。虽然有一些严重的原因。结果是可追溯的,并且输出具有时间戳。FDA统计人员可以检查您得到什么。它对数据库管理非常有用,并且是可靠的软件。当然,可以说SAS的许多属性存在于其他软件包中,包括R和SAS都很昂贵。我仍然认为,任何想成为工业应用统计学家的人都将是最好的选择,至少要学习如何在SAS中编程。如果您更喜欢SAS,但可以使用R或STATA。当您为一家希望使用SAS的公司工作时,他们将为许可支付费用。


4
以下是有关FDA关于R的思考的一些其他信息:blog.revolutionanalytics.com/2012/06/fda-r-ok.html
Matt Parker

4
R基金会在2008年发表了一篇论文,讨论了R在规范的临床试验中的使用。对于怀疑使用R的协作者来说,它应该是一个很好的参考
。– jthetzel

2
我同意有一个在临床研究中更多使用R的举动,并且许多人认为R可以像SAS一样可追溯。
迈克尔·切尔尼克

6
FDA 明确表示认可或不要求使用任何一种软件。从历史上看,大多数提交文件都使用SAS,因此FDA具有很多SAS知识,但是他们很快就接受了其他系统,并使用R进行了很多近期工作,尤其是在元分析方面。
PaulHurleyuk

1
@PaulHurleyuk FDA将公开发表的言论以及它们在实践中的行为不一定是相同的。大多数制药公司主要关注II和III期临床试验,他们通常希望他们必须并且将继续使用SAS来分析这些试验。
迈克尔·切尔尼克

18

我认为 Anne H.Milley的这段话概括了许多人对R的看法

我们有为飞机制造发动机的客户。我很高兴当我乘坐飞机时他们没有使用免费软件。

不幸的是,我认为这种误解(free ==劣等)在普通大众中很常见。


16

(略微偏离主题):从另一角度来看:R在学术界具有的某些优势不适用于工业。

例如,在学术界,如果您可以告诉学生去购买软件并在家工作,那么这是一个明显的优势。在行业中,通常不应该将任何数据带回家。

您也不应该尝试一些事情(TM),下载大量软件包(即使信誉良好且经过测试),也不使用尖端方法。取而代之的是,通常希望您坚持使用已使用多年且行为已久的方法和代码。你不会因此获得很多学术上的好处。

当然,正如已经提到的那样:为了切换到R,没有人会冒重做各种监管批准的风险。据我所知,这与R无关,而更多与获得监管批准的巨额成本+工作有关。


3
没有什么是需要做重做监管机构的批准切换到R.着想
弗兰克·哈瑞尔

2
@弗兰克:也许我们在不同的情况下思考:我猜您可能正在考虑进行新的试验(并且您是对的)-我在考虑正在进行的过程分析(化学+统计分析)生产。AFAIK,您不能仅将数据分析切换到那里(但是,那不是SAS国家/地区)。但是我可能是错的。
cbeleites 2012年

2
我不熟悉这个世界,但我怀疑科学家拥有的自由比他们想象的还要多。
Frank Harrell

13

尽管它非常悲观,但我的回答是那种在诸如“我们只是使用SAS”之类的公司中做出全面决策的人也是那种不信任自己不了解的东西并自动思考价值的人事物的花费与您在上面花费的金钱成正比。这导致他们更愿意为SAS付费而不是花时间研究替代方案。


12

为什么一家大型制药公司甚至想从SAS转换为R?SAS花费数百万美元,但对于制药公司而言却算不上什么。但是,将所有稳定的报告系统从SAS转换为R的成本将增加50-100倍。

SAS具有出色的支持系统:每次我需要帮助时,他们都能够在几个小时内提供它。

R真正拥有SAS所没有的东西:1)更好的图形...好吧,这是一个很大的图形,但图形并不是全部。除了R之外,总是可以使用一个额外的工具来创建一些很酷的图形,而SAS在图形方面也不算太差2)现代且更高效的编程语言。许多SAS用户不是程序员,也不在乎使用很酷的语言。他们只是希望能够分析数据。

我喜欢R,但是对于大公司而言,转换为SAS会很疯狂。虽然这对于较小的公司可能有意义


3
同意您,@ Max。最后,答案来自行业内的某人。切换到R非常昂贵。–
Dan

3
那是错误的。SAS的编程支持成本比R的成本高得多。公司雇用了大量的SAS程序员来弥补SAS使用的古老语言。
Frank Harrell

我在行业中,并且都使用。R可以与执行数据操作,并且更重要的是,分析更少的行,因此可以更快地进行开发。我要说的是,有些制药公司已经为成功的监管程序彻底构建了SAS系统。这一点值得考虑:为什么要改变(在这一点上)?如果他们是从头开始的,也许是R。
AdamO

11

有几个主要优点,没有特定的顺序

  • SAS拥有庞大的客户群并拥有悠久的记录

我故意避免使用诸如“传统”或“习惯”这样的贬义词。许多公司使用SAS已有30或40年的历史,并且它们拥有数百万行的工作代码。此外,稳定的代码库还具有所有优势,在一个可能导致小错误的区域中,它拥有数百万个用户日的工作日。这是同样的原因,即使Unix已有40多年的历史,并且在某些方面已经过时,Unix风格仍然很流行。最后,有大量经验丰富的SAS专业人员用来解决业务问题

  • SAS非常适合异构,复杂的数据和操作环境

公司有许多不同的数据源,它们基于不同类型的系统,并且在许多情况下还取决于多个操作环境。R直到最近才获得一些极其基本的功能来处理内存中无法保存的更多内容。将此与SAS支持terradata的本机,优化的数据库内处理进行比较,仅举一个示例。在大多数现实情况下,分析中最困难的部分是处理数据和操作环境。(需要在大型机上运行Windows开发的模型评分代码吗?使用SAS没问题。使用R,您很不走运。)R不能解决任何这些问题。

  • 用户不必担心自己“自己”

SAS用户可以合理地确定每个代码模块均已由合格人员进行测试。无需花费时间和精力来学习代码的来源或独立地对其进行验证。此外,如果遇到任何类型的问题,强大的帮助(从基本的文档到详尽的详细探索意外结果或复杂方法的行为),用户都可以接听电话并获得帮助。

  • 足够好了

该语言使某些人无法接受,因为它与通用编程的现代语言不同。话虽如此,该语言是高级,强大,富有表现力和全面的。简而言之,一旦您学会了它,就可以完成工作。对于公司而言,优雅的解决方案并不是卖点。


2
也许优雅-但是要花钱吗?我认为公司对此很在意!
概率

2
R可以以零成本运行在从手机到超级计算机的任何东西上,也可以以零成本运行在大型机上。
肖恩

9

客户支持。

我曾经和一个在一家专门安装服务器的公司工作的朋友聊天,然后他向我解释了为什么大公司总是选择Microsoft产品而不是开源。与开放源代码竞争对手相比,Microsoft的优势在于客户支持。如果产品出现问题,该公司可以致电Microsoft,大公司甚至可以为其提供个性化支持。开源软件并非如此。

我认为这与SAS优先于R完全相同。


2
革命R(或其他公司)?
Ben Bolker

4
我认为这些评论是不正确的。在服务器世界中,使用开源规则,并且Apache Web服务器是最受欢迎的Web服务器。
Frank Harrell

我从未说过他在谈论服务器。而不是像Microsoft Office这样的产品。我只提到他正在服务器领域工作
拉斯科尼科夫2012年

2
让我想起使用共享点和开源Wiki的公司。共享点几乎总是贫瘠,只有Wiki被更新。
TLJ

9

那前端呢?R在SAS企业指南,Web Report Studio或Enterprise Miner中等效于什么?编辑:这些工具使非编程用户可以在不了解底层技术的情况下使用数据仓库。它们并不是主要用于使用SAS的工具。R GUI只是R语言/系统AFAIK的IDE。他们无法为想要从DWH获得信息和见解的非技术用户提供帮助。


2
这是一个答案。SAS对客户(如我们)如此重要的原因在于,它使那些不必编写任何代码的人都易于使用。
Kurt

2
@Kurt,呱不想意味着这是不是答案,而是你的回答不适合这个网站(尤其是对本问题,实际上)
斯特凡纳·洛朗


2
好吧,我曾与RStudio合作。与SAS Enterprise Guide相比,它仍然有很长的路要走,直到它对新手用户而言都易于使用。添加R缺少与元数据服务器等效的事实。而且我完全错过了WRS的即用型等效项(也许我是盲目的:))。对于90%的数据仓库“客户”在任何编程环境中都无法编写“ Hello World”的公司而言,语言的美感和可以实现的生产力几乎是零。这就是我想指出的,还有很多工作要做。
Kurt 2013年

2
感谢您更新答案,@ Kurt。我认为现在对将来的读者会更有用。的确,SAS提供了指向和单击,以及数据仓库产品,这些产品比R更全面,易于使用,这是值得提出的。+1
gung

8

我曾经在一家咨询公司工作,该公司为硅谷的一家大型芯片制造商提供了SAS协助。该公司的联系人告诉我们,他通过使用另一种软件来提供完全相同的咨询,这是另一家公司提供给他们的咨询,该软件涵盖了SAS覆盖的所有领域,而这将使该公司付出SAS收取的费用的一小部分($,而不是30000 $ 1,000,000)。该联系人考虑了该怎么做,因此决定不通知老板有关提议,因为他担心首先使用SAS被解雇,而不是考虑使用更便宜的替代方案。相反,他坚持要求我们的咨询公司给他们的公司大笔的咨询费。我公司同意了。


1
因此,您的联系人无法说出R相对于SAS还是相对较新,他想等待使用R来确保已建立R?
概率

6

我认为没有提到应用程序安全性。这个问题在Stack Overflow提出,但由于不在主题之列而被删除。

我与使用SAS的瑞典国家卫生和福利委员会合作。当我与他们的统计学家(像R)交谈时,他们声称他们的IT人员更喜欢SAS,因为他们不信任R中下载的软件包。我的妻子也在SAS工作,而她的机构也经常遇到相同的问题...

我希望看到有关此问题的一些评论。我已经进行了快速搜索,但是没有找到任何好的参考资料...


3
下载提供新功能的软件包(如大多数R软件包所做的那样)的替代方法是什么?是否要在家中培养这些功能?那更可靠吗?
Frank Harrell

2
@FrankHarrell我同意,但是我认为对于R开发人员来说,这可能是一个容易定位和改进的领域。一个简单的解决方案可能是对软件包进行不同级别的安全保护-如果软件包具有系统调用或自行连接到Internet,则软件包应具有更高的清除权限。这可能允许在那些主要关注数据泄漏的机构/公司中只有低级别许可的安装。当我选择安装高净空包装时,作为用户,我还可以另外进行检查。(顺便说一句,您的图书(RMS版本2)何时安排?)
Max Gordon

我希望RMS的第二版将在一年多的时间内推出。
弗兰克·哈雷尔

5

我认为最有说服力的原因是,SAS有一个广泛的垂直业务特定模块库,这些垂直行业的人们都在使用这些模块,因此它有点像是锁定的。
而且,SAS已经满足了这些垂直细分市场的需求,并针对它们的需求进行了优化-从“用户不必做很多额外的工作即可获得结果”的意义上进行了优化。我不是SAS用户,因此这并不意味着对SAS业务策略有偏见。


4

作为SAS的主要商业产品,付费销售人员正在大力协调努力来推广它。我认为促进R的使用的努力不能与这些相提并论。


8
是的,人们必须在某种程度上发现R。但是很多问题归结为学习新语言的惯性。新的语言总是不断涌现,它们比旧的语言具有优势,而用户却坚持使用旧的语言(见证COBOL)。SAS中的编程效率极低,可能需要两倍的程序员才能完成与R相同的工作,但是SAS专家很乐意以谦逊的方式行事,公司担心这种中断会节省数百万美元。薪水。
Frank Harrell

3

我看这样的开源或许可软件,无论是SAS还是其他。我的IT部门在那里为我们的业务提供服务。该公司不会从IT赚钱,而只能从IT支持的业务中赚钱。该业务的年收入 160亿美元。IT成本约为$每年2万元。如果钱是问题,我会削减成本,但如果我节省10%($我预算的20亿美元),将在业务通知?他们明年会减少我的预算吗?如果IT部门失败,则企业将损失收入,失败的性质将有多大差异。部分业务可能不再赚取收入。如果SAS之类的产品出现故障,我可以根据合同提起诉讼。如果OSS产品出现故障,我将无法。我将无法收回我的$160亿,但我可能会有所收获,而实际上使用SAS,您不太可能会损失很多。价格与成本之间的差异必须证明对业务的任何其他感知风险是合理的。有时坚持SAS比重新培训要便宜。有时存在更高优先级的问题,因此公司会选择使用SAS。一些公司不需要完整的功能,在这种情况下,替代方案是可行的。一些不需要支持,替代方案仍然可行。如果满足业务需求,那么这两种方法都是有效的;如果要为企业提供支持,则需要查看5-10年的总拥有成本,是否能够聘请工具专家,产品是否稳定这样您就不必在每个新版本中都重写所有内容,而无需进行技能培训的培训课程,


4
我不听你的话 与老式的自由语言相比,浪费程序员付给程序员使用古老的语言(SAS)进行编程所浪费的金钱是惊人的。
Frank Harrell

4
@弗兰克-我不同意您的描述。胜任的SAS程序员可以在SAS中高效工作,胜任的SAS程序员可以广泛使用。我同意R的结构更像是一种现代语言,因此对于了解Java的程序员来说,可能更容易学习。根据我在许多公司的经验,使用SAS来提高开发人员的生产力很少是一个实质性的问题。
JBK

9
使用SAS已有23年,使用S-Plus / R已有22年,我可以说经验丰富的SAS程序员可以提高生产率,但是经验丰富的R程序员可以轻松实现三倍的生产率。
Frank Harrell 2013年

2
“我可以根据合同提起诉讼”哈哈-员工编写的错误代码比SAS或R自己“做”的事情更容易引起问题
概率

1

我未曾提及的一些原因提到:

  1. 更好的文档。SAS文档很详细,R文档很简洁。许多公司可能更喜欢冗长的文档。

  2. 更好的错误消息。R的错误消息似乎通常旨在证明写消息的人比读消息的人聪明。

  3. 技术支持。SAS提供了我所能提供的一些最佳技术支持,这些技术支持由SAS提供。您可以获得有关R的帮助,但是该帮助分散在不同的地方,并且并不总是可用。在各个站点上提供R帮助的人都是志愿者-志愿者没有义务提供帮助。SAS技术支持人员的薪水是做他们所做的事-他们做得很好。他们不仅做得很好,而且还礼貌地做到这一点,这在所有R社区中通常都不存在(我最喜欢?“我通过输入'help'获得帮助,为什么不尝试输入'help'?”)

  4. 易于与Word和Excel协调。是的,我知道您可以让R做到这一点,但是使用SAS更容易(另一方面,R与搭配使用效果更好LATEX


1
我敢肯定有些公司出售对R的技术支持。但是我没有经验,这太好了!
kjetil b halvorsen

1

我认为传统角度可能很大,原因如下。一个组织雇用一个人,称他们为X。他们是计算机专家/向导/等等。他们构建了很棒的SAS程序/工具/等。他们是如此出色,以至于组织中的其他人不会觉得他们需要了解程序的工作原理。它们使按下按钮变得非常容易,并且一切正常(魔术黑匣子)。

X人离开组织。不幸的是,X员工离开组织的知识(文档和知识管理没有优先级,工作程序才是优先级)。他们被人Y.人Y代替是伟大的有R,但没有关于SAS的想法,因此没有关于主意如何的SAS程序的实际工作。有一个巨大的学习曲线,甚至搞清楚什么CTCT大大高于SAS的一年许可。我希望SAS将对这种折衷进行一些分析,并使其影响设置许可证费用的方式(好吧,如果我在SAS工作,我会这样做)。还要注意,SAS绘图程序比十年前更好(例如proc sgplot与proc plot)。巧合的是R先做好了密谋吗?我想不是!这有效地降低了切换效率,因为绘图不再那么不同-R仍然更好,但切换得还不够...


0

对于工业统计,有质量保证人员(通常)没有编程,统计或科学背景,并且对统计人员,程序员和科学家进行审核。他们想知道,“您怎么知道自己在做的事是对的?” 和“如果错了,我们怎么能责怪某人,他们将如何为此付费?”。

GNU / GPL Copyleft许可证带有固定的文本,该文本完全符合我所写的内容:“ R是自由软件,并且完全没有担保”。这令人反感。当有素质的人阅读此文本时,他们基本上会完全抹杀R。我的意思是,如果产品好,值得增加保修权吗?这样的商业产品使我们相信。实际上,最终是FDA表示他们将接受R中的法规要求,这反映了软件行业的巨大变化。(请注意,此声明位于问题的原始发布日期之后。)

对于绝对不了解计算机的人来说,由于绝对缺乏保修,导致想象中的安全性,不可再现性和严重的科学错误。我们都同意错误会带来灾难性的损失。对于您的SAS许可证,SAS拥有可以向审计师解释其软件的专家,并且在SAS实际引起此类问题的不可能情况下,他们可能要承担罚款和罚款(他们也有足够的钱支付律师的费用,以确保他们能够在这种情况下被完全免除)。让分析师/程序员介绍R的案例的负担和成本基本上等于SAS许可证。并不是说SAS中的编程完全使您摆脱了质量合规的沉重负担!

因此,基本上,我想说诉讼在需要昂贵的许可软件中起了重要作用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.