Questions tagged «subset»

子集由从较大元素集中选择的元素组成,这些元素是它们在较大元素集中的位置或其他特征(例如其值)。

2
为什么`[`优于`subset`?
当我需要过滤data.frame,即提取满足某些条件的行时,我更喜欢使用以下subset功能: subset(airquality, Month == 8 & Temp > 90) 而不是[功能: airquality[airquality$Month == 8 & airquality$Temp > 90, ] 我偏爱的主要原因有两个: 我发现代码从左到右读起来更好。即使对R一无所知的人也可以说出subset上面的陈述在做什么。 因为列可以在select表达式中称为变量,所以我可以节省一些击键。在上面的示例中,我只需输入airquality一次subset,但只需输入3次[。 因此,我过着幸福的生活,subset在任何地方都可以使用它,因为它更短且读起来更好,甚至向我的R编码员倡导它的美。但是昨天我的世界崩溃了。在阅读subset文档时,我注意到以下部分: 警告 这是旨在交互使用的便利功能。对于编程,最好使用标准的子集函数,例如[,尤其是参数子集的非标准评估会产生意想不到的后果。 有人可以帮助澄清作者的意思吗? 首先,“ 交互使用 ” 是什么意思?我知道交互式会话是什么,而不是在BATCH模式下运行的脚本,但是我看不出它应该有什么区别。 然后,请您解释一下“ 论点子集的非标准评估 ”,为什么这样做很危险,也许可以举个例子?
400 r  filter  subset  r-faq 

11
如何在数据框中按名称删除列
我的数据集很大,我想阅读特定的列或删除所有其他列。 data <- read.dta("file.dta") 我选择我不感兴趣的列: var.out <- names(data)[!names(data) %in% c("iden", "name", "x_serv", "m_serv")] 而且我想做些类似的事情: for(i in 1:length(var.out)) { paste("data$", var.out[i], sep="") <- NULL } 删除所有不需要的列。这是最佳解决方案吗?
304 r  dataframe  subset 

3
如何在Ruby中获得交集,并集和数组子集?
我想为一个名为Multiset的类创建不同的方法。 我拥有所有必需的方法,但是不确定如何编写交集,并集和子集方法。 对于交集和并集,我的代码如下所示: def intersect(var) x = Multiset.new end 这是一个例子: X = [1, 1, 2, 4] Y = [1, 2, 2, 2] 然后的交点X和Y是[1, 2]。

9
通过逻辑条件过滤data.frame行
我想data.frame根据逻辑条件从中过滤行。假设我有像 expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 hips 11 7.402100 hips 12 7.167792 hips 13 7.156971 hips 14 7.197543 hips 15 7.035404 …
155 r  subset  dataframe 

8
检查数组是否是另一个数组的子集
关于如何检查该列表是否是另一个列表的子集有任何想法吗? 具体来说,我有 List<double> t1 = new List<double> { 1, 3, 5 }; List<double> t2 = new List<double> { 1, 5 }; 如何使用LINQ检查t2是t1的子集?
145 c#  list  linq  subset 

14
Python:检查一个字典是否是另一个较大字典的子集
我正在尝试编写一个自定义过滤器方法,该方法接受任意数量的kwargs并返回一个列表,其中包含包含这些kwargs的类似数据库的列表的元素。 例如,假设d1 = {'a':'2', 'b':'3'}和d2=相同。d1 == d2结果为True。但是,假设d2=同一件事,再加上一堆其他事情。我的方法需要能够判断d1是否在d2中,但是Python无法使用字典来做到这一点。 内容: 我有一个字类,并且每个对象都有类似的属性word,definition,part_of_speech,等等。我希望能够在这些单词的主列表上调用filter方法,例如Word.objects.filter(word='jump', part_of_speech='verb-intransitive')。我无法弄清楚如何同时管理这些键和值。但是,对于其他人来说,这可能具有更大的功能。

3
检查list <t>是否包含另一个列表
我有这样的参数列表: public class parameter { public string name {get; set;} public string paramtype {get; set;} public string source {get; set;} } IEnumerable&lt;Parameter&gt; parameters; 和我想检查的字符串数组。 string[] myStrings = new string[] { "one", "two"}; 我想遍历参数列表,并检查source属性是否等于任何myStrings数组。我可以使用嵌套的foreach来做到这一点,但是我想以更好的方式学习如何做,因为我一直在使用linq并喜欢枚举的扩展方法,例如where等,所以嵌套的foreach感觉不对。有没有更优雅的首选linq / lambda / delegete方法来做到这一点。 谢谢
97 c#  list  loops  c#-4.0  subset 

6
数据帧的选定列中包含NA(缺失)值的行的子集
我们有一个来自CSV文件的数据框。数据框DF具有包含观察值的列和VaR2包含测量日期的列()。如果未记录日期,则CSV文件包含值NA,用于丢失数据。 Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 我们想使用subset命令定义一个新的数据框new_DF,使其仅包含具有NA'列(VaR2)中的值的行。在给出的示例中,新行中仅包含第2行DF。 命令 new_DF&lt;-subset(DF,DF$Var2=="NA") 不起作用,结果数据框没有行条目。 如果在原始CSV文件NA中交换 了值NULL,则同一命令将产生所需的结果:new_DF&lt;-subset(DF,DF$Var2=="NULL")。 如果字符串的值NA在原始CSV文件中提供,如何使该方法起作用?
96 r  csv  dataframe  subset  na 

1
如何将矩阵子集化为一列,维护矩阵数据类型,维护行/列名称?
当我将矩阵子集分配到单个列时,结果是数字类而不是矩阵类(即,将myMatrix [,5]子集分配到第五列)。是否有一种紧凑的方法可以将子集划分为单个列,维护矩阵格式以及维护行/列名称,而无需执行类似以下的复杂操作: matrix( myMatrix[ , 5 ] , dimnames = list( rownames( myMatrix ) , colnames( myMatrix )[ 5 ] )
84 r  matrix  subset  r-faq 

1
从列表中选择多个元素
我在R中有一个大约10,000个元素的列表。假设我只选择元素5、7和9。我不确定如果没有for循环该怎么做。 我想做类似的事情,mylist[[c(5,7,9]]但这不起作用。我也尝试过该lapply功能,但也无法使其正常工作。
82 r  list  subset 

1
子集数据框时选择了未定义的列
我有一个数据框,str(data)以显示有关我的数据框的更多信息,结果如下: &gt; str(data) 'data.frame': 153 obs. of 6 variables: $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... $ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ... $ Wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 …
79 r  dataframe  subset 

3
根据向量中的值从数据框中选择行
我有类似的数据: dt &lt;- structure(list(fct = structure(c(1L, 2L, 3L, 4L, 3L, 4L, 1L, 2L, 3L, 1L, 2L, 3L, 2L, 3L, 4L), .Label = c("a", "b", "c", "d"), class = "factor"), X = c(2L, 4L, 3L, 2L, 5L, 4L, 7L, 2L, 9L, 1L, 4L, 2L, 5L, 4L, 2L)), .Names = c("fct", "X"), …
75 r  subset  r-faq 

10
从集合中选择随机子集的最佳方法?
我在Vector中有一组对象,我想从中选择一个随机子集(例如,返回100个项目;随机选择5个)。在我的第一遍(非常仓促)中,我做了一个非常简单甚至过于聪明的解决方案: Vector itemsVector = getItems(); Collections.shuffle(itemsVector); itemsVector.setSize(5); 尽管这样做的好处是简单易用,但我怀疑它的伸缩性不会很好,即Collections.shuffle()至少必须为O(n)。我不太聪明的选择是 Vector itemsVector = getItems(); Random rand = new Random(System.currentTimeMillis()); // would make this static to the class List subsetList = new ArrayList(5); for (int i = 0; i &lt; 5; i++) { // be sure to use Vector.remove() or you may get …

1
可以在Raku中导出子集吗?
我想定义一些子集,并在其中添加一些约束和一些die声明,以提供一些有用的错误消息。我不想在使用这些子集的模块的顶部定义它们,而是想将它们放在另一个模块中,同时也不要使用它们的完全限定名称(FQN)。例如,我有 unit module Long::Module::Subsets; subset PosInt where ($_ ~~ Int || "The value must be an integer") &amp;&amp; ($_ &gt; 0 || "The value must be greater than 0") is export ; # other subsets ... 但是得到了 ===SORRY!=== Error while compiling /tmp/637321813/main.pl6 Two terms in a row ... 那不起作用,我想我可以做一些如下的事情,但是我想知道是否可以避免: use …
9 module  subset  raku 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.