Questions tagged «frequency»


7
dplyr的相对频率/比例
假设我要计算每个组中不同值的比例。例如,使用mtcars数据,我如何一目了然地通过am(自动/手动)计算齿轮数的相对频率?dplyr library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n = n()) # am gear n # 0 3 15 # 0 4 4 # 1 4 8 # 1 5 5 我想实现的目标: am gear n rel.freq 0 3 15 0.7894737 0 4 4 0.2105263 …
153 r  group-by  dplyr  frequency 

4
单个变量的频率表
当天最后一个新手熊猫问题:如何为单个系列生成一张表? 例如: my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } 大量的搜索使我进入了Series.describe()和pandas.crosstabs,但是这些都不满足我的需要:一个变量,按类别计数。哦,如果它适用于不同的数据类型(字符串,整数等),那就太好了。

5
获取bash列中唯一值的计数
我有几列的制表符分隔文件。我想计算一个文件夹中所有文件在一列中出现不同值的频率,并按照计数从高到低的顺序进行排序(从最高计数开始)。我将如何在Linux命令行环境中完成此任务? 它可以使用任何常见的命令行语言,例如awk,perl,python等。

1
熊猫“ Freq”标签的文档在哪里?[关闭]
关闭。此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗?更新问题,使其成为Stack Overflow的主题。 2年前关闭。 改善这个问题 我是Pandas的新手,正在尝试使用date_range。我遇到了各种各样的美好事物freq,例如BME和BMS而且我希望能够快速查找适当的字符串以得到我想要的东西。昨天我在文档中的某个地方找到了一个格式良好的表,但是该表的标题太钝了,以至于我今天无法使用搜索再次找到它。

12
计算列表中单词的频率并按频率排序
我正在使用Python 3.3 我需要创建两个列表,一个用于唯一词,另一个用于词频。 我必须根据频率列表对唯一单词列表进行排序,以使频率最高的单词在列表中排在首位。 我有文本设计,但是不确定如何在Python中实现它。 到目前为止,我发现的方法都使用了Counter我们还没有学过的词典。我已经从包含所有单词的文件中创建了列表,但是不知道如何找到列表中每个单词的频率。我知道我需要循环才能执行此操作,但无法弄清楚。 这是基本设计: original list = ["the", "car",....] newlst = [] frequency = [] for word in the original list if word not in newlst: newlst.append(word) set frequency = 1 else increase the frequency sort newlst based on frequency list

7
相当于R表的python
我有一个清单 [[12, 6], [12, 0], [0, 6], [12, 0], [12, 0], [6, 0], [12, 6], [0, 6], [12, 0], [0, 6], [0, 6], [12, 0], [0, 6], [6, 0], [6, 0], [12, 0], [6, 0], [12, 0], [12, 0], [0, 6], [0, 6], [12, 6], [6, 0], [6, 0], [12, …
74 python  r  frequency 

1
如何使用tempdisagg软件包中的td命令将每月数据分解为每日数据频率?
我有一个每月频率数据,试图将其分解为每日频率数据。所以我使用下面的代码td从tempdisaggR中的包中使用命令: dat=ts(data[,2]) result=td(dat~1, conversion = "average", to = "day", method = "chow-lin-maxlog") 然后我收到以下错误消息: Error in td(dat ~ 1, conversion = "average", to = "day", method = "chow-lin-maxlog") : 'to' argument: unknown character string 我使用的数据dat如下: > dput(head(dat)) c(82.47703009, 84.63094431, 70.00659987, 78.81135651, 74.749746,82.95638213) 因此,尽管此数据dat以每月频率显示,但开始和结束尚未反映出来。实际上,开始日期是1/1997,结束日期是9/2019。 在将此月度数据dat分解为每日频率数据方面,我可以得到帮助吗?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.