Questions tagged «binning»

9
使用gnuplot的直方图?
如果我的.dat文件已经具有正确的装箱数据,我知道如何在gnuplot中创建直方图(只需使用“ with box”)。有没有办法获取数字列表并让gnuplot根据用户提供的范围和容器大小提供直方图?

2
用python熊猫装箱列
我有一个带有数值的数据框列: df['percentage'].head() 46.5 44.2 100.0 42.12 我想查看该列作为箱数: bins = [0, 1, 5, 10, 25, 50, 100] 我如何将结果作为垃圾箱value counts? [0, 1] bin amount [1, 5] etc [5, 10] etc ......

6
熊猫:将类别转换为数字
假设我有一个包含以下国家/地区的数据框: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 我知道有一个pd.get_dummies函数可以将国家/地区转换为“一次性编码”。但是,我希望将它们转换为索引,以便获取cc_index = [1,2,1,3]。 我假设有一种比使用get_dummies和numpy where子句更快的方法,如下所示: [np.where(x) for x in df.cc.get_dummies().values] 这在R中使用“因素”更容易做到,所以我希望熊猫也有类似的东西。

10
获取直方图的数据
有没有一种方法可以指定MySQL中的bin大小?现在,我正在尝试以下SQL查询: select total, count(total) from faults GROUP BY total; 生成的数据足够好,但是行太多。我需要的是一种将数据分组到预定义的bin中的方法。我可以从脚本语言执行此操作,但是有没有办法直接在SQL中执行此操作? 例: +-------+--------------+ | total | count(total) | +-------+--------------+ | 30 | 1 | | 31 | 2 | | 33 | 1 | | 34 | 3 | | 35 | 2 | | 36 | 6 | | 37 …

8
numpy 1D数组:遮罩元素重复n次以上
给定整数数组 [1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5] 我需要掩盖重复N多次的元素。需要说明的是:主要目标是检索布尔掩码数组,以后再用于装箱计算。 我想出了一个相当复杂的解决方案 import numpy as np bins = np.array([1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5]) N = 3 …
18 python  arrays  numpy  binning 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.