程序设计 series

8

我有两个Series，s1并且s2索引相同（非连续）。如何合并s1并s2成为DataFrame中的两列，并将其中一个索引保留为第三列？

278 python pandas series dataframe

9

我pandas.to_datetime用来解析数据中的日期。默认情况下，熊猫代表日期，datetime64[ns]即使所有日期都是每天也是如此。我想知道是否存在一种优雅/巧妙的方法来将日期转换为datetime.date或，datetime64[D]以便当我将数据写入CSV时，日期不附加00:00:00。我知道我可以手动逐个元素地转换类型： [dt.to_datetime().date() for dt in df.dates] 但这确实很慢，因为我有很多行，这有点违反了使用目的pandas.to_datetime。有没有一种方法可以一次转换dtype整个列？或者，是否pandas.to_datetime支持精度规范，以便在处理日常数据时可以省去时间部分？

201 python pandas csv datetime series

6

如何将pandas DataFrame的第一列作为系列？

我试过了： x=pandas.DataFrame(...) s = x.take([0], axis=1) 并s获取一个DataFrame，而不是一个Series。

142 python dataframe pandas series

6

有条件替换熊猫

我有一个DataFrame，我想用超过零的值替换特定列中的值。我以为这是实现此目标的一种方式： df[df.my_channel > 20000].my_channel = 0 如果将通道复制到新的数据框中，这很简单： df2 = df.my_channel df2[df2 > 20000] = 0 这完全符合我的要求，但似乎无法与通道一起用作原始DataFrame的一部分。

123 python pandas replace conditional-statements series

11

使用python pandas合并日期和时间列

我有一个带有以下各栏的熊猫数据框； Date Time 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 02-06-2013 23:00:00 03-06-2013 01:00:00 03-06-2013 21:00:00 03-06-2013 22:00:00 03-06-2013 23:00:00 04-06-2013 01:00:00 如何合并data ['Date']和data ['Time']以获得以下内容？有办法做到pd.to_datetime吗？ Date 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 02-06-2013 23:00:00 03-06-2013 01:00:00 03-06-2013 21:00:00 03-06-2013 22:00:00 03-06-2013 23:00:00 04-06-2013 01:00:00

113 python pandas datetime series

6

将熊猫数据框转换为序列

我对熊猫有些陌生。我有一个熊猫数据框，它是1行乘23列。我想将其转换为系列吗？我想知道最pythonic的方法是什么？我已经尝试过了，pd.Series(myResults)但是抱怨ValueError: cannot copy sequence with size 23 to array axis with dimension 1。它还不够聪明，无法意识到它仍然是数学上的“向量”。谢谢！

97 python pandas dataframe series

4

DataFrame中的字符串，但dtype是object

为什么Pandas告诉我我有对象，尽管所选列中的每个项目都是一个字符串-即使经过显式转换也是如此。这是我的DataFrame： <class 'pandas.core.frame.DataFrame'> Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 non-null values attr3 56992 non-null values attr4 56992 non-null values attr5 56992 non-null values attr6 56992 non-null values dtypes: int64(2), object(5) 他们五个dtype object。我将这些对象明确转换为字符串： for c …

96 python pandas numpy types series

7

通过标签选择的熊猫有时返回Series，有时返回DataFrame

在Pandas中，当我选择一个索引中仅包含一个条目的标签时，我会得到一个系列，但是当我选择一个具有多于一个条目的条目时，我就会得到一个数据框。这是为什么？有没有办法确保我总是取回数据帧？ In [1]: import pandas as pd In [2]: df = pd.DataFrame(data=range(5), index=[1, 2, 3, 3, 3]) In [3]: type(df.loc[3]) Out[3]: pandas.core.frame.DataFrame In [4]: type(df.loc[1]) Out[4]: pandas.core.series.Series

95 python pandas dataframe slice series

6

将Pandas Series转换为DataFrame

我有一个熊猫系列科幻小说： email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] 我想将其转换为以下DataFrame： index | email | list _____________________________________________ 0 | email1@email.com | [1.0, 0.0, 0.0] 1 | email2@email.com | [2.0, 0.0, 0.0] 2 | email3@email.com …

92 python pandas dataframe series

5

图例中的HighCharts隐藏系列名称

我尝试多次解决此问题并放弃。现在，当我再次遇到他时，我决定寻求帮助。我的图例有以下代码： legend: { layout: 'vertical', align: 'right', verticalAlign: 'top', x: -10, y: 100, borderWidth: 0, labelFormatter: function() { if(this.name!='Series 1') { return this.name; } else { return 'Legend'; } } } 如果我将返回值从“传奇”更改为“”，则不会显示文字，但图例顶部仍会出现“破折号”。如果我不使用标签格式化程序功能，那么我将具有“系列1” +“破折号”，就像图例中的第一行一样。如何隐藏它们？请注意我的版本是：Highcharts-2.0.5 这是我的图例和要删除的破折号的简单视图：

83 javascript hide highcharts legend series

6

熊猫：将类别转换为数字

假设我有一个包含以下国家/地区的数据框： cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 我知道有一个pd.get_dummies函数可以将国家/地区转换为“一次性编码”。但是，我希望将它们转换为索引，以便获取cc_index = [1,2,1,3]。我假设有一种比使用get_dummies和numpy where子句更快的方法，如下所示： [np.where(x) for x in df.cc.get_dummies().values] 这在R中使用“因素”更容易做到，所以我希望熊猫也有类似的东西。

82 python pandas series categorical-data binning

3

从熊猫系列中删除NaN

有没有办法从熊猫系列中删除NaN值？我有一个序列，其中可能有也可能没有某些NaN值，我想返回该序列的副本，其中删除了所有NaN。

80 python pandas series

6

提取熊猫值value_counts（）

假设我们使用的熊猫dataframe[column].value_counts()输出： apple 5 sausage 2 banana 2 cheese 1 您如何从max到min以上面显示的相同顺序提取值？例如： [apple,sausage,banana,cheese]

77 python pandas dataframe series

7

熊猫：将系列的数据类型更改为字符串

我将Pandas'ver 0.12.0'与Python 2.7结合使用，并具有如下数据框： df = pd.DataFrame({'id' : [123,512,'zhub1', 12354.3, 129, 753, 295, 610], 'colour': ['black', 'white','white','white', 'black', 'black', 'white', 'white'], 'shape': ['round', 'triangular', 'triangular','triangular','square', 'triangular','round','triangular'] }, columns= ['id','colour', 'shape']) 该id系列由一些整数和字符串组成。它dtype在默认情况下是object。我想将的所有内容转换id为字符串。我试过了astype(str)，产生下面的输出。 df['id'].astype(str) 0 1 1 5 2 z 3 1 4 1 5 7 6 2 7 6 1）如何将的所有元素转换id为String？ 2）我最终将id用于为数据帧建立索引。与具有整数索引相比，在数据帧中具有String索引会降低速度吗？

76 python pandas series

2

Python：Pandas系列-为什么使用loc？

为什么我们对熊猫数据框使用“ loc”？似乎以下代码无论是否使用loc都以模拟速度运行 %timeit df_user1 = df.loc[df.user_id=='5561'] 100 loops, best of 3: 11.9 ms per loop 要么 %timeit df_user1_noloc = df[df.user_id=='5561'] 100 loops, best of 3: 12 ms per loop 那为什么要使用loc？编辑：这已被标记为重复问题。但是，尽管熊猫iloc vs ix vs loc的解释？确实提到* 您可以只使用数据框的getitem进行列检索： * df['time'] # equivalent to df.loc[:, 'time'] 尽管它确实解释了loc的许多功能，但它并没有说明我们为什么使用loc，但我的特定问题是“为什么不完全省略loc”？为此，我在下面接受了非常详细的答案。另外，其他帖子的答案（我认为不是答案）在讨论中非常隐蔽，任何搜索我正在寻找的人的人都会发现很难找到信息，并且提供的答案会更好地为您服务我的问题。

71 python pandas series loc

Questions tagged «series»