Questions tagged «series»

系列对象表示数据系列。这可以表示为Python Pandas中的SeriesCollection类(Java,C#)或Series类。


9
使用pandas.to_datetime时仅保留日期部分
我pandas.to_datetime用来解析数据中的日期。默认情况下,熊猫代表日期,datetime64[ns]即使所有日期都是每天也是如此。我想知道是否存在一种优雅/巧妙的方法来将日期转换为datetime.date或,datetime64[D]以便当我将数据写入CSV时,日期不附加00:00:00。我知道我可以手动逐个元素地转换类型: [dt.to_datetime().date() for dt in df.dates] 但这确实很慢,因为我有很多行,这有点违反了使用目的pandas.to_datetime。有没有一种方法可以一次转换dtype整个列?或者,是否pandas.to_datetime支持精度规范,以便在处理日常数据时可以省去时间部分?
201 python  pandas  csv  datetime  series 


6
有条件替换熊猫
我有一个DataFrame,我想用超过零的值替换特定列中的值。我以为这是实现此目标的一种方式: df[df.my_channel > 20000].my_channel = 0 如果将通道复制到新的数据框中,这很简单: df2 = df.my_channel df2[df2 > 20000] = 0 这完全符合我的要求,但似乎无法与通道一起用作原始DataFrame的一部分。

11
使用python pandas合并日期和时间列
我有一个带有以下各栏的熊猫数据框; Date Time 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 02-06-2013 23:00:00 03-06-2013 01:00:00 03-06-2013 21:00:00 03-06-2013 22:00:00 03-06-2013 23:00:00 04-06-2013 01:00:00 如何合并data ['Date']和data ['Time']以获得以下内容?有办法做到pd.to_datetime吗? Date 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 02-06-2013 23:00:00 03-06-2013 01:00:00 03-06-2013 21:00:00 03-06-2013 22:00:00 03-06-2013 23:00:00 04-06-2013 01:00:00

6
将熊猫数据框转换为序列
我对熊猫有些陌生。我有一个熊猫数据框,它是1行乘23列。 我想将其转换为系列吗?我想知道最pythonic的方法是什么? 我已经尝试过了,pd.Series(myResults)但是抱怨ValueError: cannot copy sequence with size 23 to array axis with dimension 1。它还不够聪明,无法意识到它仍然是数学上的“向量”。 谢谢!

4
DataFrame中的字符串,但dtype是object
为什么Pandas告诉我我有对象,尽管所选列中的每个项目都是一个字符串-即使经过显式转换也是如此。 这是我的DataFrame: <class 'pandas.core.frame.DataFrame'> Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 non-null values attr3 56992 non-null values attr4 56992 non-null values attr5 56992 non-null values attr6 56992 non-null values dtypes: int64(2), object(5) 他们五个dtype object。我将这些对象明确转换为字符串: for c …
96 python  pandas  numpy  types  series 

7
通过标签选择的熊猫有时返回Series,有时返回DataFrame
在Pandas中,当我选择一个索引中仅包含一个条目的标签时,我会得到一个系列,但是当我选择一个具有多于一个条目的条目时,我就会得到一个数据框。 这是为什么?有没有办法确保我总是取回数据帧? In [1]: import pandas as pd In [2]: df = pd.DataFrame(data=range(5), index=[1, 2, 3, 3, 3]) In [3]: type(df.loc[3]) Out[3]: pandas.core.frame.DataFrame In [4]: type(df.loc[1]) Out[4]: pandas.core.series.Series

6
将Pandas Series转换为DataFrame
我有一个熊猫系列科幻小说: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] 我想将其转换为以下DataFrame: index | email | list _____________________________________________ 0 | email1@email.com | [1.0, 0.0, 0.0] 1 | email2@email.com | [2.0, 0.0, 0.0] 2 | email3@email.com …

5
图例中的HighCharts隐藏系列名称
我尝试多次解决此问题并放弃。现在,当我再次遇到他时,我决定寻求帮助。 我的图例有以下代码: legend: { layout: 'vertical', align: 'right', verticalAlign: 'top', x: -10, y: 100, borderWidth: 0, labelFormatter: function() { if(this.name!='Series 1') { return this.name; } else { return 'Legend'; } } } 如果我将返回值从“传奇”更改为“”,则不会显示文字,但图例顶部仍会出现“破折号”。如果我不使用标签格式化程序功能,那么我将具有“系列1” +“破折号”,就像图例中的第一行一样。如何隐藏它们? 请注意我的版本是:Highcharts-2.0.5 这是我的图例和要删除的破折号的简单视图:

6
熊猫:将类别转换为数字
假设我有一个包含以下国家/地区的数据框: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 我知道有一个pd.get_dummies函数可以将国家/地区转换为“一次性编码”。但是,我希望将它们转换为索引,以便获取cc_index = [1,2,1,3]。 我假设有一种比使用get_dummies和numpy where子句更快的方法,如下所示: [np.where(x) for x in df.cc.get_dummies().values] 这在R中使用“因素”更容易做到,所以我希望熊猫也有类似的东西。

3
从熊猫系列中删除NaN
有没有办法从熊猫系列中删除NaN值?我有一个序列,其中可能有也可能没有某些NaN值,我想返回该序列的副本,其中删除了所有NaN。
80 python  pandas  series 


7
熊猫:将系列的数据类型更改为字符串
我将Pandas'ver 0.12.0'与Python 2.7结合使用,并具有如下数据框: df = pd.DataFrame({'id' : [123,512,'zhub1', 12354.3, 129, 753, 295, 610], 'colour': ['black', 'white','white','white', 'black', 'black', 'white', 'white'], 'shape': ['round', 'triangular', 'triangular','triangular','square', 'triangular','round','triangular'] }, columns= ['id','colour', 'shape']) 该id系列由一些整数和字符串组成。它dtype在默认情况下是object。我想将的所有内容转换id为字符串。我试过了astype(str),产生下面的输出。 df['id'].astype(str) 0 1 1 5 2 z 3 1 4 1 5 7 6 2 7 6 1)如何将的所有元素转换id为String? 2)我最终将id用于为数据帧建立索引。与具有整数索引相比,在数据帧中具有String索引会降低速度吗?
76 python  pandas  series 

2
Python:Pandas系列-为什么使用loc?
为什么我们对熊猫数据框使用“ loc”?似乎以下代码无论是否使用loc都以模拟速度运行 %timeit df_user1 = df.loc[df.user_id=='5561'] 100 loops, best of 3: 11.9 ms per loop 要么 %timeit df_user1_noloc = df[df.user_id=='5561'] 100 loops, best of 3: 12 ms per loop 那为什么要使用loc? 编辑:这已被标记为重复问题。但是,尽管熊猫iloc vs ix vs loc的解释?确实提到* 您可以只使用数据框的getitem进行列检索 : * df['time'] # equivalent to df.loc[:, 'time'] 尽管它确实解释了loc的许多功能,但它并没有说明我们为什么使用loc,但我的特定问题是“为什么不完全省略loc”?为此,我在下面接受了非常详细的答案。 另外,其他帖子的答案(我认为不是答案)在讨论中非常隐蔽,任何搜索我正在寻找的人的人都会发现很难找到信息,并且提供的答案会更好地为您服务我的问题。
71 python  pandas  series  loc 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.