Python中的Pandas和NumPy + SciPy有什么区别?[关闭]


Answers:


312

熊猫提供了基于NumPy构建的高级数据处理工具。NumPy本身是一个相当底层的工具,类似于MATLAB。另一方面,pandas提供了丰富的时间序列功能,数据对齐,对NA友好的统计信息,groupby,合并和联接方法以及许多其他便利。近年来,它在金融应用中变得非常流行。我的下一本书将专门介绍使用熊猫进行财务数据分析的一章。


216
您应该提到您是熊猫的主要作者。:)有问题的书:shop.oreilly.com/product/0636920023784.do
Yktula 2013年

3
可以说numpy主要提供有效的数组,而pandas提供有效的字典吗?(在两种情况下,都限于一致的数据类型,而不是自由格式。)对我(我现在才开始研究它)而言,这是我的根本区别:处理标签配对的数据(一维又称字典和2D aka表)。因此,数据对齐,连接等都成为可能,但是对于那些不了解潜在差异的人,甚至还不清楚它们的含义(例如,两个numpy数组的“数据对齐”是什么?)。
Brandyn 2014年

6
可能是一个愚蠢的问题,但NA-friendly statistics答案中提到的是什么意思。
阿迪尔·阿巴西

6
我认为,他指的是考虑到丢失数据的统计信息(NA,“不可用”)
user1319128

4
冷线程,但是性能差异又如何呢?例如,在numpy中使用复杂的操作,但是在熊猫中在语法上进行了简化?使用高级,简单的语法路​​径是否会降低性能?
3pitt

59

熊猫(以及几乎所有用于Python的数值工具)都需要Numpy。熊猫不是严格要求Scipy,但被列为“可选依赖项”。我不会说熊猫是Numpy和/或Scipy的替代品。相反,它是一个额外的工具,它提供了更简化的方式来使用Python中的数字和表格数据。您可以使用pandas数据结构,但可以自由利用Numpy和Scipy函数进行操作。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.