1
羽毛和镶木地板有什么区别?
两者都是用于数据分析系统的列式(磁盘)存储格式。两者都集成在Apache Arrow(用于python的pyarrow软件包)中,并且旨在与Arrow对应,作为列式内存分析层。 两种格式有何不同? 如果可能的话,在与熊猫一起工作时,您是否应该总是喜欢羽毛? 在哪些情况下羽毛比实木复合地板更合适,反之则更合适? 附录 我在这里https://github.com/wesm/feather/issues/188找到了一些提示,但是鉴于这个项目的年龄很小,可能有点过时了。 这不是一个严格的速度测试,因为我只是转储并加载整个Dataframe,但是如果您以前从未听说过这些格式,则可以给您留下深刻的印象: # IPython import numpy as np import pandas as pd import pyarrow as pa import pyarrow.feather as feather import pyarrow.parquet as pq import fastparquet as fp df = pd.DataFrame({'one': [-1, np.nan, 2.5], 'two': ['foo', 'bar', 'baz'], 'three': [True, False, True]}) print("pandas df …