有没有一种方法可以在内存中保留变量(大表/数据框)并在多个ipython笔记本之间共享?
我会寻找某种在概念上类似于MATLAB的持久变量的东西。可以从多个单独的编辑器(笔记本)中调用自定义函数/库,并使该外部函数缓存某些结果(或大表)。
通常,我想避免重新加载使用频繁的表(该表是通过从笔记本调用的自定义库加载的),因为每当我开始新的分析时,读取它大约需要2-3分钟。
1
这似乎是不可能的,如果您不小心,可能会引起很多头痛。是否无法将数据持久保存为msgpack之类的有效格式?
—
Emre
@Emre谢谢。msgpack的一个棘手部分是它不能解决需要读取表的潜在问题。这也是一把双刃剑:虽然与表格的原始格式相比,它节省了大约40%的时间,但它也使手动分析与原始数据仅相距一小步(不太干净)
—
tsttst
我认为最好的选择是像redis这样的缓存,可以与msgpack结合使用。至少您可以坚持使用内存而不是磁盘。
—
Emre
Spark和它的缓存是否可以选择?从本质上讲,您只能在笔记本中使用Spark进行初始读取/处理
—
Dolan Antenucci