我正在使用该randomSplit
函数来获取少量数据帧以用于开发目的,而我最终只是采用了此函数返回的第一个df。
val df_subset = data.randomSplit(Array(0.00000001, 0.01), seed = 12345)(0)
如果我使用它,df.take(1000)
那么我最终将得到一个行数组,而不是一个数据框,因此这对我不起作用。
是否有更好,更简单的方法来获取df的前1000行并将其存储为另一个df?
我正在使用该randomSplit
函数来获取少量数据帧以用于开发目的,而我最终只是采用了此函数返回的第一个df。
val df_subset = data.randomSplit(Array(0.00000001, 0.01), seed = 12345)(0)
如果我使用它,df.take(1000)
那么我最终将得到一个行数组,而不是一个数据框,因此这对我不起作用。
是否有更好,更简单的方法来获取df的前1000行并将其存储为另一个df?
Answers: