9
在pyspark数据框中显示不同的列值:python
请为Pandas建议pyspark数据框替代方案df['col'].unique()。 我想在pyspark dataframe列中列出所有唯一值。 不是SQL类型的方式(先注册模板,然后通过SQL查询不同的值)。 另外,我不需要groupby->countDistinct,相反,我想检查该列中的不同值。
Spark Python API(PySpark)将apache-spark编程模型公开给Python。