我从GH开发大师构建了Spark 1.4,并且构建顺利。但是当我这样做时,bin/pyspark
我得到了Python 2.7.9版本。我该如何更改?
Answers:
只需设置环境变量:
export PYSPARK_PYTHON=python3
如果您希望这是永久更改,请将此行添加到pyspark脚本中。
export PYSPARK_PYTHON=python3.5
用于Python 3.5
$SPARK_HOME/conf/spark-env.sh
这样,以便也spark-submit
使用相同的解释器。
PYSPARK_PYTHON=python3
./bin/pyspark
如果要在IPython Notebook中运行,请编写:
PYSPARK_PYTHON=python3
PYSPARK_DRIVER_PYTHON=ipython
PYSPARK_DRIVER_PYTHON_OPTS="notebook"
./bin/pyspark
如果python3
无法访问,则需要传递路径。
请记住,当前文档(自1.4.1起)已过时说明。幸运的是,它已被修补。
看一下文件。shebang行可能指向“ env”二进制文件,该二进制文件在路径中搜索第一个兼容的可执行文件。
您可以将python更改为python3。更改环境以直接使用经过硬编码的python3二进制文件。或者直接使用python3执行二进制文件并省略shebang行。
PYSPARK_PYTHON
环境变量。
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
,在这种情况下,它将运行IPython 3笔记本。