TensorFlow，为什么选择python语言？

143

我最近开始研究深度学习和其他ML技术，并开始寻找简化构建网络并对其进行培训的框架，然后我发现TensorFlow在该领域经验不足，对我来说，速度似乎是如果与深度学习一起工作，那么使大型机器学习系统变得更大的重要因素，那么为什么Google选择python来制造TensorFlow？用一种可以编译且无法解释的语言来编写代码会更好吗？

使用Python而不是像C ++这样的语言进行机器学习有什么优势？

— 奥尔莱根
source

2

次要问题：编译和解释不是对立的。另外，可以用编译器或解释器或两者来实现任何编程语言。关于软件工程方面的区别，有一个很好的答案。

— 8bittree

240

关于TensorFlow的最重要的认识是，在大多数情况下，内核不是用Python编写的：它是由高度优化的C ++和CUDA（Nvidia用于GPU编程的语言）结合而成。反过来，大多数情况是通过使用Eigen（高性能C ++和CUDA数值库）和NVidia的cuDNN（为NVidia GPU进行了非常优化的DNN库，用于诸如卷积之类的功能）而发生的。

TensorFlow的模型是程序员使用“某种语言”（很可能是Python！）来表达模型。该模型以TensorFlow构造编写，例如：

h1 = tf.nn.relu(tf.matmul(l1, W1) + b1)
h2 = ...

在运行Python时实际上并未执行。相反，实际创建的是一个数据流图，该图表示接受特定的输入，应用特定的操作，将结果作为输入提供给其他操作，等等。 该模型由快速的C ++代码执行，并且在大多数情况下，操作之间传递的数据永远不会复制回Python代码。

然后，程序员通过拉上节点来“驱动”该模型的执行-通常在Python中进行训练，有时在Python中甚至在原始C ++中进行服务：

sess.run(eval_results)

这个Python（或C ++函数调用）使用对C ++的进程内调用或针对分布式版本的RPC来调用C ++ TensorFlow服务器以使其执行，然后将结果复制回去。

因此，话虽如此，让我们重新表述一下问题：为什么TensorFlow为什么选择Python作为表达和控制模型训练的第一种得到良好支持的语言？

答案很简单：对于许多数据科学家和机器学习专家来说，Python可能是最舒适的语言，它易于集成并可以控制C ++后端，同时在内部和外部也广泛使用。和开放源代码。鉴于使用TensorFlow的基本模型，Python的性能并不那么重要，因此很自然。NumPy的巨大优势还在于它可以在Python中轻松进行预处理-同时具有高性能-在将其输入TensorFlow进行真正占用大量CPU的处理之前。

表示执行模型时不使用的模型也有很多复杂性-形状推断（例如，如果您做matmul（A，B），结果数据的形状是什么？）和自动梯度计算。事实证明，能够用Python表达这些内容真是太好了，尽管从长远来看，我认为它们可能会转移到C ++后端以使添加其他语言变得更加容易。

（当然，希望是将来支持其他语言来创建和表达模型。使用其他几种语言来运行推理已经非常简单了-C ++现在可以工作了，Facebook的某人贡献了Go绑定，我们现在正在对其进行审查。等）

— dga
source

1

It's already quite straightforward to run inference using several other languages作为Prolog程序员，您如何定义“推论”，这根本不适合我。似乎是一个不恰当的词。

— Guy Coder

1

仅运行模型的正向传递。将其应用于数据与培训。

— dga

关于形状推断。我正在将一些神经网络转换为静态类型的语言，仅用于学习目的，而Ptyhon中的Duck键入无疑使该部分代码更易于编写。从另一方面讲，编写没有类型的Python代码会使学习Ptyhon在运行之前正确获取类型变得更加困难。我发现使用Ptyhon的运行时错误比其他语言F＃多得多。可能值得一提的是Duck在答案中输入。

— Guy Coder

2

没错，我认为python的输入是间接原因。在Google常用的语言中---quora.com/…-Python是普通机器学习博士的最佳选择。唯一的真正选择是C ++（我不认识很多使用Lua（Torch使用的语言）的人），并且C ++距离ML工具箱舒适度还很远。许多ML人士来自matlab背景，并且numpy越来越受欢迎。当然，鸭子打字可能是普及的基础，但这超出了我的范围。

— dga

谢谢，很好的总结。盖伊·编码器（Guy Coder）–关于游戏中“推理”的意义，请参阅Wikipedia上有关统计推理的文章。它是归纳推理，与Prolog 演绎类型相反。

— 鲍勃·卡彭特

35

TF不是用python编写的。它是用C ++编写的（并使用高性能的数字库和CUDA代码），您可以通过查看他们的github进行检查。因此，核心不是用python编写的，而是TF提供了许多其他语言（python，C ++，Java，Go）的接口

如果您来自数据分析领域，则可以像numpy（不是用python编写，但提供了Python的接口）那样考虑它，或者如果您是Web开发人员，则可以将其视为数据库（PostgreSQL，MySQL，可以从Java，Python，PHP调用）

由于许多原因， Python前端（人们使用TF编写模型的语言）最受欢迎。在我看来，主要原因是历史原因：大多数ML用户已经在使用它（另一个流行的选择是R），因此，如果您不提供python的接口，那么您的库很可能注定会变得晦涩难懂。

但是用python编写并不意味着您的模型是用python执行的。相反，如果您以正确的方式编写模型，则在评估TF图期间绝不会执行Python（tf.py_func（）除外，该存在于调试中，应在实际模型中避免使用，因为它是在Python方面）。

例如，这与numpy不同。例如，如果您这样做np.linalg.eig(np.matmul(A, np.transpose(A))（是eig(AA')），则该操作将以某种快速语言（C ++或fortran）计算转置，将其返回给python，将其与python一起从python中取出，并以某种快速语言计算一个乘法并将其返回给python，然后计算特征值并将其返回给python。因此，尽管有效地计算了诸如matmul和eig之类的昂贵操作，但您仍然需要通过将结果移回python并强制执行来浪费时间。TF不会这样做，一旦定义了图，张量就不会在python中，而是在C ++ / CUDA /其他地方流动。

— 萨尔瓦多·达利
source

在这种情况下，我的博客文章可能会引起关注：blog.ephorie.de/why-r-for-data-science-and-not-python

— vonjd

4

Python允许您使用C和C ++创建扩展模块，与本机代码接口，并且仍然获得Python给您的优势。

TensorFlow使用Python，是的，但是它也包含大量的C ++。

这样就可以使用更简单的界面进行实验，从而减少了用Python进行的人工操作，并通过对C ++中最重要的部分进行编程来提高性能。

— 艾丽莎·哈罗德森（Alyssa Haroldsen）
source

0

您可以从此处查看的最新比率显示TensorFlow C ++内部需要约50％的代码，而Python需要约40％的代码。

C ++和Python都是Google的官方语言，所以也难怪为什么会这样。如果我必须在存在C ++和Python的地方提供快速回归...

C ++在计算代数内部，Python用于其他所有方面，包括测试。知道今天的测试无处不在，难怪Python代码对TF做出了如此大的贡献。

— 普罗斯蒂
source