Answers:
在运行开发服务器时(这是通过运行获得的)app.run()
,您将获得一个同步过程,这意味着一次最多处理一个请求。
通过将Gunicorn保留在其默认配置中并简单地增加Gunicorn的数量--workers
,您所获得的实际上是一些流程(由Gunicorn管理),每个流程的行为都类似于app.run()
开发服务器。4个工作人员== 4个并发请求。这是因为Gunicorn sync
默认使用其包含的工作程序类型。
重要的是要注意,Gunicorn还包含异步工作程序,即eventlet
和gevent
(以及tornado
,但似乎最好在Tornado框架中使用)。通过使用--worker-class
标志指定这些异步工作程序之一,您将获得Gunicorn管理多个异步进程的信息,每个进程都管理自己的并发性。这些进程不使用线程,而是协程。基本上,在每个进程中,一次只能发生1件事(1个线程),但是当对象等待外部进程完成(例如数据库查询或等待网络I / O)时,它们可以被“暂停”。
这意味着,如果您使用的是Gunicorn的异步工作程序之一,则每个工作程序一次最多可以处理多个请求。多少工人才是最好的,取决于您的应用程序的性质,其环境,运行的硬件等。有关更多详细信息,请参见Gunicorn的设计页面,并在其介绍页面上介绍gevent的工作方式。
当前,存在比已提供的解决方案简单得多的解决方案。运行应用程序时,只需将threaded=True
参数传递给app.run()
调用,例如:
app.run(host="your.host", port=4321, threaded=True)
根据在werkzeug文档中可以看到的另一种选择是使用processes
参数,该参数接收的数字> 1表示要处理的最大并发进程数:
- 线程化–进程应在单独的线程中处理每个请求吗?
- 进程–如果大于1,则将处理新进程中的每个请求,直到最大并发进程数。
就像是:
app.run(host="your.host", port=4321, processes=3) #up to 3 processes
关于更多信息run()
方法在这里,和博客文章,导致我找到解决方案和API引用。
注意:在Flask文档中,关于run()
方法的方法表明不鼓励在生产环境中使用它,因为(quote):“虽然Flask轻巧易用,但其内置服务器不适合生产,因为它的扩展性不好”。
不,您绝对可以处理更多。
重要的是要记住,假设您正在运行一台单核计算机,那么CPU实际上一次只能运行一条指令*。
也就是说,CPU只能执行非常有限的一组指令,并且每个时钟周期不能执行多个指令(许多指令甚至需要1个周期以上)。
因此,我们在计算机科学中谈论的大多数并发是软件并发。换句话说,有一些软件实现层从我们这里提取底层CPU,并使我们认为我们正在同时运行代码。
这些“事物”可以是进程,它们是代码单元,它们在每个进程都认为其在自己的世界中使用自己的非共享内存在运行时可以并发运行。
另一个示例是线程,线程是进程内部的代码单元,也允许并发。
您的4个辅助进程能够处理4个以上请求的原因是,它们将触发线程以处理越来越多的请求。
实际的请求限制取决于所选择的HTTP服务器,I / O,操作系统,硬件,网络连接等。
祝好运!
*说明是CPU可以运行的最基本的命令。示例-加两个数字,从一条指令跳转到另一条指令