背景:
我正在一个将Django与Postgres数据库一起使用的项目。在某些情况下,我们也会使用mod_wsgi,因为我的一些网络搜索都提到了它。在Web表单提交中,Django视图启动了一个需要大量时间的工作(比用户希望等待的时间还长),因此我们通过后台的系统调用来启动该工作。现在正在运行的作业需要能够读取和写入数据库。因为这项工作需要很长时间,所以我们使用多重处理来并行运行它的各个部分。
问题:
顶级脚本具有数据库连接,当它产生子进程时,似乎父级的连接对子级可用。然后有一个例外,关于在查询之前必须如何调用SET TRANSACTION ISOLATION LEVEL。研究表明,这是由于试图在多个进程中使用相同的数据库连接。我发现一个线程建议在子进程开始时调用connection.close(),以便Django在需要时自动创建一个新连接,因此每个子进程将具有唯一的连接-即不共享。这对我不起作用,因为在子进程中调用connection.close()导致父进程抱怨连接丢失。
其他发现:
我读过的一些东西似乎表明您不能真正做到这一点,并且多处理,mod_wsgi和Django不能很好地配合使用。我猜这似乎很难相信。
有些人建议使用celery,这可能是一个长期解决方案,但是我目前无法安装celery,需要等待一些批准程序,因此现在无法选择。
在SO和其他地方找到了一些有关持久数据库连接的参考,我认为这是一个不同的问题。
还发现了对psycopg2.pool和pgpool的引用以及有关bouncer的内容。诚然,我不了解我所读的大部分内容,但是它确实并没有像我想要的那样让我惊讶。
当前的“工作环境”:
现在,我已经恢复为仅串行运行,并且可以运行,但是速度比我想要的慢。
关于如何使用多处理并行运行的任何建议?好像我可以让父母和两个孩子都具有与数据库的独立连接一样,一切都会好起来的,但是我似乎无法获得这种行为。
谢谢,很抱歉!