我正在构建WSGI Web应用程序,并且有一个MySQL数据库。我正在使用MySQLdb,它提供了用于执行语句和获取结果的游标。获取和关闭游标的标准做法是什么?特别是,我的光标应持续多长时间?我应该为每个交易获取一个新的游标吗?
我相信您需要在提交连接之前关闭游标。查找不需要中间提交的事务集是否有任何显着的优势,这样您就不必为每个事务获取新的游标?获取新的游标是否有很多开销,还是没什么大不了的?
Answers:
既然不知道标准做法是什么,因为它通常不清楚并且很主观,所以您可以尝试向模块本身寻求指导。通常,使用with
另一个用户建议的关键字是一个好主意,但是在这种特定情况下,它可能无法提供您所期望的功能。
从模块的1.2.5版本开始,使用以下代码(github)MySQLdb.Connection
实现上下文管理器协议:
def __enter__(self):
if self.get_autocommit():
self.query("BEGIN")
return self.cursor()
def __exit__(self, exc, value, tb):
if exc:
self.rollback()
else:
self.commit()
已经有一些现有的问答with
,或者您可以阅读了解Python的“ with”语句,但是实质上发生的是__enter__
在with
块的开头__exit__
执行,并在离开with
块时执行。如果您打算以后引用该对象,则可以使用可选语法with EXPR as VAR
将返回的对象绑定 __enter__
到名称。因此,考虑到上述实现,以下是查询数据库的简单方法:
connection = MySQLdb.connect(...)
with connection as cursor: # connection.__enter__ executes at this line
cursor.execute('select 1;')
result = cursor.fetchall() # connection.__exit__ executes after this line
print result # prints "((1L,),)"
现在的问题是,退出with
块后连接和游标的状态是什么?__exit__
上面显示的方法仅调用self.rollback()
或self.commit()
,而这些方法都没有继续调用该close()
方法。游标本身没有__exit__
定义方法,也没有关系,因为with
只管理连接。因此,退出with
块后,连接和游标都保持打开状态。通过在上面的示例中添加以下代码,可以很容易地确认这一点:
try:
cursor.execute('select 1;')
print 'cursor is open;',
except MySQLdb.ProgrammingError:
print 'cursor is closed;',
if connection.open:
print 'connection is open'
else:
print 'connection is closed'
您应该看到输出到标准输出的“光标已打开;连接已打开”输出。
我相信您需要在提交连接之前关闭游标。
为什么?正如模块文档中所隐含的那样,作为基础的MySQL C APIMySQLdb
没有实现任何游标对象:“ MySQL不支持游标;但是,游标易于仿真。” 实际上,MySQLdb.cursors.BaseCursor
该类直接继承object
于游标,并且对提交/回滚没有任何限制。Oracle开发人员曾这样说:
cnx.commit()在cur.close()之前听起来对我来说最合逻辑。也许您可以遵循以下规则:“如果不再需要,请关闭光标。” 因此,在关闭游标之前使用commit()。最后,对于Connector / Python而言,它并没有多大区别,但是对于其他数据库而言,则可能没有什么不同。
我希望这与您达到该主题的“标准实践”一样近。
查找不需要中间提交的事务集是否有任何显着的优势,这样您就不必为每个事务获取新的游标?
我对此非常怀疑,在尝试这样做时,您可能会引入其他人为错误。最好决定约定并坚持执行。
获取新的游标是否有很多开销,还是没什么大不了的?
开销可以忽略不计,完全不涉及数据库服务器;它完全在MySQLdb的实现中。如果您真的想知道创建新游标时发生了什么,可以在BaseCursor.__init__
github上查看。
回到前面的讨论中with
,也许现在您可以理解为什么MySQLdb.Connection
类__enter__
和__exit__
方法在每个with
块中都为您提供了一个全新的游标对象,而不必理会它或在块末尾将其关闭。它相当轻巧,纯粹是为了您的方便而存在。
如果对微管理光标对象确实很重要,则可以使用contextlib.closing来弥补以下事实:光标对象没有定义的__exit__
方法。为此,还可以使用它强制连接对象在退出with
块时自行关闭。这应该输出“ my_curs已关闭; my_conn已关闭”:
from contextlib import closing
import MySQLdb
with closing(MySQLdb.connect(...)) as my_conn:
with closing(my_conn.cursor()) as my_curs:
my_curs.execute('select 1;')
result = my_curs.fetchall()
try:
my_curs.execute('select 1;')
print 'my_curs is open;',
except MySQLdb.ProgrammingError:
print 'my_curs is closed;',
if my_conn.open:
print 'my_conn is open'
else:
print 'my_conn is closed'
注意,with closing(arg_obj)
不会调用参数对象的__enter__
和__exit__
方法。它只会close
在with
块的末尾调用参数对象的方法。(要查看实际情况,只需Foo
使用__enter__
,__exit__
和close
包含简单print
语句的方法定义一个类,然后将执行时的操作with Foo(): pass
与执行时的操作进行比较with closing(Foo()): pass
。)这有两个重要的含义:
首先,如果启用了自动提交模式,则BEGIN
当您with connection
在块末尾使用并提交或回滚事务时,MySQLdb将在服务器上进行显式事务。这些是MySQLdb的默认行为,旨在保护您免受MySQL的立即提交任何DML语句的默认行为的影响。MySQLdb假定使用上下文管理器时需要事务,并使用显式BEGIN
绕过服务器上的自动提交设置。如果您习惯于使用with connection
,您可能会认为自动提交实际上只是被绕过了而被禁用了。如果添加,可能会给您带来不愉快的惊喜closing
您的代码并失去交易完整性;您将无法回滚更改,您可能会开始看到并发性错误,并且可能并不清楚为什么。
第二,with closing(MySQLdb.connect(user, pass)) as VAR
结合的连接对象到VAR
,在对比with MySQLdb.connect(user, pass) as VAR
,其结合一个新的光标对象到VAR
。在后一种情况下,您将无法直接访问连接对象!而是必须使用游标的connection
属性,该属性提供对原始连接的代理访问。关闭游标时,其connection
属性设置为None
。这将导致废弃的连接一直存在,直到发生以下情况之一:
您可以通过监视打开的连接(在Workbench中或使用SHOW PROCESSLIST
)进行测试,同时一步一步地执行以下几行:
with MySQLdb.connect(...) as my_curs:
pass
my_curs.close()
my_curs.connection # None
my_curs.connection.close() # throws AttributeError, but connection still open
del my_curs # connection will close here
my_curs
保留对该connection
对象的最后引用。一旦该引用不再存在,就应该对该connection
对象进行垃圾收集。
with
和MySQLdb.Connection
的__enter__
和__exit__
功能。再次感谢@Air。
最好使用'with'关键字重写它。“ With”将注意自动关闭游标(这很重要,因为它是非托管资源)。好处是它也会在出现异常的情况下关闭游标。
from contextlib import closing
import MySQLdb
''' At the beginning you open a DB connection. Particular moment when
you open connection depends from your approach:
- it can be inside the same function where you work with cursors
- in the class constructor
- etc
'''
db = MySQLdb.connect("host", "user", "pass", "database")
with closing(db.cursor()) as cur:
cur.execute("somestuff")
results = cur.fetchall()
# do stuff with results
cur.execute("insert operation")
# call commit if you do INSERT, UPDATE or DELETE operations
db.commit()
cur.execute("someotherstuff")
results2 = cur.fetchone()
# do stuff with results2
# at some point when you decided that you do not need
# the open connection anymore you close it
db.close()
with
如果要在Flask或其他Web框架中使用它,则不是一个好的选择。如果情况http://flask.pocoo.org/docs/patterns/sqlite3/#sqlite3
如此,那将会有问题。
with closing(self.db.cursor()) as cur: cur.execute("UPDATE table1 SET status = %s WHERE id = %s",(self.INTEGR_STATUS_PROCESSING, id)) self.db.commit()
注意:此答案适用于PyMySQL,它是MySQLdb的直接替代品,并且实际上是自停止维护MySQLdb以来的最新版本的MySQLdb。我相信这里的一切都还遗留MySQLdb的真实,但还没有检查。
首先,一些事实:
with
语法__enter__
在执行with
块的主体之前调用上下文管理器的方法,然后在执行其__exit__
方法。__enter__
除了创建和返回游标之外什么都不做的方法,以及一个__exit__
提交或回滚的方法(取决于是否抛出异常)。它不会关闭连接。__enter__
不执行任何操作的__exit__
方法,以及一种“关闭”游标的方法(这仅意味着将游标对其父连接的引用无效,并丢弃所有存储在游标上的数据)。__del__
关闭它们的方法将这些内容放在一起,我们会发现,像这样的幼稚代码在理论上是有问题的:
# Problematic code, at least in theory!
import pymysql
with pymysql.connect() as cursor:
cursor.execute('SELECT 1')
# ... happily carry on and do something unrelated
问题是没有任何事情关闭连接。实际上,如果将上面的代码粘贴到Python Shell中,然后SHOW FULL PROCESSLIST
在MySQL Shell上运行,您将能够看到您创建的空闲连接。由于MySQL的默认连接数为151,这不是很大,因此,如果您有许多使这些连接保持打开状态的进程,那么从理论上讲您可能会遇到问题。
然而,在CPython的,是有救命之恩,以确保像我上面的例子代码可能不会引起你的周围留下打开的连接的负载。节省cursor
的余地是,一旦超出范围(例如,创建函数的功能完成,或cursor
获得分配给它的另一个值),其引用计数将变为零,这将导致该引用计数被删除,从而删除连接的引用计数为零,导致__del__
调用该连接的方法,该方法强制关闭该连接。如果您已经将上面的代码粘贴到Python shell中,那么现在可以通过运行cursor = 'arbitrary value'
;进行模拟。一旦这样做,打开的连接就会从SHOW PROCESSLIST
输出中消失。
但是,仅依靠它是不明智的,并且在理论上可能会在CPython以外的Python实现中失败。从理论上讲,更.close()
干净的方法是显式地建立连接(无需等待Python销毁对象即可释放数据库上的连接)。这个更健壮的代码如下所示:
import contextlib
import pymysql
with contextlib.closing(pymysql.connect()) as conn:
with conn as cursor:
cursor.execute('SELECT 1')
这很丑陋,但不依赖Python破坏对象来释放数据库连接(数量有限)。
注意关闭游标,如果已经像这样显式关闭了连接,则完全没有意义。
最后,在这里回答次要问题:
获取新的游标是否有很多开销,还是没什么大不了的?
不,实例化一个游标根本不会影响MySQL,并且基本上什么也没做。
查找不需要中间提交的事务集是否有任何显着的优势,这样您就不必为每个事务获取新的游标?
这是情境,很难给出普遍的答案。正如https://dev.mysql.com/doc/refman/en/optimizing-innodb-transaction-management.html所说,“如果应用程序每秒提交数千次,则它可能会遇到性能问题,而如果每秒提交数千次,则可能会遇到性能问题。它仅每2-3小时提交一次”。您需要为每次提交支付性能开销,但是通过延长事务处理时间,会增加其他连接不得不花时间等待锁的机会,增加死锁的风险,并可能增加其他连接执行的某些查找的成本。
1 MySQL确实具有调用游标的构造,但它们仅存在于存储过程中;它们与PyMySQL游标完全不同,因此与此处无关。
我认为您最好尝试对所有执行使用一个游标,然后在代码末尾将其关闭。使用起来更容易,并且也可能带来效率收益(请不要在那方面引用我)。
conn = MySQLdb.connect("host","user","pass","database")
cursor = conn.cursor()
cursor.execute("somestuff")
results = cursor.fetchall()
..do stuff with results
cursor.execute("someotherstuff")
results2 = cursor.fetchall()
..do stuff with results2
cursor.close()
关键是您可以将游标执行的结果存储在另一个变量中,从而释放游标以执行第二次执行。仅当您使用fetchone()时,您才会遇到这种问题,并且在遍历第一个查询的所有结果之前需要执行第二次游标。
否则,我要说的是,一旦完成从光标中取出所有数据的操作,请立即关闭光标。这样,您不必担心稍后在代码中捆绑松散的末端。
我建议这样做像php和mysql。在打印第一个数据之前,在代码的开头启动i。因此,如果您遇到连接错误,则可以显示50x
(不记得内部错误是什么)错误消息。并在整个会话中保持打开状态,并在您不再需要它时关闭它。