我需要在Python中通过http下载多个文件。
最明显的方法就是使用urllib2:
import urllib2
u = urllib2.urlopen('http://server.com/file.html')
localFile = open('file.html', 'w')
localFile.write(u.read())
localFile.close()
但我不得不面对以某种方式是讨厌的网址,这样说:http://server.com/!Run.aspx/someoddtext/somemore?id=121&m=pdf
。通过浏览器下载时,文件具有人类可读的名称,即。accounts.pdf
。
有什么办法可以在python中处理它,所以我不需要知道文件名并将其硬编码到脚本中?