此代码打开url并/names
在末尾附加,然后打开页面并将字符串打印到test1.csv
:
import urllib2
import re
import csv
url = ("http://www.example.com")
bios = [u'/name1', u'/name2', u'/name3']
csvwriter = csv.writer(open("/test1.csv", "a"))
for l in bios:
OpenThisLink = url + l
response = urllib2.urlopen(OpenThisLink)
html = response.read()
item = re.search('(JD)(.*?)(\d+)', html)
if item:
JD = item.group()
csvwriter.writerow(JD)
else:
NoJD = "NoJD"
csvwriter.writerow(NoJD)
但是我得到这个结果:
J,D,",", ,C,o,l,u,m,b,i,a, ,L,a,w, ,S,c,h,o,o,l,....
如果我将字符串更改为(“ JD”,“哥伦比亚法学院” ....),则会得到
JD, Columbia Law School...)
我在文档中找不到如何指定分度符。
如果我尝试使用delimenter
,则会出现此错误:
TypeError: 'delimeter' is an invalid keyword argument for this function
谢谢您的帮助。
如果使用writer.writerow s遇到此问题,请将列表列表而不是字符串列表传递给它。
—
Noumenon
delimiter
不是delimeter
:docs.python.org/library/csv.html