我有一个看起来像这样的字符串:
6Â 918Â 417Â 712
修剪此字符串的明确方法(据我了解Python)只是说该字符串在名为的变量中s
,我们得到:
s.replace('Â ', '')
这应该够了吧。但是,当然,它抱怨'\xc2'
文件blabla.py 中的非ASCII字符未编码。
我从不完全了解如何在不同的编码之间进行切换。
这是代码,它的确与上面的代码相同,但是现在是在上下文中。该文件在记事本中另存为UTF-8,并具有以下标头:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
代码:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
它没有比s.replace
... 更进一步
u