通过使用pprint模块,您可以检查元素的内容。
from pprint import pprint
pprint(vars(element))
在bs4元素上使用此命令将打印类似于以下内容的内容:
{'attrs': {u'class': [u'pie-productname', u'size-3', u'name', u'global-name']},
'can_be_empty_element': False,
'contents': [u'\n\t\t\t\tNESNA\n\t'],
'hidden': False,
'name': u'span',
'namespace': None,
'next_element': u'\n\t\t\t\tNESNA\n\t',
'next_sibling': u'\n',
'parent': <h1 class="pie-compoundheader" itemprop="name">\n<span class="pie-description">Bedside table</span>\n<span class="pie-productname size-3 name global-name">\n\t\t\t\tNESNA\n\t</span>\n</h1>,
'parser_class': <class 'bs4.BeautifulSoup'>,
'prefix': None,
'previous_element': u'\n',
'previous_sibling': u'\n'}
要访问一个属性(可以说是类列表),请使用以下命令:
class_list = element.attrs.get('class', [])
您可以使用以下方法过滤元素:
for script in soup.find_all('script'):
if script.attrs.get('for'):
elif "myClass" in script.attrs.get('class', []):
else: