我想要一个正则表达式从HTML页面提取标题。目前我有这个:
title = re.search('<title>.*</title>', html, re.IGNORECASE).group()
if title:
title = title.replace('<title>', '').replace('</title>', '')
是否有一个正则表达式仅提取<title>的内容,所以我不必删除标签?
5
哇,我简直不敢相信所有调用解析整个HTML页面的响应只是为了提取一个简单的标题。太夸张了!
—
hoju
问题标题说明了一切-给出的示例恰好是HTML,但是一般的问题是...一般。
—
菲尔(Phil)