我想编写一个代码片段<content>
,在以下所有三个实例中(包括代码标签),都将在lxml中的标签中捕获所有文本。我已经尝试过了,tostring(getchildren())
但是那样会错过标签之间的文本。我没有太多运气在API中搜索相关功能。你能帮我吗?
<!--1-->
<content>
<div>Text inside tag</div>
</content>
#should return "<div>Text inside tag</div>
<!--2-->
<content>
Text with no tag
</content>
#should return "Text with no tag"
<!--3-->
<content>
Text outside tag <div>Text inside tag</div>
</content>
#should return "Text outside tag <div>Text inside tag</div>"