有什么简单的方法可以删除字符串中的所有HTML标记或任何与HTML相关的内容?
例如:
string title = "<b> Hulk Hogan's Celebrity Championship Wrestling <font color=\"#228b22\">[Proj # 206010]</font></b> (Reality Series, )"
以上应该是:
“绿巨人霍根的名人冠军摔跤[项目编号206010](现实系列)”
由于重复,此问题已关闭,但建议的答案是使用HTML Agility Pack提供的。如果您想使用HTML Agility Pack删除html标签,则可以在此处stackoverflow.com/a/30026043/2318354参阅我的答案。这可能对某些人有所帮助
—
Dilip0165
这不是重复的内容,例如“ HTML敏捷包-删除不需要的标签而不删除内容?” 想要保留一些标签(即提供有效标签列表,删除其余标签)。这里的问题是关于删除所有标签。而且我不能使用其他问题的答案,因为我不会传递存在的所有html标记的列表。
—
Thierry_S
看一下xidel。到那里将花费您95%的时间
—
Josh Habdas,
xidel -s input -e '/'
。