我最近遇到了解码html实体的问题。我有以下两个字符串(请注意如何使用两种编码方法(命名和编号))。
The old "how to fold xml" question
Babel doesn't wrap results in verbatim
我需要将它们转换为
The old "how to fold xml" question
Babel doesn't wrap results in verbatim
到处搜索,我发现了关于SO的这个老问题(这是我目前正在做的事情),但是我拒绝相信Emacs没有内置的方法。我们有几种Web浏览器,至少我知道其中两种是内置的,更不用说邮件客户端和提要阅读器了。
是否没有内置的方法来解码html实体?
我正在寻找一个函数,该函数从第一个示例获取一个字符串,然后从第二个示例返回一个字符串。
如果有的话,我敢打赌它必须在nxml代码中,因为它能够解析DTD并可以验证文档中的实体。
—
wasamasa 2014年
libxml-parse-html-region
当然可以做到这一点,但它可能还会做更多的事情,因为它还可以解析HTML标签…(而且我猜并不是所有的Emacs都支持LibXML。)