Word通配符搜索表达式匹配已经应用了特定字符样式的最长可能字符串
我正在编写一个宏来将Word文档转换为LaTeX。 一切顺利,除了一件事:文档大量使用样式模板,实际上使用字符样式来实现功能标记。例如,文本中出现的所有作者姓名都使用字符样式“作者姓名”。所有非英语单词或(以及它变得棘手的地方)短语都应用了“外语单词”样式。 让我们考虑一下“外来词”风格的例子。为了将它转换为LaTeX,我需要做的是创建一个搜索,尽可能贪婪地搜索所有应用了“外来词”样式的字符,取这个字符串,并将其包装在\ emph {\ 1}(\ 1表示匹配字符串的位置)。 使用微软的 非常温和的解释 它的通配符语法,我希望搜索术语“*”(没有引号)和应用的“外来词”样式应该这样做,但事实并非如此。它不够贪婪,只能找到个别角色。我可以通过在搜索中包含分隔符来使通配符搜索更加贪婪 - “[] * []”确实找到了整个单词---,但是在当前实例中会失败,因为,例如,当一个术语像“ ad-hoc“可能在空格之前和之后,空间本身不会应用”外来词“样式,因此被排除在搜索之外(永远不要指出存在大量潜在字符串边界的事实:多-word外语短语可以在冒号,分号,空格,六个潜在引号字符之一,段落标记或......之前和之后。 基本上,我正在寻找一个Word的通配符搜索表达式,它匹配可能具有某种样式的最长的不间断字符串。 由barlop编辑以添加OP的澄清。 `作为一个例子,给出下面的这个文字,我把它放在引号中。 “除了 seigneuries 虽然现在魁北克省唯一的贵族头衔可以追溯到 封建领主的 系统是'的标题' Baron de Longueuil ',在Le Moyne家族中“ 看看上面引用的那篇文章。所有斜体字都应用了“外来词”的风格。在“Baron de Longueil”的情况下,这包括“Baron”,“de”和“Longueil”之间的空格。我正在寻找一个搜索,将这三个斜体字中的每一个分别作为一个字符串。 结果应该是“除了\ emph {seigneuries}之外,还有更高贵的领地被授予,尽管现在魁北克唯一剩下的贵族头衔可以追溯到\ emph {seigneurial}系统的标题是' \ emph {Baron de Longueuil}',在Le Moyne家族中