我正在寻找一个php函数,该函数将接受一个输入字符串,并通过去除所有仅保留字母数字的特殊字符来返回其净化版本。
我需要另一个功能相同但仅返回字母字符AZ的函数。
任何帮助,不胜感激。
这些是哪种Unicode规范化格式,为什么要这样做?
—
tchrist 2011年
当您说AZ和“字母数字”时,您是真的意思是AZ还是要匹配所有语言(包括外语和过时的脚本)中的所有字母?
—
Mark Byers
如果这样做,则可以进行不区分重音符号的字符串比较,那么您做错了。
—
tchrist 2011年
这不只是“所有语言”。是英文 英文使用拉丁文字。有
—
tchrist 2011年
unichars '\p{Latin}' '\p{Alphabetic}' '[^A-Za-z]' | wc -l
== 1192个代码点是拉丁字母,但不是AZ。通常认为,ASCII足以满足英语要求。并非如此,这就是为什么编写AZ会有代码味的原因。
@Scott B:英语不仅使用AZ的26个字母。例如,单词résumé包含é。也许您可以解释您要做什么,因为这可能有助于您获得更好的答案。
—
Mark Byers