Answers:
使用[^A-Za-z0-9]
。
注意:删除了空格,因为通常不将其视为字母数字。
尝试
return value.replaceAll("[^A-Za-z0-9]", "");
要么
return value.replaceAll("[\\W]|_", "");
return value.replaceAll("\\W", "");
您应该意识到,[^a-zA-Z]
它将替换字符范围AZ / az中本身不存在的字符。这意味着特殊字符,如é
,ß
等,或西里尔字符和诸如将被删除。
如果不想替换这些字符,请使用预定义的字符类:
str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");
PS:\p{Alnum}
无法达到此效果,其作用与相同[A-Za-z0-9]
。
[^\\p{IsAlphabetic}\\p{IsDigit}]
效果很好。
{IsDigit}
对我{Digit}
不起作用,原因是我正在Android上尝试此操作。并且Android UNICODE_CHARACTER_CLASS
默认情况下处于打开状态。感谢您的通关。
您也可以尝试使用以下更简单的正则表达式:
str = str.replaceAll("\\P{Alnum}", "");
str.replaceAll("[^\\p{Alnum}\\s]", "")
\\p{Alnum}\\p{Space}
。
我使用此方法来创建文件名:
public static String safeChar(String input)
{
char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
char[] charArray = input.toString().toCharArray();
StringBuilder result = new StringBuilder();
for (char c : charArray)
{
for (char a : allowed)
{
if(c==a) result.append(a);
}
}
return result.toString();
}
value.replaceAll("[^A-Za-z0-9]", "")
[^abc]
当插入符号^
作为方括号内的第一个字符出现时,它会否定该模式。该模式匹配除a或b或c之外的任何字符。
将关键字视为两个功能:
[(Pattern)] = match(Pattern)
[^(Pattern)] = notMatch(Pattern)
此外,关于模式:
A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=9 = all characters included from 0 to 9
因此它将替换模式中不包括的所有字符
如果您还希望允许不属于ascii字符集的字母数字字符(例如德语变音符号),可以考虑使用以下解决方案:
String value = "your value";
// this could be placed as a static final constant, so the compiling is only done once
Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);
value = pattern.matcher(value).replaceAll("");
请注意,使用UNICODE_CHARACTER_CLASS标志可能会影响性能(请参见此标志的javadoc)
简单方法:
public boolean isBlank(String value) {
return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}
public String normalizeOnlyLettersNumbers(String str) {
if (!isBlank(str)) {
return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
} else {
return "";
}
}
public static void main(String[] args) {
String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";
System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));
}
输出:衣原体衣原体IgGIgMIgAAbs8006
GitHub:https : //github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java
Guava的CharMatcher提供了一个简洁的解决方案:
output = CharMatcher.javaLetterOrDigit().retainFrom(input);