Answers:
您可以使用正则表达式并删除非数字。
str = str.replaceAll("\\D+","");
str = str.replaceAll("[^\\.0123456789]","");
(?!\\.)
这是更详细的解决方案。不太优雅,但可能更快:
public static String stripNonDigits(
final CharSequence input /* inspired by seh's comment */){
final StringBuilder sb = new StringBuilder(
input.length() /* also inspired by seh's comment */);
for(int i = 0; i < input.length(); i++){
final char c = input.charAt(i);
if(c > 47 && c < 58){
sb.append(c);
}
}
return sb.toString();
}
测试代码:
public static void main(final String[] args){
final String input = "0-123-abc-456-xyz-789";
final String result = stripNonDigits(input);
System.out.println(result);
}
输出:
0123456789
顺便说一句:我没有使用Character.isDigit(ch),因为它接受除0-9以外的许多其他字符。
StringBuilder
构造函数提供一个大小(例如input.length()
),以确保不需要重新分配大小。您不需要在String
这里要求;CharSequence
足够了。另外,您可以StringBuilder
编写一个单独的函数接受a CharSequence
作为输入,将Appendable
实例作为输出累加器,从而将非数字集合的分配与非数字集合分开。
public String extractDigits(String src) {
StringBuilder builder = new StringBuilder();
for (int i = 0; i < src.length(); i++) {
char c = src.charAt(i);
if (Character.isDigit(c)) {
builder.append(c);
}
}
return builder.toString();
}
使用Google Guava:
CharMatcher.inRange('0','9').retainFrom("123-456-789")
更新:
使用预计算的CharMatcher可以进一步提高性能
CharMatcher ASCII_DIGITS=CharMatcher.inRange('0','9').precomputed();
ASCII_DIGITS.retainFrom("123-456-789");
Charmatcher.DIGIT
预定义。
input.replaceAll("[^0-9?!\\.]","")
这将忽略小数点。
例如:如果您有输入,445.3kg
则输出为445.3
。
使用Google Guava:
CharMatcher.DIGIT.retainFrom("123-456-789");
CharMatcher是可插入的,并且使用起来非常有趣,例如,您可以执行以下操作:
String input = "My phone number is 123-456-789!";
String output = CharMatcher.is('-').or(CharMatcher.DIGIT).retainFrom(input);
输出== 123-456-789
我受到代码肖恩·帕特里克·弗洛伊德(Sean Patrick Floyd)的启发,几乎没有重写它,以获取最佳性能。
public static String stripNonDigitsV2( CharSequence input ) {
if (input == null)
return null;
if ( input.length() == 0 )
return "";
char[] result = new char[input.length()];
int cursor = 0;
CharBuffer buffer = CharBuffer.wrap( input );
while ( buffer.hasRemaining() ) {
char chr = buffer.get();
if ( chr > 47 && chr < 58 )
result[cursor++] = chr;
}
return new String( result, 0, cursor );
}
我用最少的数字对很长的字符串进行性能测试,结果是:
顺便说一句,这取决于该字符串有多长。对于仅包含6个数字的字符串,番石榴慢50%,而正则表达式慢1倍
您可以使用 str.replaceAll("[^0-9]", "");
我已经完成了电话号码+9(987)124124的代码。
Unicode字符占用4个字节。
public static String stripNonDigitsV2( CharSequence input ) {
if (input == null)
return null;
if ( input.length() == 0 )
return "";
char[] result = new char[input.length()];
int cursor = 0;
CharBuffer buffer = CharBuffer.wrap( input );
int i=0;
while ( i< buffer.length() ) { //buffer.hasRemaining()
char chr = buffer.get(i);
if (chr=='u'){
i=i+5;
chr=buffer.get(i);
}
if ( chr > 39 && chr < 58 )
result[cursor++] = chr;
i=i+1;
}
return new String( result, 0, cursor );
}
import java.util.*;
public class FindDigits{
public static void main(String []args){
FindDigits h=new FindDigits();
h.checkStringIsNumerical();
}
void checkStringIsNumerical(){
String h="hello 123 for the rest of the 98475wt355";
for(int i=0;i<h.length();i++) {
if(h.charAt(i)!=' '){
System.out.println("Is this '"+h.charAt(i)+"' is a digit?:"+Character.isDigit(h.charAt(i)));
}
}
}
void checkStringIsNumerical2(){
String h="hello 123 for 2the rest of the 98475wt355";
for(int i=0;i<h.length();i++) {
char chr=h.charAt(i);
if(chr!=' '){
if(Character.isDigit(chr)){
System.out.print(chr) ;
}
}
}
}
}