我知道几种检查方法。正则表达式,int.parse
,tryparse
,循环。
谁能告诉我最快的检查方法是什么?
需要的只是检查,不需要实际解析。
这与以下问题不同:如何确定字符串是否为数字?
问题不仅在于如何识别。但是关于什么是最快的方法。
return str.All(Char.IsDigit);
我知道几种检查方法。正则表达式,int.parse
,tryparse
,循环。
谁能告诉我最快的检查方法是什么?
需要的只是检查,不需要实际解析。
这与以下问题不同:如何确定字符串是否为数字?
问题不仅在于如何识别。但是关于什么是最快的方法。
return str.All(Char.IsDigit);
Answers:
bool IsDigitsOnly(string str)
{
foreach (char c in str)
{
if (c < '0' || c > '9')
return false;
}
return true;
}
可能是最快的方法。
char.IsDigit()
IsDigit
返回true
大约300个字符。包括全角十进制数字0123
...(在中国和日本很常见)以及其他文化的数字,例如০১২௧௨௩௪꘤꘥꘦꘧꘨
等等。
return str.All(c => c >= '0' && c <= '9');
return str.All(char.IsDigit);
。方法组万岁!
以下是基于同一字符串的1000000个解析的一些基准:
更新了release
统计信息:
IsDigitsOnly: 384588
TryParse: 639583
Regex: 1329571
这是代码,看起来IsDigitsOnly更快:
class Program
{
private static Regex regex = new Regex("^[0-9]+$", RegexOptions.Compiled);
static void Main(string[] args)
{
Stopwatch watch = new Stopwatch();
string test = int.MaxValue.ToString();
int value;
watch.Start();
for(int i=0; i< 1000000; i++)
{
int.TryParse(test, out value);
}
watch.Stop();
Console.WriteLine("TryParse: "+watch.ElapsedTicks);
watch.Reset();
watch.Start();
for (int i = 0; i < 1000000; i++)
{
IsDigitsOnly(test);
}
watch.Stop();
Console.WriteLine("IsDigitsOnly: " + watch.ElapsedTicks);
watch.Reset();
watch.Start();
for (int i = 0; i < 1000000; i++)
{
regex.IsMatch(test);
}
watch.Stop();
Console.WriteLine("Regex: " + watch.ElapsedTicks);
Console.ReadLine();
}
static bool IsDigitsOnly(string str)
{
foreach (char c in str)
{
if (c < '0' || c > '9')
return false;
}
return true;
}
}
当然,值得注意的是,TryParse确实允许前导/尾随空格以及特定于文化的符号。字符串的长度也受限制。
int
,是的TryParse返回false。
您可以简单地使用LINQ做到这一点
return str.All(char.IsDigit);
.All
对于空字符串返回true,对于空字符串返回异常。char.IsDigit
对于所有Unicode字符均为true。字符已经具有一个IsDigit(char c)来执行此操作:
public static bool IsDigit(char c)
{
if (!char.IsLatin1(c))
return CharUnicodeInfo.GetUnicodeCategory(c) == UnicodeCategory.DecimalDigitNumber;
if ((int) c >= 48)
return (int) c <= 57;
else
return false;
}
您可以简单地做到这一点:
var theString = "839278";
bool digitsOnly = theString.All(char.IsDigit);
只需使用一个比较char
,for
而不是foreach
:可以将速度提高约20%
bool isDigits(string s)
{
if (s == null || s == "") return false;
for (int i = 0; i < s.Length; i++)
if ((s[i] ^ '0') > 9)
return false;
return true;
}
用于测试的代码(由于结果取决于硬件,版本,订单等,因此始终进行概要分析):
static bool isDigitsFr(string s) { if (s == null || s == "") return false; for (int i = 0; i < s.Length; i++) if (s[i] < '0' || s[i] > '9') return false; return true; }
static bool isDigitsFu(string s) { if (s == null || s == "") return false; for (int i = 0; i < s.Length; i++) if ((uint)(s[i] - '0') > 9) return false; return true; }
static bool isDigitsFx(string s) { if (s == null || s == "") return false; for (int i = 0; i < s.Length; i++) if ((s[i] ^ '0') > 9) return false; return true; }
static bool isDigitsEr(string s) { if (s == null || s == "") return false; foreach (char c in s) if (c < '0' || c > '9') return false; return true; }
static bool isDigitsEu(string s) { if (s == null || s == "") return false; foreach (char c in s) if ((uint)(c - '0') > 9) return false; return true; }
static bool isDigitsEx(string s) { if (s == null || s == "") return false; foreach (char c in s) if ((c ^ '0') > 9) return false; return true; }
static void test()
{
var w = new Stopwatch(); bool b; var s = int.MaxValue + ""; int r = 12345678*2; var ss = new SortedSet<string>(); //s = string.Concat(Enumerable.Range(0, 127).Select(i => ((char)i ^ '0') < 10 ? 1 : 0));
w.Restart(); for (int i = 0; i < r; i++) b = s.All(char.IsDigit); w.Stop(); ss.Add(w.Elapsed + ".All .IsDigit");
w.Restart(); for (int i = 0; i < r; i++) b = s.All(c => c >= '0' && c <= '9'); w.Stop(); ss.Add(w.Elapsed + ".All <>");
w.Restart(); for (int i = 0; i < r; i++) b = s.All(c => (c ^ '0') < 10); w.Stop(); ss.Add(w.Elapsed + " .All ^");
w.Restart(); for (int i = 0; i < r; i++) b = isDigitsFr(s); w.Stop(); ss.Add(w.Elapsed + " for <>");
w.Restart(); for (int i = 0; i < r; i++) b = isDigitsFu(s); w.Stop(); ss.Add(w.Elapsed + " for -");
w.Restart(); for (int i = 0; i < r; i++) b = isDigitsFx(s); w.Stop(); ss.Add(w.Elapsed + " for ^");
w.Restart(); for (int i = 0; i < r; i++) b = isDigitsEr(s); w.Stop(); ss.Add(w.Elapsed + " foreach <>");
w.Restart(); for (int i = 0; i < r; i++) b = isDigitsEu(s); w.Stop(); ss.Add(w.Elapsed + " foreach -");
w.Restart(); for (int i = 0; i < r; i++) b = isDigitsEx(s); w.Stop(); ss.Add(w.Elapsed + " foreach ^");
MessageBox.Show(string.Join("\n", ss)); return;
}
在Intel i5-3470 @ 3.2GHz,VS 2015 .NET 4.6.1发行模式下启用的结果和优化功能:
time method ratio
0.7776 for ^ 1.0000
0.7984 foreach - 1.0268
0.8066 foreach ^ 1.0372
0.8940 for - 1.1497
0.8976 for <> 1.1543
0.9456 foreach <> 1.2160
4.4559 .All <> 5.7303
4.7791 .All ^ 6.1458
4.8539 .All. IsDigit 6.2421
对于想使用较短方法的任何人,请注意
.All
结果true
为空字符串和异常的null
字符串char.IsDigit
对于Nd类别中的所有Unicode字符均为trueint.TryParse
还允许白色点缀和符号字符如果您担心性能,请int.TryParse
不要使用-也不要Regex
编写自己的(简单)函数(DigitsOnly
或 DigitsOnly2
以下函数,但不要 DigitsOnly3
-LINQ似乎会产生大量开销)。
另外,请注意,int.TryParse
如果字符串太长而无法“适合”int
。
这个简单的基准...
class Program {
static bool DigitsOnly(string s) {
int len = s.Length;
for (int i = 0; i < len; ++i) {
char c = s[i];
if (c < '0' || c > '9')
return false;
}
return true;
}
static bool DigitsOnly2(string s) {
foreach (char c in s) {
if (c < '0' || c > '9')
return false;
}
return true;
}
static bool DigitsOnly3(string s) {
return s.All(c => c >= '0' && c <= '9');
}
static void Main(string[] args) {
const string s1 = "916734184";
const string s2 = "916734a84";
const int iterations = 1000000;
var sw = new Stopwatch();
sw.Restart();
for (int i = 0 ; i < iterations; ++i) {
bool success = DigitsOnly(s1);
bool failure = DigitsOnly(s2);
}
sw.Stop();
Console.WriteLine(string.Format("DigitsOnly: {0}", sw.Elapsed));
sw.Restart();
for (int i = 0; i < iterations; ++i) {
bool success = DigitsOnly2(s1);
bool failure = DigitsOnly2(s2);
}
sw.Stop();
Console.WriteLine(string.Format("DigitsOnly2: {0}", sw.Elapsed));
sw.Restart();
for (int i = 0; i < iterations; ++i) {
bool success = DigitsOnly3(s1);
bool failure = DigitsOnly3(s2);
}
sw.Stop();
Console.WriteLine(string.Format("DigitsOnly3: {0}", sw.Elapsed));
sw.Restart();
for (int i = 0; i < iterations; ++i) {
int dummy;
bool success = int.TryParse(s1, out dummy);
bool failure = int.TryParse(s2, out dummy);
}
sw.Stop();
Console.WriteLine(string.Format("int.TryParse: {0}", sw.Elapsed));
sw.Restart();
var regex = new Regex("^[0-9]+$", RegexOptions.Compiled);
for (int i = 0; i < iterations; ++i) {
bool success = regex.IsMatch(s1);
bool failure = regex.IsMatch(s2);
}
sw.Stop();
Console.WriteLine(string.Format("Regex.IsMatch: {0}", sw.Elapsed));
}
}
...产生以下结果...
DigitsOnly: 00:00:00.0346094
DigitsOnly2: 00:00:00.0365220
DigitsOnly3: 00:00:00.2669425
int.TryParse: 00:00:00.3405548
Regex.IsMatch: 00:00:00.7017648
这应该工作:
Regex.IsMatch("124", "^[0-9]+$", RegexOptions.Compiled)
int.Parse
或int.TryParse
将无法始终有效,因为该字符串可能包含int可以容纳的更多数字。
如果您不止要进行一次此检查,则使用编译后的正则表达式会很有用-第一次会花费更多时间,但之后要快得多。
您可以在一行LINQ语句中执行此操作。好的,我意识到这不一定是最快的,因此从技术上讲并不能回答问题,但这可能是最容易编写的:
str.All(c => c >= '0' && c <= '9')
str.All(char.IsDigit)
更容易编写,但是当然不等同于您的代码。
IsDigit
支持unicode。因此,根据Microsoft在实施时选择的时间内存取舍,检查可能会非常昂贵。我假设它将转发到本机代码,这种转换也可能会非常昂贵。
您可以尝试使用正则表达式,.IsMatch(string input, string pattern)
方法是使用C#中的方法将输入字符串测试为仅包含数字(0-9)。
using System;
using System.Text.RegularExpression;
public namespace MyNS
{
public class MyClass
{
public void static Main(string[] args)
{
string input = Console.ReadLine();
bool containsNumber = ContainsOnlyDigits(input);
}
private bool ContainOnlyDigits (string input)
{
bool containsNumbers = true;
if (!Regex.IsMatch(input, @"/d"))
{
containsNumbers = false;
}
return containsNumbers;
}
}
}
问候
这将完美地工作,还有许多其他方法,但这将工作
bool IsDigitsOnly(string str)
{
if (str.Length > 0)//if contains characters
{
foreach (char c in str)//assign character to c
{
if (c < '0' || c > '9')//check if its outside digit range
return false;
}
}else//empty string
{
return false;//empty string
}
return true;//only digits
}
试试这个代码:
bool isDigitsOnly(string str)
{
try
{
int number = Convert.ToInt32(str);
return true;
}
catch (Exception)
{
return false;
}
}
Convert.ToInt32
运行速度比o(n)快,我会感到非常惊讶。您是否有证据支持这一假设?
这种检测字符串的巧妙而简便的方法是仅包含数字或不包含数字:
string s = "12fg";
if(s.All(char.IsDigit))
{
return true; // contains only digits
}
else
{
return false; // contains not only digits
}