我在RosettaCode上找到了以下Java代码示例:
public static boolean prime(int n) {
return !new String(new char[n]).matches(".?|(..+?)\\1+");
}
- 我不是特别了解Java,但除了正则表达式本身以外,都了解此代码段的所有方面
- 当您在内置的PHP函数中找到它时,我对Regex有基本的基础知识。
.?|(..+?)\\1+素数如何匹配?
我在RosettaCode上找到了以下Java代码示例:
public static boolean prime(int n) {
return !new String(new char[n]).matches(".?|(..+?)\\1+");
}
.?|(..+?)\\1+素数如何匹配?
Answers:
您说您了解这部分,但仅强调一下,生成的字符串的长度等于提供的数字。因此,当且仅当字符串包含三个字符n == 3。
.?
正则表达式的第一部分说:“任何字符,零次或一次”。因此,基本上是零个字符还是一个字符-或,按照我上面提到的,n == 0 || n == 1。如果我们有匹配项,则返回该否定项。这与零和一不是质数这一事实相对应。
(..+?)\\1+
正则表达式的第二部分有些棘手,它依赖于组和反向引用。组是括号中的任何内容,然后由正则表达式引擎捕获并存储以供以后使用。反向引用是一个匹配的组,稍后将在同一正则表达式中使用。
该组捕获1个字符,然后捕获任何一个或多个字符。(+字符表示一个或多个,但仅表示前一个字符或组。因此,这不是“两个或四个或六个等字符”,而是“两个或三个等”。+?类似于+,但是它会尝试匹配尽可能少的字符。+通常会尝试对整个字符串进行吞噬,这在这种情况下很糟糕,因为这会阻止反向引用部分正常工作。)
下一部分是反向引用:同一组字符(两个或更多)再次出现。所述反向引用出现一次或多次。
所以。捕获的组对应于捕获的自然字符数(从2开始)。然后,所述组出现一些自然次数(也是从2开始)。如果存在匹配项,则意味着可以找到两个大于或等于2的数字的乘积,这些数字与n长度的字符串匹配……意味着您有一个复合n。再次返回成功匹配的否定:n不是素数。
如果找不到匹配项,那么您将无法得出两个大于或等于2的自然数的乘积...并且您同时具有不匹配项和质数,因此再次返回否定项比赛结果。
现在看到了吗?这真是令人难以置信的棘手(而且计算量很大!),但是一旦获得它,它同时也很简单。:-)
如果您还有其他问题,例如正则表达式解析的实际工作方式,我可以详细说明。但我现在尝试使这个答案保持简单(或尽可能简单)。
我将在素数测试之外解释regex部分:给定String s包含重复的的以下regex String t查找t。
System.out.println(
"MamamiaMamamiaMamamia".replaceAll("^(.*)\\1+$", "$1")
); // prints "Mamamia"
它的工作方式是将正则表达式捕获(.*)到中\1,然后查看是否\1+跟随它。使用^和$确保匹配必须是整个字符串。
因此,以某种方式,我们得到String s,它是的“倍数” String t,而正则表达式将找到它t(可能\1是最长的,因为是贪婪的)。
一旦您了解了此正则表达式的工作原理,然后(现在暂时忽略OP的正则表达式中的第一个替代方法),就很容易解释了它如何用于素数测试。
n,请首先生成一个Stringlength n(用填充相同的char)String一定长度(例如k)的a捕获到中\1,并尝试与\1+其余部分匹配String
n是的适当倍数k,因此n不是素数。k存在分歧n,并n因此是素
.?|(..+?)\1+素数如何匹配?
实际上,事实并非如此!它匹配 String的长度不是素数!
.?:String长度0或的交替匹配的第一部分1(根据定义,不能为素数)(..+?)\1+:交替的第二部分,该正则表达式的变形例如上所述,匹配String长度的n是一个“倍数” String长度的k >= 2(即n是一个复合物,不是素)。
?实际上是没有必要的正确性,但它可以通过尝试更小的帮助的提速过程k第一注意语句中的! boolean补码运算符return:它使取反matches。这是正则表达式不匹配的时候,n是最重要的!这是双重负逻辑,所以难怪它有点令人困惑!!
这是对代码的简单重写,以使其更具可读性:
public static boolean isPrime(int n) {
String lengthN = new String(new char[n]);
boolean isNotPrimeN = lengthN.matches(".?|(..+?)\\1+");
return !isNotPrimeN;
}
上面的代码与原始Java代码基本相同,但是分成多个语句并分配了局部变量,以使逻辑更易于理解。
我们还可以使用有限重复来简化正则表达式,如下所示:
boolean isNotPrimeN = lengthN.matches(".{0,1}|(.{2,})\\1+");
同样,给定String长度为的n,用相同的填充char,
.{0,1}检查是否n = 0,1,不是素数(.{2,})\1+检查是否n为的适当倍数k >= 2,不是素数与不愿改性剂的异常?上\1(为清楚起见省略),上述正则表达式是相同的原件。
以下正则表达式使用类似的技术;应该具有教育意义:
System.out.println(
"OhMyGod=MyMyMyOhGodOhGodOhGod"
.replaceAll("^(.+)(.+)(.+)=(\\1|\\2|\\3)+$", "$1! $2! $3!")
); // prints "Oh! My! God!"
[Populist]一天。
不错的正则表达式技巧(尽管效率很低)... :)
正则表达式对非素数的定义如下:
当且仅当N <= 1或N被K> 1整除时,N不是素数。
代替将N的简单数字表示传递给正则表达式引擎,而是给它提供长度为 N 的序列,该序列由重复字符组成。析取的第一部分检查N = 0或N = 1,第二部分使用后向引用查找除数K> 1。它强制正则表达式引擎找到一些非空子序列,该子序列可以重复至少两次以形成序列。如果存在这样的子序列,则意味着其长度除以N,因此N不是素数。
!new String(new char[n]).matches(".?|(..+?)\\1+")等同于!((new String(new char[n])).matches(".?|(..+?)\\1+"))。