我在RosettaCode上找到了以下Java代码示例:
public static boolean prime(int n) {
return !new String(new char[n]).matches(".?|(..+?)\\1+");
}
- 我不是特别了解Java,但除了正则表达式本身以外,都了解此代码段的所有方面
- 当您在内置的PHP函数中找到它时,我对Regex有基本的基础知识。
.?|(..+?)\\1+
素数如何匹配?
我在RosettaCode上找到了以下Java代码示例:
public static boolean prime(int n) {
return !new String(new char[n]).matches(".?|(..+?)\\1+");
}
.?|(..+?)\\1+
素数如何匹配?
Answers:
您说您了解这部分,但仅强调一下,生成的字符串的长度等于提供的数字。因此,当且仅当字符串包含三个字符n == 3
。
.?
正则表达式的第一部分说:“任何字符,零次或一次”。因此,基本上是零个字符还是一个字符-或,按照我上面提到的,n == 0 || n == 1
。如果我们有匹配项,则返回该否定项。这与零和一不是质数这一事实相对应。
(..+?)\\1+
正则表达式的第二部分有些棘手,它依赖于组和反向引用。组是括号中的任何内容,然后由正则表达式引擎捕获并存储以供以后使用。反向引用是一个匹配的组,稍后将在同一正则表达式中使用。
该组捕获1个字符,然后捕获任何一个或多个字符。(+字符表示一个或多个,但仅表示前一个字符或组。因此,这不是“两个或四个或六个等字符”,而是“两个或三个等”。+?类似于+,但是它会尝试匹配尽可能少的字符。+通常会尝试对整个字符串进行吞噬,这在这种情况下很糟糕,因为这会阻止反向引用部分正常工作。)
下一部分是反向引用:同一组字符(两个或更多)再次出现。所述反向引用出现一次或多次。
所以。捕获的组对应于捕获的自然字符数(从2开始)。然后,所述组出现一些自然次数(也是从2开始)。如果存在匹配项,则意味着可以找到两个大于或等于2的数字的乘积,这些数字与n长度的字符串匹配……意味着您有一个复合n。再次返回成功匹配的否定:n不是素数。
如果找不到匹配项,那么您将无法得出两个大于或等于2的自然数的乘积...并且您同时具有不匹配项和质数,因此再次返回否定项比赛结果。
现在看到了吗?这真是令人难以置信的棘手(而且计算量很大!),但是一旦获得它,它同时也很简单。:-)
如果您还有其他问题,例如正则表达式解析的实际工作方式,我可以详细说明。但我现在尝试使这个答案保持简单(或尽可能简单)。
我将在素数测试之外解释regex部分:给定String s
包含重复的的以下regex String t
查找t
。
System.out.println(
"MamamiaMamamiaMamamia".replaceAll("^(.*)\\1+$", "$1")
); // prints "Mamamia"
它的工作方式是将正则表达式捕获(.*)
到中\1
,然后查看是否\1+
跟随它。使用^
和$
确保匹配必须是整个字符串。
因此,以某种方式,我们得到String s
,它是的“倍数” String t
,而正则表达式将找到它t
(可能\1
是最长的,因为是贪婪的)。
一旦您了解了此正则表达式的工作原理,然后(现在暂时忽略OP的正则表达式中的第一个替代方法),就很容易解释了它如何用于素数测试。
n
,请首先生成一个String
length n
(用填充相同的char
)String
一定长度(例如k
)的a捕获到中\1
,并尝试与\1+
其余部分匹配String
n
是的适当倍数k
,因此n
不是素数。k
存在分歧n
,并n
因此是素
.?|(..+?)\1+
素数如何匹配?
实际上,事实并非如此!它匹配 String
的长度不是素数!
.?
:String
长度0
或的交替匹配的第一部分1
(根据定义,不能为素数)(..+?)\1+
:交替的第二部分,该正则表达式的变形例如上所述,匹配String
长度的n
是一个“倍数” String
长度的k >= 2
(即n
是一个复合物,不是素)。
?
实际上是没有必要的正确性,但它可以通过尝试更小的帮助的提速过程k
第一注意语句中的!
boolean
补码运算符return
:它使取反matches
。这是正则表达式不匹配的时候,n
是最重要的!这是双重负逻辑,所以难怪它有点令人困惑!!
这是对代码的简单重写,以使其更具可读性:
public static boolean isPrime(int n) {
String lengthN = new String(new char[n]);
boolean isNotPrimeN = lengthN.matches(".?|(..+?)\\1+");
return !isNotPrimeN;
}
上面的代码与原始Java代码基本相同,但是分成多个语句并分配了局部变量,以使逻辑更易于理解。
我们还可以使用有限重复来简化正则表达式,如下所示:
boolean isNotPrimeN = lengthN.matches(".{0,1}|(.{2,})\\1+");
同样,给定String
长度为的n
,用相同的填充char
,
.{0,1}
检查是否n = 0,1
,不是素数(.{2,})\1+
检查是否n
为的适当倍数k >= 2
,不是素数与不愿改性剂的异常?
上\1
(为清楚起见省略),上述正则表达式是相同的原件。
以下正则表达式使用类似的技术;应该具有教育意义:
System.out.println(
"OhMyGod=MyMyMyOhGodOhGodOhGod"
.replaceAll("^(.+)(.+)(.+)=(\\1|\\2|\\3)+$", "$1! $2! $3!")
); // prints "Oh! My! God!"
[Populist]
一天。
不错的正则表达式技巧(尽管效率很低)... :)
正则表达式对非素数的定义如下:
当且仅当N <= 1或N被K> 1整除时,N不是素数。
代替将N的简单数字表示传递给正则表达式引擎,而是给它提供长度为 N 的序列,该序列由重复字符组成。析取的第一部分检查N = 0或N = 1,第二部分使用后向引用查找除数K> 1。它强制正则表达式引擎找到一些非空子序列,该子序列可以重复至少两次以形成序列。如果存在这样的子序列,则意味着其长度除以N,因此N不是素数。
!new String(new char[n]).matches(".?|(..+?)\\1+")
等同于!((new String(new char[n])).matches(".?|(..+?)\\1+"))
。