与有效的IPv6地址匹配的正则表达式


111

我在编写匹配有效IPv6地址的正则表达式时遇到了麻烦,包括以其压缩形式(::在每个字节对中省略或带有前导零)的正则表达式。

有人可以建议一个满足要求的正则表达式吗?

我正在考虑扩展每个字节对,并将结果与​​一个更简单的正则表达式匹配。



我已经尝试了以下所有答案,但它们不适用于我的所有测试用例,并且/或者它们还包含未要求的IPv4。我发现到目前为止,这是最干净的解决方案:stackoverflow.com/a/21944928/3112803
gfrobenius

Answers:


251

我无法获得@Factor Mystic的答案才能使用POSIX正则表达式,因此我编写了一个可用于POSIX正则表达式和PERL正则表达式的答案。

它应该匹配:

IPv6正则表达式:

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

为了便于阅读,以下是上述正则表达式,将其在主要OR点处分为几行:

# IPv6 RegEx
(
([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|          # 1:2:3:4:5:6:7:8
([0-9a-fA-F]{1,4}:){1,7}:|                         # 1::                              1:2:3:4:5:6:7::
([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|         # 1::8             1:2:3:4:5:6::8  1:2:3:4:5:6::8
([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|  # 1::7:8           1:2:3:4:5::7:8  1:2:3:4:5::8
([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|  # 1::6:7:8         1:2:3:4::6:7:8  1:2:3:4::8
([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|  # 1::5:6:7:8       1:2:3::5:6:7:8  1:2:3::8
([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|  # 1::4:5:6:7:8     1:2::4:5:6:7:8  1:2::8
[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|       # 1::3:4:5:6:7:8   1::3:4:5:6:7:8  1::8  
:((:[0-9a-fA-F]{1,4}){1,7}|:)|                     # ::2:3:4:5:6:7:8  ::2:3:4:5:6:7:8 ::8       ::     
fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|     # fe80::7:8%eth0   fe80::7:8%1     (link-local IPv6 addresses with zone index)
::(ffff(:0{1,4}){0,1}:){0,1}
((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}
(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|          # ::255.255.255.255   ::ffff:255.255.255.255  ::ffff:0:255.255.255.255  (IPv4-mapped IPv6 addresses and IPv4-translated addresses)
([0-9a-fA-F]{1,4}:){1,4}:
((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}
(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])           # 2001:db8:3:4::192.0.2.33  64:ff9b::192.0.2.33 (IPv4-Embedded IPv6 Address)
)

# IPv4 RegEx
((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])

为了使上面的内容更容易理解,以下“伪”代码复制了上面的内容:

IPV4SEG  = (25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])
IPV4ADDR = (IPV4SEG\.){3,3}IPV4SEG
IPV6SEG  = [0-9a-fA-F]{1,4}
IPV6ADDR = (
           (IPV6SEG:){7,7}IPV6SEG|                # 1:2:3:4:5:6:7:8
           (IPV6SEG:){1,7}:|                      # 1::                                 1:2:3:4:5:6:7::
           (IPV6SEG:){1,6}:IPV6SEG|               # 1::8               1:2:3:4:5:6::8   1:2:3:4:5:6::8
           (IPV6SEG:){1,5}(:IPV6SEG){1,2}|        # 1::7:8             1:2:3:4:5::7:8   1:2:3:4:5::8
           (IPV6SEG:){1,4}(:IPV6SEG){1,3}|        # 1::6:7:8           1:2:3:4::6:7:8   1:2:3:4::8
           (IPV6SEG:){1,3}(:IPV6SEG){1,4}|        # 1::5:6:7:8         1:2:3::5:6:7:8   1:2:3::8
           (IPV6SEG:){1,2}(:IPV6SEG){1,5}|        # 1::4:5:6:7:8       1:2::4:5:6:7:8   1:2::8
           IPV6SEG:((:IPV6SEG){1,6})|             # 1::3:4:5:6:7:8     1::3:4:5:6:7:8   1::8
           :((:IPV6SEG){1,7}|:)|                  # ::2:3:4:5:6:7:8    ::2:3:4:5:6:7:8  ::8       ::       
           fe80:(:IPV6SEG){0,4}%[0-9a-zA-Z]{1,}|  # fe80::7:8%eth0     fe80::7:8%1  (link-local IPv6 addresses with zone index)
           ::(ffff(:0{1,4}){0,1}:){0,1}IPV4ADDR|  # ::255.255.255.255  ::ffff:255.255.255.255  ::ffff:0:255.255.255.255 (IPv4-mapped IPv6 addresses and IPv4-translated addresses)
           (IPV6SEG:){1,4}:IPV4ADDR               # 2001:db8:3:4::192.0.2.33  64:ff9b::192.0.2.33 (IPv4-Embedded IPv6 Address)
           )

我在GitHub上发布了一个脚本来测试正则表达式:https : //gist.github.com/syzdek/6086792


3
您的IPv4正则表达式不匹配IP,例如127.000.000.001
Kentzo

21
IPv4段不应包含前导零。如果存在前导零,则应将IPv4段解释为八进制。因此,上面的IPV4SEG不允许输入“ 000”是正确的。但是,它允许“ 00”,但不允许。
2014年

3
正如我所期望的那样,在浏览器中对我不起作用。甚至验证了reg.test('3zzzzffe:1900:4545:3:200:f8ff:fe21:67cf')显然也不是有效的IPv6地址。使用regex可以得到更好的结果:nbviewer.ipython.org/github/rasbt/python_reference/blob/master/…–
Capaj

7
梦幻般的ipv6正则表达式。在链接本地部分中发现了一个小错误。你有fe80它应该像[fF][eE]80ffff它应该是这样的[fF]{4}
user2831628

4
+1用于表示正则表达式可以(与任何源代码相同)可以实际读取(如果您注意并格式化它们)。
Natix

52

以下内容将验证IPv4,IPv6(完整和压缩)和IPv6v4(完整和压缩)地址:

'/^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$/iD'

8
即使可以按照Frank Krueger的建议完成ip-s验证,该解决方案还是可以真正回答问题(尽管我尚未对其进行全面测试)的解决方案,以及您是否有许多要进行语法测试的IP-s并且可能匹配一行文本,则不能使用IP验证技术。
Gyuri

嗨,我测试了此RegExp,但对我不起作用。它说D是一个无效的标志,当我将其删除时,它说“ SyntaxError:无效的量词”
diosney 2012年

3
JavaScript实现了Perl样式的正则表达式的子集,而不是PCRE的全部。没有PCRE的某些高级功能,我的正则表达式将无法工作。
MichaelRushton

2
这为我在C#中带来了例外
2013年

1
测试用例失败:FE80:0000:0000:0000:0202:B3FF:FE1E:8329在此日期使用最新版本的Elixir,其下面使用PCRE。
pmarreck

23

听起来您可能正在使用Python。如果是这样,您可以使用以下方式:

import socket

def check_ipv6(n):
    try:
        socket.inet_pton(socket.AF_INET6, n)
        return True
    except socket.error:
        return False

print check_ipv6('::1') # True
print check_ipv6('foo') # False
print check_ipv6(5)     # TypeError exception
print check_ipv6(None)  # TypeError exception

我认为您不必将IPv6编译到Python中即可获得inet_pton,如果您将socket.AF_INET第一个参数作为参数传入,它也可以解析IPv4地址。注意:这可能不适用于非Unix系统。


4
您应该在except子句中指定异常类型。否则,except将捕获所有内容,并可能掩盖不相关的错误。这里的类型应该是socket.error
2009年

A)inet_pton不会抛出其他异常,除非文档错误,并且B)即使发生异常,您还会返回除False之外的其他内容?
乔·希尔德布兰德

2
回复:其他错误...如果用户传入非字符串,则会误食TypeError。显然,列表不是ipv6,但我可能想让我误以为是我输入了错误的类型。
Gregg Lind

1
+1这对我很有帮助。还应该添加几个附加点:1)socket.inet_pton可用于测试两个IP地址家族(IP和IPv6)的有效性。2)此处的文档(docs.python.org/2/library/socket.html)建议在Unix平台上可用。它可能在Win平台上不可用。
mkoistinen 2013年

使用Django,这会有所帮助!
伊拉德·银

23

来自“ IPv6正则表达式 ”:

(\A([0-9a-f]{1,4}:){1,1}(:[0-9a-f]{1,4}){1,6}\Z)|
(\A([0-9a-f]{1,4}:){1,2}(:[0-9a-f]{1,4}){1,5}\Z)|
(\A([0-9a-f]{1,4}:){1,3}(:[0-9a-f]{1,4}){1,4}\Z)|
(\A([0-9a-f]{1,4}:){1,4}(:[0-9a-f]{1,4}){1,3}\Z)|
(\A([0-9a-f]{1,4}:){1,5}(:[0-9a-f]{1,4}){1,2}\Z)|
(\A([0-9a-f]{1,4}:){1,6}(:[0-9a-f]{1,4}){1,1}\Z)|
(\A(([0-9a-f]{1,4}:){1,7}|:):\Z)|
(\A:(:[0-9a-f]{1,4}){1,7}\Z)|
(\A((([0-9a-f]{1,4}:){6})(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3})\Z)|
(\A(([0-9a-f]{1,4}:){5}[0-9a-f]{1,4}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3})\Z)|
(\A([0-9a-f]{1,4}:){5}:[0-9a-f]{1,4}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A([0-9a-f]{1,4}:){1,1}(:[0-9a-f]{1,4}){1,4}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A([0-9a-f]{1,4}:){1,2}(:[0-9a-f]{1,4}){1,3}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A([0-9a-f]{1,4}:){1,3}(:[0-9a-f]{1,4}){1,2}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A([0-9a-f]{1,4}:){1,4}(:[0-9a-f]{1,4}){1,1}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A(([0-9a-f]{1,4}:){1,5}|:):(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)|
(\A:(:[0-9a-f]{1,4}){1,5}:(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}\Z)

45
这样的正则表达式应该是一种“代码味道”,也许正则表达式不是此处的最佳选择。(不过,我想操作人员确实要求过……)
Thanatos

10
@ user712092-每个看到过这样的代码库的人
danielpops 2012年

2
这对RE来说是完全不必要的麻烦。生成它的程序不了解它在做什么。人类永远不会这样做。不要被表面上的复杂性所迷惑-可再生能源对许多人来说确实是“黑魔法”,但是没有理由将它们放置在另一个星球上!
Chuck Kollars 2015年

+1但OMG,必须有更好的方法来做到这一点:P为基准:为Rails这可能帮助:stackoverflow.com/questions/16965697/...
的Tilo

1
确实是一种代码气味。但是,看一看后,您会发现每个正则表达式都非常简洁。问题是ipv6的“压缩”创建了不同的模式-冒号开头,中间和结尾,如果您使用过双冒号,那么您将无法再次使用它,在总数上前后的冒号必须加起来。Perl 6 也许可以解决这个问题,但这远远超出了PCRE语法。(PS-我不算最后的嵌入式ipv4,它比ipv6部分还要长!)
Gerard ONeill

11

我必须坚决支持弗兰克·克鲁格的回答。

虽然您说您需要一个正则表达式来匹配IPv6地址,但是我假设您真正需要的是能够检查给定的字符串是否为有效的IPv6地址。这里有一个微妙但重要的区别。

有多种方法可以检查给定的字符串是否为有效的IPv6地址,而正则表达式匹配只是一种解决方案。

如果可以,请使用现有的库。该库将具有较少的错误,并且其使用将减少需要维护的代码。

建议的正则表达式 Factor Mystic长而复杂。它很可能有效,但是您还应该考虑如果意外失败,应该如何应对。我要在此处说明的要点是,如果您自己无法形成所需的正则表达式,则将无法轻松调试它。

如果没有合适的库,最好编写自己的不依赖于正则表达式的IPv6验证例程。如果您编写它,则说明您理解它;如果您理解,则可以添加注释以对其进行解释,以便其他人也可以理解并随后进行维护。

使用正则表达式时,请谨慎行事,您不能向他人解释其功能。


1
使用两个正则表达式,一个自由表达式和一个异常表达式来捕获第一个表达式所允许的无效地址,可能比一个表达式(return ex1.match(S) && ! ex2.match(S))更容易。
Raedwald

4
您假设他几乎肯定会在大量文本中搜索IP时正在验证单个IP。
纳文

8

我不是Ipv6专家,但我认为您可以通过以下方法更轻松地获得不错的结果:

^([0-9A-Fa-f]{0,4}:){2,7}([0-9A-Fa-f]{1,4}$|((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)(\.|$)){4})$

回答“是有效的ipv6”,对我来说似乎还可以。要将它分解成一部分...算了。我省略了未指定的(::),因为在我的数据库中没有使用“未指定地址”。

开始: ^([0-9A-Fa-f]{0,4}:){2,7}<-匹配可压缩部分,我们可以将其翻译为:2到7之间的冒号,中间可能有十六进制数。

后跟: [0-9A-Fa-f]{1,4}$<-十六进制数字(省略前导0)或 ((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)(\.|$)){4}<-Ipv4地址


1
+1表示实际上坚持OP的问题,并提出了一个相对有效的正则表达式,该方法有些起作用。
xebeche 2013年

1
这不匹配“ :: 1”
lsalamon 2014年

??在Java正则语法中,它确实匹配:start() = 0, end() = 3 group(0) = "::1" group(1) = ":" group(2) = "1" group(3) = "null" group(4) = "null" group(5) = "null"
Remi Morin

有人通知我我的正则表达式有问题,压缩的部分“ ::”只能出现一次。因此,“ :: 1 :: 2”将与我的正则表达式匹配,但它不是有效的IPV6。第二个正则表达式可以验证这种情况。完整的建议是使用状态分析器进行验证。我同意生成的代码将更易于阅读和维护(并且可能有人已经在某个地方的开源代码中对其进行了编码)。
雷米·莫林

8

这也捕获了loopback(:: 1)和ipv6地址。将{}更改为+并将:放在第一个方括号内。

([a-f0-9:]+:+)+[a-f0-9]+

使用ifconfig -a输出http://regexr.com/进行了测试

Unix或Mac OSx终端o选项仅返回匹配的输出(ipv6),包括:: 1

ifconfig -a | egrep -o '([a-f0-9:]+:+)+[a-f0-9]+'

获取所有IP地址(IPv4或IPv6)并在UNIX OSx上打印匹配项

ifconfig -a | egrep -o '([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}) | (([a-f0-9:]+:+)+[a-f0-9]+)'

我喜欢简单。最终这对我ip a | grep -Po '[\w:]+:+[\w:]+'
有用

幽默感激!
Soumya Kanti,

当我运行ipconfig / all时,我的IP地址以%10结尾,此表达式与此部分不匹配?
彼得

7

该正则表达式将根据GNU C ++ regex的实现与有效的IPv6和IPv4地址进行匹配,并使用REGULAR EXTENDED模式:

"^\s*((([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:))|(([0-9A-Fa-f]{1,4}:){6}(:[0-9A-Fa-f]{1,4}|((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3})|:))|(([0-9A-Fa-f]{1,4}:){5}(((:[0-9A-Fa-f]{1,4}){1,2})|:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3})|:))|(([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4}){1,3})|((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:))|(([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){1,4})|((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:))|(([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){1,5})|((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:))|(([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){1,6})|((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:))|(:(((:[0-9A-Fa-f]{1,4}){1,7})|((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])){3}))|:)))(%.+)?\s*$"

5

谨防!在Java中,使用InetAddress和相关类(Inet4Address,Inet6Address,URL)可能会涉及网络流量!例如DNS解析(URL.equals,字符串中的InetAddress!)。这个电话可能要花很长时间,而且阻塞了!

对于IPv6,我有类似的内容。当然,这不会处理IPv6的非常细微的细节,例如仅某些类的IPv6地址才允许区域索引。而且此正则表达式不是为组捕获而编写的,它只是“匹配”类型的正则表达式。

S -IPv6段= [0-9a-f]{1,4}

I -IPv4 = (?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9]{1,2})\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9]{1,2})

示意图(第一部分将IPv6地址与后缀IPv4匹配,第二部分将IPv6地址与后缀匹配,最后一个是区域索引):

(
(
::(S:){0,5}|
S::(S:){0,4}|
(S:){2}:(S:){0,3}|
(S:){3}:(S:){0,2}|
(S:){4}:(S:)?|
(S:){5}:|
(S:){6}
)
I

|

:(:|(:S){1,7})|
S:(:|(:S){1,6})|
(S:){2}(:|(:S){1,5})|
(S:){3}(:|(:S){1,4})|
(S:){4}(:|(:S){1,3})|
(S:){5}(:|(:S){1,2})|
(S:){6}(:|(:S))|
(S:){7}:|
(S:){7}S
)

(?:%[0-9a-z]+)?

在这里,可能的正则表达式(不区分大小写,被行的开头/结尾等所需要的内容所包围,等等):

(?:
(?:
::(?:[0-9a-f]{1,4}:){0,5}|
[0-9a-f]{1,4}::(?:[0-9a-f]{1,4}:){0,4}|
(?:[0-9a-f]{1,4}:){2}:(?:[0-9a-f]{1,4}:){0,3}|
(?:[0-9a-f]{1,4}:){3}:(?:[0-9a-f]{1,4}:){0,2}|
(?:[0-9a-f]{1,4}:){4}:(?:[0-9a-f]{1,4}:)?|
(?:[0-9a-f]{1,4}:){5}:|
(?:[0-9a-f]{1,4}:){6}
)
(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9]{1,2})\.){3}
(?:25[0-5]|2[0-4][0-9]|[01]?[0-9]{1,2})|

:(?::|(?::[0-9a-f]{1,4}){1,7})|
[0-9a-f]{1,4}:(?::|(?::[0-9a-f]{1,4}){1,6})|
(?:[0-9a-f]{1,4}:){2}(?::|(?::[0-9a-f]{1,4}){1,5})|
(?:[0-9a-f]{1,4}:){3}(?::|(?::[0-9a-f]{1,4}){1,4})|
(?:[0-9a-f]{1,4}:){4}(?::|(?::[0-9a-f]{1,4}){1,3})|
(?:[0-9a-f]{1,4}:){5}(?::|(?::[0-9a-f]{1,4}){1,2})|
(?:[0-9a-f]{1,4}:){6}(?::|(?::[0-9a-f]{1,4}))|
(?:[0-9a-f]{1,4}:){7}:|
(?:[0-9a-f]{1,4}:){7}[0-9a-f]{1,4}
)

(?:%[0-9a-z]+)?

4

以下正则表达式仅适用于IPv6。组1与IP匹配。

(([0-9a-fA-F]{0,4}:){1,7}[0-9a-fA-F]{0,4})

+1不一定总有一个人类无法理解的完美的超级复杂正则表达式。我将使用它,因为我了解它的作用,并且就我而言,我可以确定如果我得到的东西类似于有效的ipv6,那么它就是有效的ipv6。
David L.

3
这不匹配,例如:fe80 :: 1或2342:32fd :: 2d32
James

3

一个简单的正则表达式可以匹配,但是我不建议任何形式的验证是这样的:

([A-Fa-f0-9]{1,4}::?){1,7}[A-Fa-f0-9]{1,4}

请注意,这与地址中的任何位置的压缩匹配,尽管它与环回地址:: 1不匹配。我发现这是一个合理的折衷,以使正则表达式保持简单。

我在iTerm2 智能选择规则中成功使用了它来四击IPv6地址。


3
你的意思A-F不是A-Z!另请注意,您不包括点分四进制表示法。
xebeche 2013年


2

Scala中,使用众所周知的Apache Commons验证器。

http://mvnrepository.com/artifact/commons-validator/commons-validator/1.4.1

libraryDependencies += "commons-validator" % "commons-validator" % "1.4.1"


import org.apache.commons.validator.routines._

/**
 * Validates if the passed ip is a valid IPv4 or IPv6 address.
 *
 * @param ip The IP address to validate.
 * @return True if the passed IP address is valid, false otherwise.
 */  
 def ip(ip: String) = InetAddressValidator.getInstance().isValid(ip)

按照该方法的测试ip(ip: String)

"The `ip` validator" should {
  "return false if the IPv4 is invalid" in {
    ip("123") must beFalse
    ip("255.255.255.256") must beFalse
    ip("127.1") must beFalse
    ip("30.168.1.255.1") must beFalse
    ip("-1.2.3.4") must beFalse
  }

  "return true if the IPv4 is valid" in {
    ip("255.255.255.255") must beTrue
    ip("127.0.0.1") must beTrue
    ip("0.0.0.0") must beTrue
  }

  //IPv6
  //@see: http://www.ronnutter.com/ipv6-cheatsheet-on-identifying-valid-ipv6-addresses/
  "return false if the IPv6 is invalid" in {
    ip("1200::AB00:1234::2552:7777:1313") must beFalse
  }

  "return true if the IPv6 is valid" in {
    ip("1200:0000:AB00:1234:0000:2552:7777:1313") must beTrue
    ip("21DA:D3:0:2F3B:2AA:FF:FE28:9C5A") must beTrue
  }
}

有趣的是,它声称要检查它是否为有效地址,“ 验证所传递的ip是否为有效的IPv4或IPv6地址。 ”,但实际上它仅检查其格式是否为有效地址。例如,1200:0000:AB00:1234:0000:2552:7777:1313是IPv6地址的有效格式,但是当测试方法返回时,它不是有效的IPv6地址。我敢打赌它认为241.54.113.65是有效的IPv4地址。
罗恩·莫平

2

查看其他答案中包含的模式,可以通过引用组和利用超前行为来改善许多好的模式。这是一个自引用模式的示例,如果需要,我将在PHP中使用该模式:

^(?<hgroup>(?<hex>[[:xdigit:]]{0,4}) # grab a sequence of up to 4 hex digits
                                     # and name this pattern for usage later
     (?<!:::):{1,2})                 # match 1 or 2 ':' characters
                                     # as long as we can't match 3
 (?&hgroup){1,6} # match our hex group 1 to 6 more times
 (?:(?:
    # match an ipv4 address or
    (?<dgroup>2[0-5]|(?:2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3}(?&dgroup)
    # match our hex group one last time
    |(?&hex))$

注意: PHP为此提供了一个内置的过滤器,它比该模式更好。

Regex101分析


2

我使用python生成了以下代码,并与re模块一起使用。前瞻性断言可确保在地址中出现正确数量的点或冒号。它不支持IPv6表示法中的IPv4。

pattern = '^(?=\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$)(?:(?:25[0-5]|[12][0-4][0-9]|1[5-9][0-9]|[1-9]?[0-9])\.?){4}$|(?=^(?:[0-9a-f]{0,4}:){2,7}[0-9a-f]{0,4}$)(?![^:]*::.+::[^:]*$)(?:(?=.*::.*)|(?=\w+:\w+:\w+:\w+:\w+:\w+:\w+:\w+))(?:(?:^|:)(?:[0-9a-f]{4}|[1-9a-f][0-9a-f]{0,3})){0,8}(?:::(?:[0-9a-f]{1,4}(?:$|:)){0,6})?$'
result = re.match(pattern, ip)
if result: result.group(0)

2

当您考虑带有嵌入式ipv4的地址和压缩的地址时,ipv6的正则表达式会变得非常棘手,如您从这些答案中看到的那样。

开源IPAddress Java库将验证IPv6和IPv4的所有标准表示形式,并且还支持前缀长度(及其验证)。免责声明:我是该库的项目经理。

代码示例:

        try {
            IPAddressString str = new IPAddressString("::1");
            IPAddress addr = str.toAddress();
            if(addr.isIPv6() || addr.isIPv6Convertible()) {
                IPv6Address ipv6Addr = addr.toIPv6();
            }
            //use address
        } catch(AddressStringException e) {
            //e.getMessage has validation error
        }

1

在Java中,您可以使用库类sun.net.util.IPAddressUtil

IPAddressUtil.isIPv6LiteralAddress(iPaddress);

3
sun.net。*是私有API。
David Kocher

1

很难找到适用于所有IPv6情况的正则表达式。它们通常难以维护,不易阅读,并且可能导致性能问题。因此,我想分享一个我开发的替代解决方案:用于IPv6的正则表达式(RegEx)与IPv4分开

现在,您可能会问:“此方法只能找到IPv6,如何在文本或文件中找到IPv6?” 这里也有解决此问题的方法。

注意:如果您不想在.NET中使用IPAddress类,也可以将其替换为我的method。它还涵盖了映射的IPv4和特殊情况,而IPAddress没有涵盖。

class IPv6
{
    public List<string> FindIPv6InFile(string filePath)
    {
        Char ch;
        StringBuilder sbIPv6 = new StringBuilder();
        List<string> listIPv6 = new List<string>();
        StreamReader reader = new StreamReader(filePath);
        do
        {
            bool hasColon = false;
            int length = 0;

            do
            {
                ch = (char)reader.Read();

                if (IsEscapeChar(ch))
                    break;

                //Check the first 5 chars, if it has colon, then continue appending to stringbuilder
                if (!hasColon && length < 5)
                {
                    if (ch == ':')
                    {
                        hasColon = true;
                    }
                    sbIPv6.Append(ch.ToString());
                }
                else if (hasColon) //if no colon in first 5 chars, then dont append to stringbuilder
                {
                    sbIPv6.Append(ch.ToString());
                }

                length++;

            } while (!reader.EndOfStream);

            if (hasColon && !listIPv6.Contains(sbIPv6.ToString()) && IsIPv6(sbIPv6.ToString()))
            {
                listIPv6.Add(sbIPv6.ToString());
            }

            sbIPv6.Clear();

        } while (!reader.EndOfStream);
        reader.Close();
        reader.Dispose();

        return listIPv6;
    }

    public List<string> FindIPv6InText(string text)
    {
        StringBuilder sbIPv6 = new StringBuilder();
        List<string> listIPv6 = new List<string>();

        for (int i = 0; i < text.Length; i++)
        {
            bool hasColon = false;
            int length = 0;

            do
            {
                if (IsEscapeChar(text[length + i]))
                    break;

                //Check the first 5 chars, if it has colon, then continue appending to stringbuilder
                if (!hasColon && length < 5)
                {
                    if (text[length + i] == ':')
                    {
                        hasColon = true;
                    }
                    sbIPv6.Append(text[length + i].ToString());
                }
                else if (hasColon) //if no colon in first 5 chars, then dont append to stringbuilder
                {
                    sbIPv6.Append(text[length + i].ToString());
                }

                length++;

            } while (i + length != text.Length);

            if (hasColon && !listIPv6.Contains(sbIPv6.ToString()) && IsIPv6(sbIPv6.ToString()))
            {
                listIPv6.Add(sbIPv6.ToString());
            }

            i += length;
            sbIPv6.Clear();
        }

        return listIPv6;
    }

    bool IsEscapeChar(char ch)
    {
        if (ch != ' ' && ch != '\r' && ch != '\n' && ch!='\t')
        {
            return false;
        }

        return true;
    }

    bool IsIPv6(string maybeIPv6)
    {
        IPAddress ip;
        if (IPAddress.TryParse(maybeIPv6, out ip))
        {
            return ip.AddressFamily == AddressFamily.InterNetworkV6;
        }
        else
        {
            return false;
        }
    }

}

1

InetAddressUtils已经定义了所有模式。我最终直接使用了他们的模式,并将其粘贴在这里以供参考:

private static final String IPV4_BASIC_PATTERN_STRING =
        "(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\\.){3}" + // initial 3 fields, 0-255 followed by .
         "([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])"; // final field, 0-255

private static final Pattern IPV4_PATTERN =
    Pattern.compile("^" + IPV4_BASIC_PATTERN_STRING + "$");

private static final Pattern IPV4_MAPPED_IPV6_PATTERN = // TODO does not allow for redundant leading zeros
        Pattern.compile("^::[fF]{4}:" + IPV4_BASIC_PATTERN_STRING + "$");

private static final Pattern IPV6_STD_PATTERN =
    Pattern.compile(
            "^[0-9a-fA-F]{1,4}(:[0-9a-fA-F]{1,4}){7}$");

private static final Pattern IPV6_HEX_COMPRESSED_PATTERN =
    Pattern.compile(
            "^(([0-9A-Fa-f]{1,4}(:[0-9A-Fa-f]{1,4}){0,5})?)" + // 0-6 hex fields
             "::" +
             "(([0-9A-Fa-f]{1,4}(:[0-9A-Fa-f]{1,4}){0,5})?)$"); // 0-6 hex fields 

1

使用Ruby?试试这个:

/^(((?=.*(::))(?!.*\3.+\3))\3?|[\dA-F]{1,4}:)([\dA-F]{1,4}(\3|:\b)|\2){5}(([\dA-F]{1,4}(\3|:\b|$)|\2){2}|(((2[0-4]|1\d|[1-9])?\d|25[0-5])\.?\b){4})\z/i


0

对于PHP 5.2+,用户filter_var效果很好。

我知道这并不能回答最初的问题(特别是正则表达式解决方案),但我希望将其发布,以期将来对其他人有所帮助。

$is_ip4address = (filter_var($ip, FILTER_VALIDATE_IP, FILTER_FLAG_IPV4) !== FALSE);
$is_ip6address = (filter_var($ip, FILTER_VALIDATE_IP, FILTER_FLAG_IPV6) !== FALSE);

0

这将适用于IPv4和IPv6:

^(([0-9a-f]{0,4}:){1,7}[0-9a-f]{1,4}|([0-9]{1,3}\.){3}[0-9]{1,3})$

2
它将无效地址与的2个实例进行匹配::。例如2404:6800::4003:c02::8a
nhahtdh 2015年

匹配无效的IPv4 666.666.666.666
Ryan Williams

0

这是我想出的,使用了一些先行和命名组。这当然只是IPv6,但是如果要添加IPv4,它不应干扰其他模式:

(?=([0-9a-f]+(:[0-9a-f])*)?(?P<wild>::)(?!([0-9a-f]+:)*:))(::)?([0-9a-f]{1,4}:{1,2}){0,6}(?(wild)[0-9a-f]{0,4}|[0-9a-f]{1,4}:[0-9a-f]{1,4})


0

只需匹配来自原点的本地方括号(包括方括号)即可。我知道它不那么全面,但是在javascript中其他代码很难追踪主要是无法正常工作的问题,因此这似乎让我了解了我现在需要的东西。也不需要多余的大写AF。

^\[([0-9a-fA-F]{1,4})(\:{1,2})([0-9a-fA-F]{1,4})(\:{1,2})([0-9a-fA-F]{1,4})(\:{1,2})([0-9a-fA-F]{1,4})(\:{1,2})([0-9a-fA-F]{1,4})\]

Jinnko的版本已简化,我认为更好。


0

如上所述,获得IPv6文本表示形式的验证解析器的另一种方法是使用编程。这是一个完全符合RFC-4291和RFC-5952的文件。我已经用ANSI C编写了此代码(与GCC一起使用,在Linux上通过了测试-与clang一起使用,在FreeBSD上通过了测试)。因此,它仅依赖于ANSI C标准库,因此可以在任何地方进行编译(我已经在FreeBSD的内核模块中将其用于IPv6解析)。

// IPv6 textual representation validating parser fully compliant with RFC-4291 and RFC-5952
// BSD-licensed / Copyright 2015-2017 Alexandre Fenyo

#include <string.h>
#include <netinet/in.h>
#include <stdlib.h>
#include <stdio.h>
#include <ctype.h>

typedef enum { false, true } bool;

static const char hexdigits[] = "0123456789abcdef";
static int digit2int(const char digit) {
  return strchr(hexdigits, digit) - hexdigits;
}

// This IPv6 address parser handles any valid textual representation according to RFC-4291 and RFC-5952.
// Other representations will return -1.
//
// note that str input parameter has been modified when the function call returns
//
// parse_ipv6(char *str, struct in6_addr *retaddr)
// parse textual representation of IPv6 addresses
// str:     input arg
// retaddr: output arg
int parse_ipv6(char *str, struct in6_addr *retaddr) {
  bool compressed_field_found = false;
  unsigned char *_retaddr = (unsigned char *) retaddr;
  char *_str = str;
  char *delim;

  bzero((void *) retaddr, sizeof(struct in6_addr));
  if (!strlen(str) || strchr(str, ':') == NULL || (str[0] == ':' && str[1] != ':') ||
      (strlen(str) >= 2 && str[strlen(str) - 1] == ':' && str[strlen(str) - 2] != ':')) return -1;

  // convert transitional to standard textual representation
  if (strchr(str, '.')) {
    int ipv4bytes[4];
    char *curp = strrchr(str, ':');
    if (curp == NULL) return -1;
    char *_curp = ++curp;
    int i;
    for (i = 0; i < 4; i++) {
      char *nextsep = strchr(_curp, '.');
      if (_curp[0] == '0' || (i < 3 && nextsep == NULL) || (i == 3 && nextsep != NULL)) return -1;
      if (nextsep != NULL) *nextsep = 0;
      int j;
      for (j = 0; j < strlen(_curp); j++) if (_curp[j] < '0' || _curp[j] > '9') return -1;
      if (strlen(_curp) > 3) return -1;
      const long val = strtol(_curp, NULL, 10);
      if (val < 0 || val > 255) return -1;
      ipv4bytes[i] = val;
      _curp = nextsep + 1;
    }
    sprintf(curp, "%x%02x:%x%02x", ipv4bytes[0], ipv4bytes[1], ipv4bytes[2], ipv4bytes[3]);
  }

  // parse standard textual representation
  do {
    if ((delim = strchr(_str, ':')) == _str || (delim == NULL && !strlen(_str))) {
      if (delim == str) _str++;
      else if (delim == NULL) return 0;
      else {
        if (compressed_field_found == true) return -1;
        if (delim == str + strlen(str) - 1 && _retaddr != (unsigned char *) (retaddr + 1)) return 0;
        compressed_field_found = true;
        _str++;
        int cnt = 0;
        char *__str;
        for (__str = _str; *__str; ) if (*(__str++) == ':') cnt++;
        unsigned char *__retaddr = - 2 * ++cnt + (unsigned char *) (retaddr + 1);
        if (__retaddr <= _retaddr) return -1;
        _retaddr = __retaddr;
      }
    } else {
      char hexnum[4] = "0000";
      if (delim == NULL) delim = str + strlen(str);
      if (delim - _str > 4) return -1;
      int i;
      for (i = 0; i < delim - _str; i++)
        if (!isxdigit(_str[i])) return -1;
        else hexnum[4 - (delim - _str) + i] = tolower(_str[i]);
      _str = delim + 1;
      *(_retaddr++) = (digit2int(hexnum[0]) << 4) + digit2int(hexnum[1]);
      *(_retaddr++) = (digit2int(hexnum[2]) << 4) + digit2int(hexnum[3]);
    }
  } while (_str < str + strlen(str));
  return 0;
}

-1

试试这个小单线。它只能匹配有效的未压缩/压缩的IPv6地址(不能匹配IPv4混合地址)

/(?!.*::.*::)(?!.*:::.*)(?!:[a-f0-9])((([a-f0-9]{1,4})?[:](?!:)){7}|(?=(.*:[:a-f0-9]{1,4}::|^([:a-f0-9]{1,4})?::))(([a-f0-9]{1,4})?[:]{1,2}){1,6})[a-f0-9]{1,4}/

实际上,有效的IPv6地址包括未压缩的,已压缩的,未压缩的混合型和压缩的混合型。实际上,与实际匹配IPv6地址的任何有效文本表示相比,所需的花费要大得多。
罗恩·莫平

-2

正则表达式允许在IPv4部分中使用前导零。

一些Unix和Mac发行版将这些段转换为八进制。

我建议将其25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d用作IPv4段。


-2

如果只需要普通IP(不带斜杠),请按以下步骤操作:

^(?:[0-9a-f]{1,4}(?:::)?){0,7}::[0-9a-f]+$

我在主机文件编辑器应用程序中将其用于语法荧光笔。作为魅力。


这绝对不可能正常工作,它不能将单个ipv6地址与单个冒号匹配,所有匹配项都在双冒号上,并且您的最后一组明确要求使用双冒号,汇总可以在任何地方进行。 。
KillianDS 2013年

(?:[0-9a-f] {1,4}(?:::?)?){0,7} ::?[0-9a-f] {1,4}
哈里

仍然是错误的,但是即使那样,您最终还是要重复JinnKo的答案,该答案对于简单的目的已经足够了,但是仍然存在缺陷(不会引起双重摘要,并且不允许点分四边形,也不能使用localhost或::终止,。 ..)
KillianDS
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.