最近,在将多个MetroE电路(L2连接)从100Mbps升级到1Gbps之后,我注意到某些站点之间的大文件传输失败。但是,传输仅会失败。例如,考虑以下示例。
从->到
A-> B =失败
B-> A =成功
A-> C =成功
C-> A =成功
B-> C =成功
C-> B =成功
每个站点都是位于该站点的L3交换机后面的路由网段。L3交换机连接到提供商的CPE媒体转换器,后者再通过光纤连接到提供商的网络。L3交换机之间使用静态路由。
*Site A* *Site B*
L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch
|
CPE
|
L3 Switch
*Site C*
该提供商对CPE中的电路进行了端到端测试,并报告没有损失。但是,在传输失败之前,我在主机上的数据包捕获中看到许多重复的ACK。
如果从等式中删除L3开关,然后将两个主机直接连接到每个站点的CPE设备,则文件传输成功完成。
Host A <-> CPE <--- Provider ---> CPE <-> Host B
如果将主机放置在L3交换机的任一侧,则VLAN间路由会顺利进行,并且文件传输成功完成。
Host A1 <-> L3 Switch <-> Host A2
仅当数据在两个路由段之间遍历提供程序时,才出现此问题。
Host A <-> L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch <-> Host B
我已经验证了很多事情-接口统计数据干净(无错误),CPU和内存利用率低,速度和双工匹配(客户端和CPE),MAC和ARP表正确等。
可能是什么问题?
更新1
从主机A和B捕获的数据包可以在以下URL中找到:
https://www.dropbox.com/sh/5m2yohgxieelo59/AADed-0EWOkdmFIe0qT45_uQa
此问题最初是使用运行12.3R6.6的Juniper EX3200交换机发生的。随后,我将交换机降级为11.4R6.6,但这不能解决问题。
我能够使用运行12.3R6.6和11.4R6.6的Juiper EX2200交换机来复制问题。使用运行3.3.11.2的Dell 6224交换机,我也能够复制问题。
当前,每个站点上仅CPE(ge-0 / 0/0)和单个主机(ge-0 / 0/1)连接到Juniper EX3200。在对问题进行故障排除时,我剥离了所有无关参数的配置,因此该配置相当基本。每个配置基本相同,但是IP地址不同。下面是一个片段。
# show interfaces
ge-0/0/0 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members WAN;
}
}
}
}
ge-0/0/1 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members LAN;
}
}
}
}
vlan {
unit 10 {
description WAN;
family inet {
address 192.168.X.X/27;
}
}
unit 100 {
description LAN;
family inet {
targeted-broadcast;
address 172.X.X.1/22;
}
}
}
# show vlans
WAN {
vlan-id 10;
l3-interface vlan.10;
}
LAN {
vlan-id 100;
l3-interface vlan.100;
}
更新2
今天,我注意到,如果我从站点A的L3交换机Juniper EX3200到站点B的L3交换机Juniper EX3200压缩文件,则该问题也影响了scp传输。
我发现这特别有趣,因为传输是从WAN VLAN上面向CPE的接口发起的,因为如果我通过EX3200交换机在受影响的站点之间中继VLAN,则交换文件传输将在站点A和B的主机之间成功完成。