不规则的互联网中断:某些图片和JS无法加载


11

第一次使用ServerFault,我遇到了一个小难题。

从现在开始的几个月以来,我们一直存在互联网连接问题。

环境:

Servers: 2 Terminal Servers as an RDSFarm running Windows Server 2008 R2
Browser: Internet Explorer 9
Test/debug browser: Chrome
AntiVirus: Avast 7.0.1455

问题:

网站会不定期地拒绝加载,并给出错误消息,指出该页面无法访问,或者某些图像无法完全加载。另外,检查后,serveral .js文件无法加载。

在此处输入图片说明

研究结果和尝试:

第一印象:

当我在该间隔内使用Chrome时,经过一些刷新后,该网站返回了net ::错误101或错误103。在其他时候,如果未给出错误,则看不到几张图像并显示X图像。IE只是说无法显示该页面。

在此处输入图片说明

使用Chrome开发者工具:

它在控制台中显示了几个资源不可用,但是当我右键单击丢失的图像并选择“显示图片”时,它们就会显示出来。当我通过直接URL打开图片时,它们也会显示。

在此处输入图片说明

通过Chrome开发者工具进行审核:

当页面处于越野车状态时,我对页面进行了审核,发现某些.js文件未与某些.png,.jpg和.gif文件一起加载。Chrome和IE会加载不同的图像。

在此处输入图片说明 在此处输入图片说明

混淆的JS文件和Avast:

经过检查后,我发现大多数.js文件都是模糊的JS文件,并且由于我们运行的是Avast 7.0.1455,所以我想知道Web Shield是否不会使事情变得混乱。

再说一次,它只发生在第一个TS上,而不是第二个。

所以我关闭了WebShield一天,看看是否有任何改善。没有。回到原点。

文件没有缓存过期:

那些未加载的文件中的几个表明没有缓存过期。

缓存:

我们的一位系统管理员将IE缓存大小更改为10MB,而我认为这可能是问题的根源。他将其更改回65MB左右,但仍然有人在图像上遇到麻烦。它也仍然在1 TS上以及在Chrome中发生,因此我认为组策略没有规定缓存会影响Chrome,不是吗?

在此处输入图片说明

网络问题: 我还认为这可能是网络或路由问题,但是两个TS服务器都在同一个成组的NIC上,而另一个则工作正常。

救命!

如果有人对在哪里寻找问题有一些提示,或者需要更多信息,请帮助我。现在已经困扰了我几个星期了。

编辑和更新

该问题仍然存在,并且仅在我们的2台终端服务器上。

到目前为止,这是我和同事所做的:

  • 在一台服务器上关闭防病毒软件一天,以查看是否没有发生。 问题仍然出现。

  • 检查了MTU大小
    这是默认设置(忘记确切的值:P) 仍然出现问题。

  • 安装的Windows Updates,IE10 仍然出现问题。

  • 检查是否有代理。
    AV放置代理作为所谓的WebShield。我们一天在一台服务器上禁用了该服务和程序。 问题仍然出现。

  • 由于混乱,重新安装了NIC团队。 (还重新安装了NIC驱动程序)仍然出现问题。

  • 检查组策略 显然在两个终端服务器中,都有一个本地计算机策略在IE中启用了“首选项模式”,它完成了一些怪异的自定义操作。禁用该功能,并且...仍然出现问题。

现在甚至到了人们无法从SharePoint上传和下载文件的地步,并且由于这个原因,我们正在使用的许多网站都无法正常工作。

腰腿

这与WebShield会在发现某些异常时断开连接有关,但是在关闭AV时不应发生这种情况。

可能是由于某种原因弄乱了重定向,或者是缓存中有东西。奇怪的是,在Chrome以及IE9和IE10中也会发生相同的问题。

如果有人有任何想法,将不胜感激。

感谢HopelessN00b对我的帮助!

更新:

在原始TS'之一上,我们在Event Viewer中遇到了一些错误,如下所示:

Error: (04/04/2013 08:44:42 AM) (Source: Application Error) (User: )
Description: Faulting application name: iexplore.exe, version: 9.0.8112.16470, time stamp: 0x510c8801
Faulting module name: MSHTML.dll, version: 9.0.8112.16470, time stamp: 0x510c9046
Exception code: 0xc0000005
Fault offset: 0x002d0174
Faulting process id: 0x21728
Faulting application start time: 0xiexplore.exe0
Faulting application path: iexplore.exe1
Faulting module path: iexplore.exe2
Report Id: iexplore.exe3

有时这会弹出,但是显然这是某些WYSE终端机的历史太久了(希望很快用Raspberry Pi取代它们)。

Error: (04/04/2013 11:21:46 AM) (Source: TermDD) (User: )
Description: The Terminal Server security layer detected an error in the protocol stream and has disconnected the client.
Client IP: [IP REDACTED].

希望这可以帮助。


1
它使我想起了从完全不同的角度来看的问题,基本上是与MTU配置有关的,没有考虑到数据包封装的地方,并且碎片化的数据包没有得到正确的重组,因此任何大于单个数据包的数据数据包只是不会加载..如果页面是https,则根本不会加载。
NickW

1
没问题,我会尝试在TS和有问题的机器之间的某个地方运行它。也许您的网络人员可以镜像连接TS的端口(或您正在测试的机器),以便您可以将一台装有Wireshk的机器粘在那儿以查看流量​​。
NickW

1
是的,那应该不会造成太大的问题。
NickW 2013年

1
顺便说一句,您已经研究过类似的权利:community.spiceworks.com/topic/…–
NickW

4
发生这种情况时,我会尝试两种方法。如果仅是域和JS,则检查到它们所在服务器的路由(路径非常整洁)-因为如果只有某些元素,则值得弄清什么是普通的东西以及它们为什么会失败。还有一个轻微的机会的一个ISP配置错误-我的家ISP这样做,它是在一个屁股痛彻底追查,并完全固定随机1天
中级野人

Answers:


0

尝试不绑定NIC。仅设置一个NIC,然后查看一切是否仍然有效。如果确实要确保您的交换机端口配置和分组配置对齐。


在我看来,这应该是评论,而不是答案。好主意。我看到NIC团队故障的原因,这是我时代的许多奇怪问题。
HopelessN00b 2013年

重新安装NIC团队时,我们尝试在没有一个团队的情况下仅在单个NIC上运行。也没用。
blaa 2013年

0

要在没有准确错误消息的情况下诊断问题,您需要运行:

  • 客户端上的tcpdump(wireshark的显示效果很好)
  • 服务器端的tcpdump(查看服务器实际发送的内容)。
  • 等待问题发生
  • 检查数据包,并查看通信中断的地方。如果您需要检查跟踪的帮助,请将其写入文件。

我怀疑您会找到未答复的DNS查询。如果您的ISP通过代理过滤流量,则应该能够在流量中找到它的踪迹,尤其是将服务器端捕获与客户端捕获进行比较。

如果存在网络质量问题,则可以使用traceroute更直接地观察到它。如果网络转储显示通讯正常,但是浏览器无法显示提供的数据,则问题出在终端服务器上的桌面程序。

您应该在建立浏览器连接无效的终端服务器上运行数据包捕获。


0

ISP已“解决”了这些问题。现在,所有图像和JS等图像都正常显示了一个星期。ISP通过在所有外部站点之间放置一个代理来解决无法访问的外部站点的问题。

不幸的是,发生这种情况或发生这种情况的确切原因仍然是一个谜,但是可以肯定的是,我的ISP进行了某些更改以达到目的。

感谢所有人的支持,尽管很多答案都非常有用,但我不能选择其中一个作为正确的答案,因此是我自己的。

再次感谢您的所有时间和精力,我希望没有其他人能够应对这种网络怪异。


1
我希望有一天能看到这样的事情!
NickW
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.