什么是在我的URL中添加青蛙字符?


8

浏览Google网站站长工具的“抓取错误”部分时,我发现了一些非常奇怪的500错误,这些错误是针对我的网站的引用:

模糊的网址

我能够找到这些字符是什么,并且显然它们是Unicode Private Use Area中的前两个字符。我的字体刚巧将它们映射到戴着小皇冠的青蛙,并且青蛙的符号类似于数字7。

这些符号仅出现在非HTML文件的地址上。Office文档,PDF等-但是它们不仅仅出现在文件名中。

这些符号来自何处,有什么办法可以摆脱它们,以便Google可以正确地爬行我的网站?

一些背景信息:

  • 使用运行带有IIS6和PHP 5.3.8的WS2K3的Web服务器
  • 网站编码为UTF-8
  • 这些符号不会出现在页面上或源代码中

6
现在,您每天都看不到某些东西。
约翰·康德

@John Conde:告诉我。这不是星期一早上的问题。:P
Jacob Hume

它们出现在所有非HTML文件中还是仅出现在某些文件中?
froderik

@froderik只有少数几个受影响的文档由不同的开发人员发布到了网站的不同区域。
雅各布·休姆

Answers:


4

只是一个猜测,但是一种可能是其他人正在使用一些损坏的代码将其热链接到您的文件。我知道,每当我对自己的网站提出不可靠的要求时,我始终能够将其跟踪到其他人的异常链接。(令人讨厌的是,蜘蛛程序不包含Http-Referer标头,使我们更容易识别这些URL的来源)。


1
“ ...蜘蛛程序不包含Http-Referer标头...”-是的,但是Google网站管理员工具确实包含报告(通常)列出了哪些站点链接到相关内容的报告。
danlefree 2011年

我对网站站长工具的“指向您网站的链接”和“内部链接”部分进行了快速检查,在显示的1,000个链接中没有看到任何字符。不过好主意!
雅各布·休姆
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.