浏览Google网站站长工具的“抓取错误”部分时,我发现了一些非常奇怪的500错误,这些错误是针对我的网站的引用:
我能够找到这些字符是什么,并且显然它们是Unicode Private Use Area中的前两个字符。我的字体刚巧将它们映射到戴着小皇冠的青蛙,并且青蛙的符号类似于数字7。
这些符号仅出现在非HTML文件的地址上。Office文档,PDF等-但是它们不仅仅出现在文件名中。
这些符号来自何处,有什么办法可以摆脱它们,以便Google可以正确地爬行我的网站?
一些背景信息:
- 使用运行带有IIS6和PHP 5.3.8的WS2K3的Web服务器
- 网站编码为UTF-8
- 这些符号不会出现在页面上或源代码中
6
现在,您每天都看不到某些东西。
—
约翰·康德
@John Conde:告诉我。这不是星期一早上的问题。:P
—
Jacob Hume
它们出现在所有非HTML文件中还是仅出现在某些文件中?
—
froderik
@froderik只有少数几个受影响的文档由不同的开发人员发布到了网站的不同区域。
—
雅各布·休姆