网站管理员 cache

30

不幸的是，我们的托管服务提供商经历了100％的数据丢失，因此我丢失了两个托管博客网站的所有内容： http://blog.stackoverflow.com http://www.codinghorror.com （是的，是的，我绝对应该完成完整的异地备份。不幸的是，我的所有备份都在服务器本身上。因此，请保存演讲；您100％绝对正确，但是此刻对我没有帮助。请继续关注这里的问题！）我正在开始从Web搜寻器缓存中恢复网站的缓慢而痛苦的过程。有一些自动工具可以从互联网蜘蛛网（Yahoo，Bing，Google等）的缓存中恢复网站，例如Warrick，但是使用此工具却产生了一些不好的结果：我的IP地址由于使用它而被Google快速禁止我收到很多500和503错误，并且“正在等待5分钟……” 最终，我可以更快地手动恢复文本内容通过使用所有博客文章的列表，单击进入Google缓存并将每个文件另存为HTML，我的运气要好得多。尽管博客文章很多，但博客文章却不多，我认为我应该因缺乏更好的备份策略而自欺欺人。无论如何，重要的是，我很幸运以这种方式获取博客文章文本，而且我绝对能够从Internet缓存中获取网页文本。根据到目前为止的经验，我有信心可以恢复所有丢失的博客文章文本和评论。但是，每篇博客文章附带的图片都证明……更加困难。从Internet缓存恢复网站页面的任何一般技巧，尤其是从网站页面恢复存档图像的地方？（再次，请不要提供备用讲座。您完全，完全，完全正确！但是正确不能解决我眼前的问题……除非您有时间机器……）

262 cache backups http-code-500 http-code-503

4

如何设置CSS，JS和图片的过期标头？

我最近在Firebug上使用Pagespeed插件分析了我的网站。它建议我设置CSS，JS和图像文件的到期时间。我想知道我该怎么做？

38 css javascript cache page-speed

5

防止304 / If-modified-since / HEAD请求的标头

内容缓存后，我应该发送什么标题以完全停止对服务器的所有请求？我们有一个非常高延迟的服务器（Sigh，VMWare），因此即使向HEAD服务器发送请求也要花费40ms。当前，这些是正在发送/接收的报头；第一个要求客户发送； GET http://dugong:8080/Rvi24mYJkxFRGNzq73PPvgWGh1j/IMG_2071.jpg HTTP/1.1 Host: dugong:8080 User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:9.0) Gecko/20100101 Firefox/9.0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: en-us,en;q=0.5 Accept-Encoding: gzip, deflate Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7 Pragma: no-cache, no-cache, no-cache Cache-Control: no-cache, no-cache, no-cache 服务器响应； HTTP/1.1 200 OK Server: nginx/1.0.11 Date: Wed, 01 Feb 2012 14:51:51 GMT Content-Type: text/plain …

31 cache http-headers

5

为什么浏览器没有安装jQuery？

我在几个网站上都使用jQuery，尽管我使用CDN来提供服务，但每次访问者下载jQuery都没有意义。jQuery必须是世界上使用最广泛的JavaScript框架-如果浏览器默认情况下仅安装了jQuery，这会更有意义吗？通过这种方式，每天可以阻止jQuery的下载数百万次。既可以来自人们自己的网站，也可以来自CDN。真正需要的只是某种if语句，例如： <!--[if jQuery gt 11]> 是否存在某种可以帮助我阻止用户访问CDN的东西（如果他们已经从另一个站点的缓存中获取了jQuery）？

19 cache browsers jquery

1

如何防止Google提供网站的缓存版本？

据我了解，如果添加标题，我可以告诉Google从其存档中删除页面： <meta name="ROBOTS" contents="NOARCHIVE" /> 但这是否还会从搜索结果中删除该页面？我只希望删除“缓存”链接。

19 seo google cache

2

除了“ Disallow /”之外，还可以控制Internet存档吗？

是否有任何机制可以控制网站上Internet档案的存档？我知道禁止添加所有页面： User-agent: ia_archiver Disallow: / 我可以告诉机器人我希望他们每月或每年一次爬网我的网站吗？我的网站/页面由于资产未被提取而无法/未正确存档。如果要抢占该网站，是否可以告诉Internet Archive bot它需要什么资产？

13 cache internet-archive

1

如果不设置缓存控制标头，会发生什么？

如果不设置cache-control标题会怎样？HTTP是否指定客户端应遵循的默认行为，还是由客户端决定？在Chrome浏览器中，我看到了一些Javascript请求，其中没有cache-control标头显示为200 (from disk cache)。Chrome是否正在对此进行优化？在IE中，我看到它显示为304 (not modified)。我如何更好地理解这一点？

13 cache http cache-control

2

带有查询的网址会禁用缓存？

将查询字符串附加到URL是否会导致浏览器从不缓存它？例如，我的网站执行以下操作： /radar-picture.png?v=sep2013 看来FireFox永远不会缓存该图片。它将根据每个请求下载。我希望FireFox可以缓存它，只要它想要的时间就可以。我只想在v=参数更改后强制其下载。

12 cache query-string

1

Cloudflare：URL具有查询字符串时缓存静态HTML

快速CloudFlare“新用户”问题为您提供：背景：我的原始服务器提供的HTML页面永远不会改变。在页面加载到用户浏览器后，所有动态内容都将通过JavaScript下载。JavaScript派生的动态内容部分取决于URL的查询字符串，但是查询字符串本身对最初下载的HTML内容没有影响。因此，以下URL 在被浏览器中的JavaScript作用之前，都会从源生成完全相同的HTML： https://www.example.com/private/my-investments?portfolioID=296 https://www.example.com/private/my-investments?portfolioID=325 https://www.example.com/private/my-investments?portfolioID=319 问题：鉴于CloudFlare默认情况下不缓存HTML，我应如何构造我的页面规则，以便将https://www.example.com/private/my-investments的单个缓存副本返回给所有用户？？这是我尝试过的： “ CACHE EVERYTHING：”使用'Cache Everything'指令导致对HTML进行缓存（良好），但是它将整个查询字符串用作缓存键的一部分（不良）。因此，如果用户点击以下网址... https://www.example.com/private/my-investments?portfolioID=296 ...然后十秒钟后，使用不同的查询字符串命中相同的URL，例如： https://www.example.com/private/my-investments?portfolioID=325 ... CloudFlare将后者的请求视为缓存MISS（cf-cache-status：MISS），然后再次命中我的原始服务器。尽管事实是两个URL从原点返回的HTML都是相同的。 “ IGNORE QUERY STRING CACHING：”我想肯定可以通过选择“ IGNORE QUERY STRING CACHING”选项来解决此问题。但是，在“页面规则”中使用此选项时，根本不会缓存HTML。仅缓存.js，.css和.png文件。再一次，每次对HTML数据的调用都会使我的起源受到打击。:( 我觉得我一定缺少明显的东西。有什么想法吗？更新：有一个主意，我想由您管理。我可以通过将内部URL方案更改为使用“＃”而不是“？”来解决此问题吗？因此，而不是像...这样的URL https://www.example.com/private/my-investments?portfolioID=296 ..我会使用类似： https://www.example.com/private/my-investments#portfolioID=296 这将完全阻止查询字符串参数传输到CloudFlare ...您如何看待？节日

10 html cache cloudflare

4

“ 404。那是一个错误。” 从Google缓存查看时

我的网站正在获取404。这是一个错误。当我单击从Google搜索结果缓存的消息时。这是来自Google的错误消息： That’s an error. /search?q=cache:8kxLAgFrhZQJ:www.mysite.com.....&cd=8&hl=en&ct=clnk&gl=uk在此服务器上找不到请求的URL 。我们知道的就这些。在收到此错误之前，我所做的是大约10天前，我将托管从Ixwebhosting移至Gearhost（基于云）。我还添加了301重定向，从non www到www。我不知道为什么会收到此错误。请告知如果有解决方案，可能是什么原因。我的所有页面都被Google索引了。

10 google 404 cache

3

更改整个用户图像文件结构以利用简单的浏览器缓存是否值得？

在我的一个移动网站上，我只是将用户的个人资料图片存储为用户文件夹中的“ 1.jpg”，然后从那里逐步上传他们上传的所有其他照片。这意味着，例如，每当他们更改个人资料照片时，文件名都保持不变。我一直想利用图像缓存，以便每次查看和重新查看用户的个人资料时都不会一遍又一遍地下载相同的旧图片，但是与此同时，我希望我的用户的浏览器能够如果已更改，请下载新的。从我一直在阅读的内容来看，真正做到这一点的唯一方法似乎是实际使用随机文件名并跟踪数据库中所有这些文件名，以便您可以设置一个未过期的缓存，而最近更改后的照片由于具有新文件名而再次被拉出。但是，到目前为止，我将它们进行结构化的方式的美丽之处在于，由于可以预测它们的位置，因此我可以完全跳过数据库并直接访问文件。因此，我的问题是，为了永久缓存和在新上载时自动重新下载而改变站点的整个文件结构，并添加DB元素是否值得？这是一项艰巨的任务，但是如果认为值得的话，那么我可以毫不犹豫地朝着这一巨大变化迈进。我只想确保这就是“大男孩”的做法，这样我就不必再更改文件结构了。谢谢。

9 php mysql cache images filenames

1

为什么将垃圾邮件添加到目标网页的Bing缓存中？

请在Bing “ url：testrails.org”上搜索并打开缓存的页面。Bing会在我自己的目标网页内容下方随机显示其他页面。太奇怪了！这是我到目前为止发现的：我在Bing网站站长站点上也管理着另一个域，该域存在相同的问题。而且我在Bing网站站长网站上没有管理第三个域。一般来说，我还有其他领域。他们不受影响。我在Bing网站管理员站点上管理的一个域的内容托管在Bluehost上，另一个域则托管在OpenShift上。仅登录页面（主index.html）受到影响。该网站上的其他页面不受影响。添加的内容似乎不是实际的Bing索引的一部分。它仅显示在缓存中。我自己的页面不包含任何可能带有病毒等的代码。（我是一名网络开发人员，已经检查了所有内容。） Bing实际上将添加的内容作为HTML代码的一部分提供。它与浏览器中的任何内容都不相关。（在启用和未启用JavaScript的情况下，无论是否登录我的Microsoft帐户，我都使用不同的设备进行了检查。）有任何想法吗？！

9 spam cache bing bing-webmaster-tools

3

为什么浏览器不尊重缓存标头用于初始页面请求？

我对此有点挠头。我运行的一个Drupal网站正在设置适当的缓存头，这些缓存头应指示该页面可以缓存15分钟。但是，每次我访问该页面时，它总是发送GET请求，而不是从缓存中加载该页面。我并不是每次都强制刷新页面，我认为这将向浏览器指示我要刷新缓存。我没有启用任何开发人员模式缓存清除功能。这仅仅是浏览器的默认行为，还是我遗漏了一些明显的东西？这是从FireFox开发工具访问我的主页时的请求/响应标头：注意/编辑：有人建议这与Expires过去的标题有关。但是，如RFC 2616 Sec 14.9.3中所述，Cache-Control优先于中的任何内容。Drupal包括此功能以禁用较旧的HTTP 1.0客户端上的缓存，该客户端不支持Drupal进行适当缓存所需的更高级的标头。ExpiresVary

8 cache

Questions tagged «cache»