Questions tagged «sitemap»

站点地图(或站点地图)是爬网程序或用户可访问的网站页面列表。

19
网站地图悖论
我们在Stack Overflow上使用了站点地图,但对此我有不同的感觉。 Web爬网程序通常从站点内的链接和其他站点发现页面。Sitemap补充了此数据,以使支持Sitemap的搜寻器可以拾取Sitemap中的所有URL,并使用关联的元数据来了解这些URL。使用Sitemaps 协议并不能保证搜索引擎中会包含网页,但是会为Web爬网程序提供提示,以更好地抓取您的网站。 根据我们两年的站点地图经验,该站点地图在本质上有些悖论: Sitemaps适用于难以正确爬网的网站。 如果Google无法成功抓取您的网站来找到链接,但能够在站点地图中找到它,则它不会赋予站点地图链接任何权重,也不会为它建立索引! 这就是站点地图悖论- 如果您的站点未得到适当的爬网(无论出于何种原因),那么使用站点地图将无济于事! Google竭尽全力不提供任何站点地图保证: “我们不能对何时或是否您的网址将被抓取或添加到我们的索引预测或保证” 引文 “我们不保证将对您的所有URL进行爬网或建立索引。例如,我们不会对您的站点地图中包含的图像URL进行爬网或建立索引。” 引文 “提交Sitemap并不能保证你的网站的所有网页将在搜索结果中被抓取或” 引文 鉴于在站点地图中找到的链接仅是建议,而在您自己的网站上找到的链接被认为是规范的...似乎唯一合乎逻辑的事情是避免拥有站点地图,并确保Google和任何其他搜索引擎可以正确访问使用其他所有人都能看到的普通旧标准网页来搜寻您的网站。 到时候你做的是,和越来越好的震垮,彻底使谷歌可以看到你自己的网站链接到这些网页,并愿意抓取的链接-呃,为什么我们需要一个网站地图,再?该站点地图可能会造成有害影响,因为它会使您无法确保搜索引擎蜘蛛能够成功抓取整个网站。“哦,抓取工具是否可以看到它都没关系,我们只需在站点地图中拍打那些链接!” 现实与我们的经验相反。 考虑到站点地图是针对链接或非常复杂的UI的站点而设计的,这似乎有点讽刺意味。根据我们的经验,该站点地图无济于事,因为如果Google在您的网站上找不到合适的链接,则无论如何它都不会从该站点地图建立索引。我们已经一次又一次地看到有关堆栈溢出问题的证明。 我错了吗?站点地图是否有意义,而我们却以某种方式不正确地使用了它们?

5
是否有任何明确的指标表明我的站点地图文件是有益的?
我最近创建了一个sitemap.xml文件,并将其上传到我的Google Webmasters工具帐户。Google没有报告我的网站上载的站点地图有任何问题或错误。 现在我的问题是: 我怎么知道我的站点地图是否可以在Google网站站长工具中使用? 我问的原因是我不知道该怎么看或正在寻找,感觉就像我上载了一个无用的文件。

4
防止XML网站地图显示在Google搜索结果中
如何防止XML网站地图文件显示在Google搜索结果中,例如site:搜索查询的结果: 我不明白为什么Google首先会选择在搜索结果中显示站点地图文件。这些文件不供人类使用。 Google需要能够对其进行爬网以进行处理,因此我不能在robots.txt中禁止它。我只是不希望他们在处理之后将其放入搜索结果中。

6
Google为什么停止从我们的sitemap.xml中索引页面?
我们发现我们的网站中存在一些网页,sitemap.xml但Google的公共搜索索引莫名其妙地缺少了这些网页。 您无法下载/superuser//sitemap.xml,因为过去存在问题,因此我们会保护此文件,但googlebot可以。我们已经通过Google网站管理员工具验证了该sitemap.xml文件今天已被拉下,并且等级为“正常”,没有错误(绿色复选标记)。 其中sitemap.xml包含我们网站上最近提出的50,000个问题的列表。例如,这个问题... /superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links ...存在于sitemap.xml...中 <url> <loc>/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links</loc> <lastmod>2010-10-20</lastmod> <changefreq>daily</changefreq> <priority>0.2</priority> </url> 搜索“如何查看一长串符号链接的末尾”仅给questionhub.com提供一个结果,该结果正在抓取我们的数据(一个完全不同的问题)。 您可以增加问题计数的数目,并精确搜索问题标题,您将看到此模式仍然存在。 这些网址位于 sitemap.xml中,但未显示在Google的索引中-但仍显示在抓取我们的创作共用数据的网站上。为什么会这样呢?
18 google  sitemap 

5
& 在站点地图链接中,它们正确吗?
一个简单的问题,我只是想确保。 Google网站地图生成器生成了一个sitemap.txt文件,其中包含如下所示的链接: http://www.domain.com/category.htm?name=some-name&cat_id=8 &在这些链接中使用代替,是否正确,&或者这只是站点地图生成器的错误? 谢谢。
17 sitemap  links 

1
sitemap.xml是否必须在根目录中?
这可能是一个简单而荒谬的问题,但是否完全有必要将sitemap.xml文件放在站点的wordpress安装目录的根目录中,还是可以创建一个子目录并将其放置在该目录中?即/sitemap/sitemap.xml 我创建了一个动态生成的站点地图xml文件,但希望在进行更改时即时自动生成它,并且需要能够写入此文件。我想保留主要的wordpress文件夹权限,并且只允许该子目录可写。 很想听听对此事的任何想法!或其他解决方案...谢谢!
15 seo  sitemap 


4
用于创建XML网站地图的简便工具?(不断扩大的网站)
有人推荐吗 我可以作为CRON运行的php脚本 要么 我可以用来创建站点地图的某种第三方工具? 我的网站是活动基地,因此每天的页面都是临时的,每天有20多个新页面... Google提出了以下建议:http : //code.google.com/p/sitemap-generators/wiki/SitemapGenerators 但是它们看上去都相当老,我想知道是否有一些新颖的工具可用于此目的!
14 seo  google  php  sitemap 

2
如何正确使用Google网站站长工具(对于“非www”而不是“ www”)
我正在尝试正确使用Google网站站长工具:我没有www在网站的URL中使用,而是注意到www几个月前我最初将网站添加到网站站长工具时必须输入,我的网站已将www包含的内容编入索引。 我想问的是我是否应该创建另一个不www包含URL的网站配置文件。Google是否将两个版本都视为两个不同的网站?我不使用会伤害自己www吗? 当两个版本确实是同一站点时,他们如何处理添加验证文件?任一版本的验证文件都将位于服务器上的同一位置。如果为非www版本创建新的配置文件时使用相同的验证文件,会发生什么? 同样奇怪的是我为自己的网站创建了一个站点地图,但是网站站长工具说没有可用的站点地图。我用Yoast的WordPress SEO插件创建了它。

1
我应该将所有内容都包含在站点地图中还是仅包含新内容?
对于具有动态内容的网站(不断添加新内容),我应该只在站点地图中包含最新内容还是应该包含所有内容(具有站点地图索引)?特别是Sitemaps的最佳做法是什么。对于大型网站? 另外,有没有办法使Google(和其他搜索引擎)仅对站点地图中的页面进行爬网? 谢谢 更新: 另外,您知道stackoverflow如何处理此问题吗?我想知道,但不幸的是(也理解地),他们已阻止访问其站点地图。
13 seo  sitemap 

4
通过.htaccess重定向,文件robots.txt和sitemap.xml可以动态吗?
我有一个多语言和多域站点。它通过唯一的CMS安装(Drupal)运行,因此我只有一个根目录。因此,据我所知,如果我有一个静态robots.txt,我只能在其中显示单个域的文件。 我可以在.htaccess中加入一行吗 Redirect 301 /robots.txt /robots.php (或同等说明,请指出,如果允许的话) 所以它重定向到一个动态的PHP文件,在那里我可以用来根据不同的含有$_SERVER['HTTP_HOST']? 以及对sitemap.xml的相同问题,因此我可以提供一个动态的sitemap.php,它指示每个不同域的不同链接。 如上所述,不使用.txt和.xml的问题是所有域在服务器计算机中共享一个物理目录。

1
我可以在另一个域上托管站点地图吗?
出于好奇,我开发了一个小应用程序,用于分析和生成给定域的站点地图。 我可以告诉搜索引擎使用动态网址在我的应用程序上查找给定域的站点地图吗,也就是说,您可以在sitemaps.xml不验证自己是目标域所有者的情况下使用跨域吗? 例如 : http://example.com/mydomain.com/sitemap.xml

2
让搜索引擎识别多语言站点
我使用以下结构按语言组织了我的网站: www.domain.com #spanish language version homepage www.domain.com/en #english language version homepage 该站点是西班牙语主题,因此西班牙语是域名的基础。尽管该站点是现阶段的新站点,但我希望从google.com和google.es中搜索域将分别返回英语和西班牙语版本。 我是否需要采取任何特定步骤来将两者分开。我应该将它们都添加为Google网站管理员工具中的单个站点,还是应该为每个“站点”或整体提交单个站点地图? 提前致谢。

3
如何为动态网站创建良好的站点地图
我有一个网站,其中包含动态内容和不同类型的页面。我有一些页面很少更改,并且我的页面(例如博客)经常更改。博客页面还具有用于排序的链接,例如,按日期,升序,降序排序。 在某些页面上,我还具有指向不同选项卡式内容的链接,而这些链接只是锚链接。 现在,当我使用xml网站地图生成器时,所有链接都被扔到了站点中,因此我认为所有链接都不是真正相关的。 到目前为止的博客文章也将纳入站点地图。这真的有必要吗?我认为可以将指向博客文章的链接编入索引。 制作站点地图的最佳方法是仅手动将主菜单链接分配给该站点地图,还是真的建议对所有内容建立索引?
11 seo  sitemap 

6
为小型网站构建站点地图是否必要/有用?
我创建了几个小型网站,通常用于小型企业。它们通常包含有关公司的一些信息,联系表,有时还包含一些动态部分:新闻,图片等。 我可以为这些网站生成XML网站地图,但是我不确定这有什么意义?对于此类页面受限且易于发现的网站,生成站点地图有用吗?这样做有明显的优势(就SEO而言)?
11 seo  sitemap  dynamic 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.