Questions tagged «search-engine-indexing»

记录出现特定单词的地方的过程。在网络环境中,搜索引擎对网络进行爬网,并列出哪些页面包含特定单词-这就是索引。

3
搜索引擎为什么不索引我的内容?
这是一个普遍的,社会的维基捕获所有的问题和答案对旨在解决有关网站或特定网站内容不会出现在搜索引擎结果的原因有任何疑问。 如果您的问题作为该问题的重复而被关闭,并且您认为此处提供的信息不能提供足够的答案,请在Pro Webmasters Meta上进行讨论。 我的网站(或网站上的特定页面)未出现在搜索引擎结果中。 为什么我的内容未编入索引,我该怎么办?

5
页面在Google中显示为已编入索引,但找不到任何搜索词?
(请注意,我将在此处使用屏幕截图,因为我怀疑撰写有关此内容的内容会随着时间的推移而改变。) 如果您进行Google搜索 uiviewcontroller最佳做法 无论带引号或不带引号,您最终都会得到如下结果: 请注意,这些页面都无法解决标题中包含这些单词的实际堆栈溢出问题。他们决定解决以下问题之一:a)反映了我们的创用CC数据并正确地指向源问题而又没有按照我们的归因要求正确指定的nofollow;或者b)我们自己的问题内部链接,而不是实际问题本身。 带有标题的实际页面... 自定义UIView和UIViewController最佳做法? ... 确实存在于此网址... http://stackoverflow.com/questions/3300183/custom-uiview-and-uiviewcontroller-best-practices ...而且很明显它出现在Google的索引中! 但是为什么当我们搜索时却没有出现 uiviewcontroller最佳做法 ? 我们知道 Google在其索引中包含此页面 我们的搜寻字词与问题标题相符 堆栈溢出的页面排名远高于其他在知识共享中反映该问题的网站 我不明白 我们在做什么错呢?

6
如何防止搜索引擎将PDF文件编入索引?
此问题是从Stack Overflow 迁移而来的,因为可以在Webmasters Stack Exchange上回答。 迁移 8年前。 我在公共网页上有一个PDF文档的链接。如何防止搜索引擎将该链接和PDF文档编入索引? 我想到的唯一想法是使用CAPTCHA。但是,我想知道是否有魔术词告诉搜索引擎不要为链接和PDF文档编制索引?使用PHP或JavaScript的选项也可以。 为了清楚起见。我不想加密PDF并用密码保护它。我只想使它对搜索引擎不可见,但对用户不可见。

4
防止XML网站地图显示在Google搜索结果中
如何防止XML网站地图文件显示在Google搜索结果中,例如site:搜索查询的结果: 我不明白为什么Google首先会选择在搜索结果中显示站点地图文件。这些文件不供人类使用。 Google需要能够对其进行爬网以进行处理,因此我不能在robots.txt中禁止它。我只是不希望他们在处理之后将其放入搜索结果中。


13
如何获取包含要由搜索引擎索引的文本的图像?
我正在为一个朋友建立一个小型投资组合网站,并且从事广告以及所有工作,她讨厌标准字体,并且希望所有内容都以自定义字体编写。 由于CSS字体嵌入目前还不是真正的选择,因此所有文本(幸运的是,它们的数量很少)将作为图像放置。 我如何仍可以索引图像内容?对于小文本(链接,菜单等),我将文本放在alt属性中,但对于更长的文本,我认为这不是解决方案。我能做什么 ?将文字放在图片旁边的隐藏div中?

3
Google仍在抓取我的旧虚拟测试页并将其编入索引,现在找不到404
我已经用示例页面和数据(lorem ipsum等)设置了我的网站,而Google已抓取了这些页面。我删除了所有这些页面,并实际上添加了真实内容,但是在网站管理员工具中,Google仍然尝试抓取这些页面时仍然遇到很多404错误。我将它们设置为“标记为已解决”,但某些页面仍返回404。 此外,当我在Google上搜索我的网站时,我仍然列出了许多示例页面。如何删除它们。我认为这些无关的网页正在损害我的评分。 我实际上是想删除所有这些页面,并开始将我的网站编入新的索引,但我无法阅读吗?(我已经提交了站点地图,并使用了“以Google身份获取”。)


2
为Google Scholar编制索引,使用哪些标签?
Google学术搜索的“ 网站站长包含指南 ”中的“ 索引编制指南 ”中包含以下内容: Google学术搜索支持Highwire Press标签(例如citation_title),Eprints标签(例如eprints.title),BE Press标签(例如bepress_citation_title)和PRISM标签(例如prism.title)。不得已时使用都柏林核心标签(例如DC.title) 对于新网站。这些选项中的哪一个(Eprint,BE Press或PRISM)是最好的,这些标签在哪里记录?

4
如何让Google为我的PDF文档建立索引?
我们很难让Google为我们站点中的PDF文件编制索引。大约有50个PDF,大小范围为20 KB,甚至不到2兆。它们不受保护,可以匿名读取,并且可以在PDF Reader中搜索文档。 它们在SiteMap.xml中列出。我什至可以查看IIS日志并看到Googlebot读取PDF文件,但是除了五个文件外,它们从未包含在搜索结果中。 如果我执行filetye:pdf,则仅显示五个PDF。如果搜索我知道在PDF内的文本,则这些PDF将永远不会显示(除了被索引的五个PDF)。 有谁知道为什么索引超过45个以上的PDF文档没有包含在索引中,即使它们已包含在站点地图中并且Googlebot正在读取它们呢?

3
“站点:”搜索的索引页数少于Google网站站长工具中报告的数量
在Google网站管理员工具中,它显示我有309个页面被索引,但是当我使用“ site:site.com”进行搜索时,仅出现大约180个页面(在第一页上显示“大约608个结果”,接近帖子总数)。 我还注意到,以前被索引过的某些页面只是从Google中消失了。在Google网站管理员工具中,没有错误消息或任何表明Google会受到惩罚的信息。 根据Google网站管理员工具,每天都会为新页面建立索引,但由于某些原因,它们不会显示在搜索中。 我是否真的受到Google的惩罚或这是某种错误?如何解决此问题并使所有页面正常索引?

3
Google如何找到没有链接的域名?
我最近注册了一个新域,将其指向我的现有服务器,并设置了一个最小页面,仅显示“测试”,仅此而已。 我今晚才发现该页面已在Google中建立索引!没有指向该站点的链接(由于我还没有做任何事情,我什至没有告诉任何人有关该域的信息)。 Google是在拖曳WHOIS记录还是什么?

5
有什么方法可以使搜索引擎不为页面的特定部分编制索引?
我设置了Blogger,并在每个页面上显示了“博客存档”面板,以便用户可以轻松访问旧帖子。问题在于,它在此面板中列出了每个页面的标题,这意味着当前页面正在获取与它不直接相关但与另一个页面直接相关的关键字。 例如,我可能在写关于橘子的文章,但是一周前我在谈论关于苹果的文章。搜索引擎现在看到关于橙子的页面也在谈论苹果,因为“存档”面板中有一个链接指向我一周前关于苹果的帖子。在苹果页面也索引橙色关键字的情况下,情况也相反。 有什么方法可以排除索引页面的某个部分吗?(例如,有一个整体<div>被标记为noindex或类似名称。) 我知道Blogger可以选择删除“存档面板”中页面的标题,但是我希望它们停留在那儿,以便用户知道哪些帖子可用。


6
如何获得Google bot索引的数以千万计的页面?
我们目前正在开发一个网站,该网站目前拥有800万个唯一页面,该页面将立即增长到约2000万个,最终增长到约5000万个或更多。 在您批评之前... 是的,它提供了独特而有用的内容。我们不断处理来自公共记录的原始数据,并且通过进行一些数据清理,实体汇总和关系映射,我们能够生成高质量的内容,开发出一个非常有用且独特的网站,部分原因是数据。 它的PR是0(新域,没有链接),并且我们每天以大约500页的速度在爬行,到目前为止,我们的索引页数约为30,000。以这种速度,索引我们的所有数据将花费400多年。 我有两个问题: 索引的比率是否与PR直接相关,我的意思是它是否足够相关,以至于通过购买具有良好PR的旧域将使我们达到可行的索引比率(每天约100,000页)。 是否有任何SEO顾问专门研究索引过程本身。否则,我们在SEO方面的表现尤其出色,尤其是在页面上,此外,“长尾”关键字词组的竞争非常低,因此我们的成功主要取决于被索引的页面数。 我们的主要竞争对手在短短一年的时间内就完成了约20毫米的索引页面,并获得了Alexa 2000的排名。 我们拥有值得注意的品质: 页面下载速度还不错(250-500毫秒) 没有错误(抓取时没有404或500错误) 我们使用Google网站管理员工具并每天登录 友善的网址 恐怕要提交站点地图。一些SEO社区发布的帖子暗示一个新网站的页面数百万,没有PR可疑。Google上有一个Matt Matts的Google录像带,该录像带也介绍了大型网站的分期启动过程,以避免进行更多的审查(在录像带中大约为2:30)。 可点击的站点链接可交付所有页面,深度不超过四页,并且通常一个页面上的内部链接不超过250(-ish)。 内部链接的锚文本是合乎逻辑的,并且会在详细信息页面上按层次结构向数据添加相关性。 以前,我们已将网站管理员工具上的抓取速度设置为最高(最大每两秒钟仅一页)。我最近将其改回了“建议Google决定”的建议。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.