网站管理员

专业网站管理员的问答


4
如何让Google为我的PDF文档建立索引?
我们很难让Google为我们站点中的PDF文件编制索引。大约有50个PDF,大小范围为20 KB,甚至不到2兆。它们不受保护,可以匿名读取,并且可以在PDF Reader中搜索文档。 它们在SiteMap.xml中列出。我什至可以查看IIS日志并看到Googlebot读取PDF文件,但是除了五个文件外,它们从未包含在搜索结果中。 如果我执行filetye:pdf,则仅显示五个PDF。如果搜索我知道在PDF内的文本,则这些PDF将永远不会显示(除了被索引的五个PDF)。 有谁知道为什么索引超过45个以上的PDF文档没有包含在索引中,即使它们已包含在站点地图中并且Googlebot正在读取它们呢?


4
Alexa Rank是增长的真实代表吗?
我处理公司网站的SEO。 上个月,我们在全国Alexa排名中达到了约30,000的峰值,但在过去3周中,该排名已下降至50,000。我公司的高管认为Alexa Rank是主要的增长指标。 在过去的3周中,流量已经稳定/分钟增长。虽然,我在网站上不断寻找SEO的途径,但我们看到了下降的趋势。 问题是Alexa是否可以很好地代表增长?
14 seo  pagerank  ranking  alexa 

8
使用与我的竞争对手相同的WordPress主题在法律上有问题吗?
我想从ThemeForest购买WordPress主题,但是它被竞争对手使用。 他们可以正式投诉我复制了他们的网站,即使该主题是公开可用的,并且是ThemeForest上最受欢迎的主题之一? 我希望对其进行修改以使其看起来有些不同,但是由于我尚未找到修改模板的最佳方法,而且我的竞争对手在未进行任何重大更改/调整的情况下使用了该主题,因此最初看起来非常相似。请注意,模板在ThemeForest上已售出30,000次以上。 我说对了,因为他们不拥有知识产权,这不是问题吗?

5
如何从我的网站IP地址中找到其他托管网站,为什么从SEO角度来看这很重要?
我听说从SEO角度来看很重要,在我的网站所存储的IP地址上还托管了哪些其他网站。服务器/ VPS上托管的其他网站是否会影响我在搜索引擎中的搜索结果? 我可以在telnet客户端中运行命令,以了解在我的网站的IP地址上存储了多少个/哪些网站?(例如,例如我从telnet客户端发送GET请求)

1
“Pokémon”和“ Pokemon”与Google是否有不同的关键字?
Google是否将Pokémon和Pokemon归类为不同的关键字?我想大多数人都不会使用simbol来写“ Pokemon”,因为它更容易,尽管正确的书写方式是“Pokémon”。 我尝试在Google搜索引擎中搜索“Pokémon”和“ Pokemon”,但确实出现了不同的结果,因此我假设Google搜索引擎不会自动假定每个键入“ Pokemon”的人都表示“Pokémon”。 有谁知道Google搜索引擎在处理类似的Unicode字符方面是否有任何特殊立场?

5
由于图像,HTTPS连接“不安全”
我目前正在网站上工作,并且已经成功安装了SSL证书。 GeoTrust SSL / TLS检查器确认证书链(包括CA)已正确安装。在Chrome上一切正常,但我的挂锁不是绿色的,而在Firefox上,它实际上指出该网站是不安全的,因为该网站上存在未加密的元素。 我使用了在线服务来检查原因,结果发现我的图像确实不被视为安全URL。如何处理这种情况,又如何将图片安全地嵌入到我的网站中?
14 https  images  security 

1
为什么这些网站会克隆我的内容,以及如何阻止它们?
因此,我正在Google上搜索自己的网站之一: http://www.botlibre.com 令我惊讶的是发现了我网站的一些克隆,例如: http://83waystowasteyourtime.adidas.com 和: http:// mediaiq.astral.comm 我的问题是: 他们为什么要创建我的网站的副本?某种SEO方案还是什么?他们可以获得什么收益? 他们如何在adidas.com和找到网址astral.comm?我认为这不是阿迪达斯加强我的内容。 如何关闭这些网站并阻止人们窃取我的内容?(在Tomcat上)


3
需要将3万个新页面添加到1万个页面的网站-将来会遇到麻烦吗?(SEO)
我们在一个网站上遇到了一个情况,我们计划添加大量新页面。该域已有10多年的历史,大约有1万个索引页面,并且计划增加的范围为。3万个新页面。 知道我们应该怎么做吗?我们必须计划逐步发布数据吗?您是否听说过任何行业标准,关于每天/每周/每月要添加多少新页面,以使其看起来自然且不会给Google带来麻烦?即我们应该计划每两周增加5K吗?


6
使用不存在的URL进行的大规模404攻击。如何预防呢?
问题是Google网站站长工具报告的全部404错误,其中包含从未出现过的页面和查询。其中一个是viewtopic.php,而且我还注意到,尝试检查该网站是否为WordPress网站(wp_admin)和cPanel登录的尝试次数令人恐惧。我已经阻止了TRACE,并且服务器配备了一些防御扫描/黑客的措施。但是,这似乎并没有停止。根据Google网站站长的说法,引荐来源网址为totally.me。 我一直在寻找一种解决方案来停止这种情况,因为它对贫穷的实际用户而言肯定不是好事,更不用说SEO了。 我使用的是Perishable Press迷你黑名单(在此处找到),标准的引荐来源网址拦截程序(适用于色情,草药,赌场网站),甚至还有一些用于保护该网站的软件(XSS拦截,SQL注入等)。服务器也正在使用其他措施,因此可以假设该站点是安全的(希望如此),但并没有结束。 还有其他人有同样的问题吗?或者我是唯一看到此问题的人吗?我认为是某种攻击吗?有没有解决的方法,或者更好的方法是防止这种无用的资源浪费? 编辑 我从未用过这个问题来感谢您的回答,并希望可以做到这一点。谢谢大家的深刻见解,这帮助我找到了解决之道。我遵循了每个人的建议并实施了以下内容: 一个蜜罐 一个脚本,该脚本侦听404页中的可疑网址,并向我发送包含用户代理/ ip的电子邮件,同时返回标准404标头 在相同的404自定义页面中,奖励合法用户的脚本,以防他们最终点击这些网址之一。在不到24小时的时间内,我就能够隔离出Spamhaus中列出的所有可疑IP。到目前为止,所有记录的IP都属于垃圾邮件VPS托管公司。 再次谢谢大家,如果可以的话,我会接受所有答案的。

3
什么是最低有效的robots.txt文件?
我不喜欢在Web服务器的access.log中看到很多404错误。我收到这些错误消息是因为抓取工具尝试打开robots.txt文件,但找不到任何文件。因此,我想放置一个简单的robots.txt文件,以防止404错误出现在我的日志文件中。 允许爬网该网站上所有内容的最小有效robots.txt文件是什么?
14 robots.txt 


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.