儿童网站的网络安全


12

我正在为一个11岁的父母建立一个Wordpress网站,想要一个纪念她女儿的运动,学习和个人成就的网站。该网站包含她和朋友的照片和视频,传记信息和博客文章。该域名以我公司的名义进行了私下注册,我没有将它们添加到Google控制台中,并且将其他SEO保持在最低限度。没有姓氏或实际地址。我想尽可能多地确保网络安全,以免刮擦器抓到她的照片等,窥探眼睛的东西。值得调查,也值得给我点赞。孩子的网站品味极佳,而父母则脚踏实地,

对于这个11岁的孩子及其网站,我可以采取任何可靠的方法来提高Web安全性吗?


3
这是一个开始:webmasters.stackexchange.com/questions/77031/…我将总体上考虑该站点的其他想法。顺便说一句-很好地承担了这项任务!这是一个艰难的过程。但是值得付出努力!!我曾经做过免费的慈善托管以及付费托管,到目前为止,崇高的事业一直是我的最爱。这些是我记得的!
closetnoc

3
您确实意识到,您要做的任何事情都不会使其100%隐形……所要做的就是有人在Facebook或Tumblr上发布指向它的链接,并且该网站将在那里……最好的办法是拥有父母监督/批准孩子发布的所有内容,并就他们需要注意的
事项

4
robots.txt内容正确的文件可以将所有合法的bot拒之门外。困难的部分是其余部分。如果很难找到该站点的地址,则可以将其中的许多保留。
卡巴斯德(Kasperd)

5
除了已经说过的所有内容外,请注意Wordpress保留图像EXIF数据完整无缺……
user1103 2015年

3
这需要一个网站吗?如果您不希望其大量传播并被错误使用,为什么要将其发布到互联网上?您能不能在她的记忆中留下其他东西,然后再赠送给相关的父母/家人/人?
Tom.Bowen89

Answers:


20

我可能是偏执狂

也许我很偏执,但这听起来应该是一个完全私人的博客/网站。即。密码保护。谁是目标受众?

除了安全性方面(防止查找和使用不道德的内容)外,这种内容听起来还很可能被其他学校的“朋友”欺凌。一开始可能不错的内容-直到11岁-几年后可能会变得令人尴尬。

我没有将它们添加到Google控制台

这似乎是落后的吗?从Google隐藏内容(即“好”机器人)的方式是使用robotsmeta标记(或X-Robots-Tag标头),也许使用robots.txt。从Google Search Console忽略它在这方面无济于事。

至少,如果将其添加到Google Search Console,则可以监视诸如反向链接,检查robots.txt等内容。如果确实要公开的话。


1
这确实是唯一理智的解决方案。+1
MonkeyZeus 2015年

4
简要说明-不将网站添加到Google Search Console意味着不直接将网站告知Google。这意味着您不会全力以赴,让Google注意到您。但是,这并不意味着Google不会注意到您-您会使用w3d所建议的robots文件。此外,对网站进行密码保护将意味着Google最多可以索引的页面将是登录页面。
杰克2015年

11
“您从Google隐藏内容的方式”是首先不要将其放在互联网上
Lightness Races in Orbit

2
我认为保护目录的密码可以消除妈妈想要网站的原因,在这种情况下,我们只需要写一个doc新闻邮件并将其通过电子邮件发送出去即可。女儿想开博客。妈妈们并不傻,她正在筛选和编辑内容。我不相信他们在这里做任何不负责任的事情。对于这个问题,这是极好的反馈。
rhill45

在WP中保护网站的密码与保护媒体无关。
Blankip

6

唯一合适的答案是用密码保护整个事情。HTTP BASIC_AUTH可能是最简单的设置,因为它不会以任何方式与WordPress交互。它本身足以阻止所有刮板,但是如果您想要适当的安全性,则还应该使用HTTPS。

(旁注:在许多系统上,HTTP页面将重定向到HTTPS。但是,在使用HTTP BASIC_AUTH的情况下,该重定向可以提示输入密码之后进行。然后,HTTPS页面将再次提示输入密码。这意味着您已经输入了密码两次,一次是明文一次,一次是在安全通道上一次,原则上可以为HTTP和HTTPS版本使用不同的密码,或者对于HTTP版本使用没有密码:所有操作都重定向到HTTPS版本,然后询问您的密码。设置的难易程度取决于您使用哪些工具来管理网站托管首选项。或者,只需确保始终直接导航即可转到HTTPS页面,绕过不安全的版本。如果您使用的不是HTTP BASIC_AUTH密码系统,那么本旁注可能都不适用。)


4
如果您想使用受密码保护的路线,因为这是一个WordPress网站,只需使用WordPress来处理所有问题,这是简单得多的方法:codex.wordpress.org/Content_Visibility#Private_Content
Doyle Lewis,

1
@DoyleLewis。这样可以保护静态资产,例如上传的图片吗?诚然,爬虫不太可能找到它们(只要您拥有Options -Indexes)。
TRiG 2015年

我考虑过https,但唯一的问题就是成本。我希望我能找到一种方法,在我公司的SSL但当然不可能跑她的网站
rhill45

2
letsencrypt.org @ rhill45。
TRiG 2015年

1
@TRiG如果某人具有指向静态媒体文件的URL,则不会,它不会对此进行保护。但是,任何爬虫都无法使用它,因为它们将无法获取链接到文件的内容。
Doyle Lewis

3

首先,我将向所有专业网站管理员致以诚挚的歉意,但是对于此OP,我有一个金色的建议:

违反搜索引擎准则

我的意思是要做到这一点,重要的内容是使用复杂的javascript,而机器人可以抓取的内容却不是使用正确的HTML。这包括不正确的描述标签,不正确的标题标签等。哎呀,可能将整个内容变成仅用Flash制作的视频,或者将整个内容仅显示为一张图像。那确实会使搜索引擎爬虫畏缩。

我将通过示例显示代码:

这是获取索引内容的一种方法:

<!DOCTYPE html>
<html>
<head>
<title>Web page</title>
<meta name="description" content="This is a wonderful web page">
</head>
<body>
<h1>A wonderful web page</h1>
<h2>By John Smith</h2>
<p>This is a wonderful page. ya de ya de ya de ya de ya de ya de</p>
<p>This is wonderful. ya de ya de ya de ya de ya de ya de</p>
</body>
</html>

好的,我承认,文字并不完美,但您理解我的意思。

现在,如果您想对爬虫隐藏它并以简单的方式进行操作,则可以尝试以下操作:

<!DOCTYPE html>
<html>
<head>
<title>Private</title>
</head>
<body>
<img src="mywebsite.jpg" width=1024 height=768>
</body>
</html>

然后制作一个名为mywebsite.jpg的图像,并包含其中的所有文本,而不是上面显示的html。然后,您需要通过向未经授权的用户查看真实内容的用户制作水印版本来保护mywebsite.jpg。只需将用户代理字符串或IP地址与您允许/禁止使用的图像进行比较。可以使用一些重写规则在.htaccess中完成此类操作。

例如,要强制googlebot查看带有水印的图像而不是真实图像,请使用以下规则:

RewriteCond %{HTTP_USER_AGENT} ^googlebot$ [NC]
RewriteRule ^mywebsite.jpg$ specialrobotimage.jpg [L]

我在这里假设mywebsite.jpg是作为图像的您的真实网站,而specialrobotimage.jpg是作为水印或作为消息的图像,说明仅允许真实用户查看此信息。此外,规则假定所有内容都在同一文件夹中。


确实,JS可能是其中很多方法。虽然某些机器人确实运行JS,但刮板和其他通常不运行的刮板。这意味着当JS运行时,可以将各种HTML DOM对象设置为真实内容。我不建议依赖用户代理,因为这通常是由刮板伪造的。考虑安装ModSecurity,然后让它为您完成大部分工作。
closetnoc

11
这确实是一个糟糕的建议。这是很多工作,没有真正的好处。如今,大量的机器人都在运行JavaScript。视频或图像中的内容不容易维护(而且两者仍要定期索引)。甚至Flash中的内容也已被索引多年。
Brad 2015年

好的,我确实忘记提到应该对图像和视频应用无索引。我知道它们不容易维护,但至少不能轻易修改文本。另一方面,如果页面上仅包含原始文本,则爬虫可以获取该文本块,对其进行修改,向其中添加模板,然后从中构建另一个网站。我怀疑搜寻器是否具有从图像或视频中提取文本的功能。
迈克

3

首先,这确实是一个WP问题。我已经写了20多个网站来满足您的需求,所以这很容易。

1您让所有人登录以查看每个页面。

2通过脚本和.htaccess锁定上载文件夹。有些脚本将在允许用户查看媒体之前检查用户登录。

如果您想在这与开放您的网站之间做任何事情-这是很多工作。最简单的方法是有两个上载文件夹-一个具有安全性的文件夹,一个用于其他所有文件的文件夹,如果您想让某些页面向公众开放而另一些则不开放。

至于其他人对内容的评论-如果您的页面被锁定,则无法找到它……这不是真的。我有机器人脚本,它将在文件夹中搜索废话以获取文件名。

所有的Google和机器人对话都是胡说八道。这些东西只有在您想半点刺的时候才重要。如果您愿意,请从上面提出的一些问题中寻求建议。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.