Base64编码的图像及其元数据对于Googlebot的可用性


9

如果我嵌入图像到页面作为img- src使用Base64数据URI,是图像的元数据(EXIF,IPTC,XMP)仍然可用于谷歌的imagebot?


1
可能不是。Googlebot可能需要一个可以对用户进行排名和引用的URL。
约翰·孔德

1
忘记EXIF数据,我什至不知道Google图片甚至会索引没有自己URL的图片。
斯蒂芬·奥斯特米勒

@StephenOstermiller:问题是:如果它索引了此类图像,那么它也会读取EXIF
Evgeniy 2014年

@Evgeniy斯蒂芬指出的那样,数据的URI不会从他们的包含文档分开(参见更多)。搜索引擎索引中的网址,因此,只有在包含文档会被索引,以及他们是否会在元数据包含索引数据的URI(如果它确实包含太,使其更大)是个哑巴点。为了进行确认,您可以使用源代码搜索引擎来查找数据URI,然后查看该图像是否已被索引并包含在Google中的EXIF信息。不过,这似乎极不可能。
dan

@Evgeniy请注意,不允许将同一问题交叉发布到多个Stack Exchange网站上。

Answers:


6

Google不会为Google图片搜索索引数据URI图片。Google的John Mueller 在这里和下面的评论中都这样说。由于数据URI图像未在Google图像搜索中建立索引,因此它们中的EXIF数据无关紧要。

您可以验证这些图像没有被索引。我在Google图片中搜索“ data uri”,并抽查了结果。我查看的所有图像都是图像文件,而不是base64编码的图像URI。您会认为,如果Google能够为数据URI图像建立索引,那么其中的一些图像就会显示在该词的搜索结果中。

如果Google确实决定为数据URI图像建立索引,则它们应该能够从中获取EXIF数据。数据uri是带有data:image/png;base64,前缀的整个base64编码文件(无空格或换行)。文件中的任何元数据仍将以base64编码的数据URI版本存在。

我在一个网站上使用数据URI图像。我这样做是因为用户通常只浏览网站上的一个页面即可获取他们所需的所有信息。在页面中内联所有CSS,JS和图像数据,可以显着提高性能。图像都很小,因此该技术效果特别好。

我的网站从Internet Explorer 7及更早版本获得了大量流量,这些流量不支持数据URI图像。因此,我必须有条件地为他们服务。我在服务器上也有图像,因此我选择基于User-Agent标头的常规图像URL或数据URI 。我将漫游器(包括Googlebot)与IE 7相同,即,将图像用作HTTP URL。我这样做是因为包含数据uri图像会大大增加页面大小。大多数机器人不需要下载图像,因此对他们来说更有效。我还注意到Google Webmaster Tools报告说,启用了数据URI图像的Googlebot抓取我的网站的速度要慢得多。从技术上讲,这可以算是伪装,但这是获取数据URI图像索引的一种方法。


2
您的第一个示例在以下URL处建立索引:photos.topicshow.com/…,而第二个示例在以下URL处建立索引:images5.fanpop.com/image/photos/30600000/… 在所有情况下,我都可以找到该图像的http URL也一样
斯蒂芬·奥斯特米勒

1
@StephenOstermiller编码的字符串可能包含空格:goo.gl/RF8r07。我将使用EXIF填充图像,对其进行编码,发布和查看,无论它是否进入索引。
Evgeniy 2014年

3
John Mueller(来自Google)在这里指出,Google通常不会索引数据URI中的图片。许多用于对它们进行编码的在线工具也将剥离元数据,因此它实际上取决于EXIF信息是否得以维护的编码方式……但是鉴于它们仍然未被索引,这是一个有争议的问题。让我们知道您的结果(请确保不要让图像的URL编制索引-Google也使用图像识别功能,以便可以从匹配的图像中使用EXIF信息)。
dan

1
@dan谢谢!您与John Muellers答案的链接现在可以立即清除很多内容!如果G不索引图像,则无法获取URI,因此无需考虑EXIF是否保留在其中。
Evgeniy 2014年

3
如上所示,我们目前不将它们分别索引为图像。将来可能会有所改变,但至少要暂时,如果要在“图像搜索”中为这些图像建立索引,则需要使用单独的图像URL。
约翰·穆勒

2

虽然Google在其自己的SERP上将图像用作base64编码的数据URI,但并未在其他网站上为此类图像编制索引。感谢@dan,他使我注意到了Google网上论坛的讨论,John Mueller在其中进行了解释。这也意味着,在此类图像中是否存在EXIF数据的问题并不重要。

这种解释清楚地表明,此性能优化技术更适合应用于哪些图像:小图像,例如图标,图标和按钮,以及那些图像,这些图像不会为网站的内容提供任何其他价值。

在另一个站点上,如果一个类别必须嵌入具有附加内容值的图像作为base64编码数据URI,则提供图像元数据的唯一最佳实践是使用Schema.org的标记,可以在其中协商EXIF数据,例如,一种标记。

像EXIF一样,另一种有前途的标记来协商看起来像“属性:值”的数据,目前具有投标状态。但是,来自Google博客的这篇文章显示了结构化的摘要,这些摘要可以由我上面链接的标记提案生成。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.