在您的网站上使用Google搜索是个坏主意吗?


11

如果您有一个包含大量记录的Web应用程序,那么在您的网站上使用Google搜索是个坏主意吗?您无需编写搜索功能并处理性能问题,而是将搜索功能“外包”给Google。


1
这使我感到好奇,您能否提供更多有关该问题的细节?因为您认为这可能不是一个好主意?您有更多的文档将使您认为这是一个坏主意吗?您读到的东西让您认为自己得到了吗?
RTOSkit 2013年

@RTOSkit,您好,我已经开发了一些小型Web应用程序,搜索功能仍然是最大的挑战之一。我必须考虑搜索结果的准确性以及服务器性能。我个人认为这不是一个坏主意,但是有些“尴尬”,因为它是应用程序中唯一不是由您开发的部分。
John Doe 2013年

好的,我知道了,@ JCL1178 为您提供了最佳答案。
RTOSkit 2013年

Answers:


3

正如他们在答案中提到的JCL1178一样,Google只会返回其索引内容的结果。这不仅意味着您的某些结果可能永远不会出现,而且如果您的网站由于某种原因而被取消索引,那么您从网站上的搜索就会丢失。与搜索一样重要的事情依赖于不受支持的第三方服务是很危险的。

由于您可以直接访问数据,因此可以提供比Google或任何其他搜索引擎更好,更细粒度的搜索。您可以允许您的用户搜索特定字段,从不相关的字段中过滤掉所有其他匹配。Google与其搜索的值没有任何关联,因此搜索“史密斯”家族可以为居住在“史密斯街”上的人们带来任何结果。或从事“铁匠”职业的人。

大多数流行的关系数据库都具有进行全文本搜索的能力,因此添加基本的搜索功能可以像编写一些SQL语句一样简单。

我使用Google自定义搜索引擎在我的网站上进行常规搜索,但是除非我的全文搜索能力受到限制(软件限制,由于硬件/数据集的大小)。它的确取决于您的数据有多复杂,以及搜索在导航数据中的重要性……但是提供自己的搜索功能对我来说似乎是最安全的选择。


所有非常好的观点,我完全回避了在索引中取消索引的可能性。
JCL1178 2013年

嗨,@ Jacob Hume。关于依靠第三方服务的重点。这也是我的想法。我已经尝试了全文搜索以及各种搜索引擎,但是正如我在评论中提到的那样,我总是遇到结果准确性和/或服务器性能方面的问题。再次感谢您的投入。
约翰·多伊

3
因此,您建议该网站具有幼稚的全文本搜索实现,而不是有0.00001%的搜索机会下降(机会是,除非您确实做得很蠢,否则Google不会对您的网站进行索引编制) 100%的时间?IMO不是一个很好的折衷方案。全文搜索是快速访问基本搜索功能的一项非常有用的功能,但是构建有用的搜索功能(比起Google的用户友好性要少得多)比“编写一些SQL语句”要复杂得多。
冒犯君主

2
诸如Google,Solr,Lucene,Sphinx等真正的搜索引擎能够执行诸如权衡关键字接近度,子字符串搜索,levenshtein距离/元音/词干/模糊文本搜索等功能,从而大大提高了可用性。全文搜索是一个很好的起点,但实际上,要构建可以持续返回相关结果的体面搜索功能,还需要做大量工作。大多数不是搜索引擎开发专家的开发人员最好使用第三方服务或至少使用经过验证的现成解决方案,如Lucene或Solr。
冒犯君主

2
甚至像Oracle这样的大公司也难以在内部创建有用的站点范围内的搜索(比较Oracle收购前后MySQL.com的文档搜索)。此外,您对Google搜索引擎的描述比Google搜索引擎更适合于本地的全文搜索,而Google搜索引擎实际上使用的是业界最先进的启发式算法和用户意图预测算法。
冒犯君主

7

就此答案而言,我假设您是在谈论Google自定义搜索/站点搜索,而不是Google Search Appliance ,这虽然是一个昂贵的主意,但却是一个非常好的主意。

将搜索外包到Google自定义搜索不是一个坏主意,但是由于Google的限制和规则,它可能不是最适合您的网站/业务模式/的选择。

自定义搜索与键入search terms site: yoursite.comGoogle 基本上是相同的事情,只是您不必指定site: yoursite.com部分,并且可以在网站上嵌入搜索表单。网站搜索是自定义搜索的非免费版本,具有更多自定义选项和对API的某些访问权限。链接文档中说明了“自定义/站点搜索”与“使用Google正确”之间的其他差异,但是要注意的重要一点是,它们仅适用于Google可以看到的内容。

因此,Web应用程序中的“大量记录”必须完全能够被Google抓取,以便“自定义搜索”真正返回准确的结果。如果出于任何原因限制/保护记录不公开,则要么必须向Google显示已注销用户看到的相同有限结果,要么可以让Google将全部内容编入索引,但是您必须遵守“ 首次点击免费”规则否则可能会被生气的熊猫吃掉。如果您向Google展示一件事,向访问者展示另一件事,那就是“伪装”,您的网站将因此受到罚款。如果由于某种原因您想要包含在搜索结果中的所有记录都无法被搜寻,那么对于您的特定型号,使用Google自定义搜索或网站搜索不是一个好主意。

但是,如果您可以将所有内容编入索引,那么您就不必介意Google如何返回自定义搜索的搜索结果(或者不愿意为修复该问题而为网站搜索付费),并且愿意冒着无法为关键页面建立索引的风险无论出于何种原因,您都可以并且应该认真考虑它。


1

如果您希望其他人也可以看到您网站的所有数据,建议您使用Google搜索。它将节省额外的编码。

如果它是封闭系统,并且您不希望其他人看到数据,请使用自己的搜索系统。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.