Answers:
传统的Google搜索不提供此功能,Google的路线图也没有此功能。您可以观看Google视频,以了解有关此主题的更多信息。Google是否会实现使用正则表达式进行搜索的功能?
但是,有一个例外。Google代码搜索支持正则表达式。当然,该主题搜索引擎的搜索目标被简化为仅源代码。
值得一提的是,某些Google搜索关键字可以部分替换正则表达式。例如,如果要搜索“搜索术语”的任何两个单词的变体,则可以使用通配符运算符。
search *
将找到搜索结果和任何其他(一个)单词。我经常用它来检查基本的英语语法规则或同义词(例如,“ *一样简单”)。
Google搜索可以返回一些简单正则表达式的匹配项。例如,搜索查询
"(gray|red) (wolf|fox)"
似乎等同于
("gray wolf" OR "red fox" OR "red wolf" OR "gray fox")
您可以在此处查看此搜索查询的输出。
SymbolHound具有开源代码存储库搜索功能,类似于现已停产的Google Code Search选项,此外,它还包含一个包含符号的Web搜索,该索引对与编程相关的站点(例如Stackoverflow)进行了索引。
您可以编写一个软件来:
让我们研究一个案例:从site:gog.com
找到所有具有西班牙配音的游戏中。
正则表达式为:
Audio[^:]*:[^.,]*Spanish
它应匹配,例如:
Audio lanuage: English, German, Spanish, French.
不匹配:
Audio language: only-English. Text language: Spanish.
步骤1.让您的软件在Google上进行搜索:
site:gog.com audio Spanish inurl:game
inurl:game
这意味着仅在游戏描述页面中搜索
第2步。获取300个结果链接,然后爬入每个链接。
步骤3.使用给定的正则表达式过滤结果:
Audio[^:]*:[^.,]*Spanish
这应该很容易构建。实际上,我不明白为什么我找不到那种已经建立好的东西。
由于搜索引擎无法负担使用正则表达式扫描数据的资源,因此这项繁琐的工作全由您自己承担,您的计算机应使用搜索引擎已提供的功能来完成此任务。
仅供参考,此处是Google对搜索运算符的帮助。
有趣的是,“-”仍然是单词排除的运算符,但他们删除了“ +”作为运算符,过去使用它来要求给定搜索词。显然,“ +运算符在启动Google+时已停用,因为需要+作为可搜索字符而不是运算符。”(https://support.google.com/websearch/answer/2466433)
您可以从详细的Google搜索开始,以剔除要搜索的目标文本。然后打开多个标签中的前50个结果,然后使用mingyi的“最快搜索” Firefox插件使用正则表达式搜索结果。
Google现在支持并完整记录RegEx的使用。这是参考链接:
http://www.google.com/support/enterprise/static/postini/docs/admin/zh-CN/admin_ee_cu/cm_regex.html
如果您了解VBA,则可以编写一些代码以将数据从Web上获取到Excel。我日夜运行该程序,可以得到数百万个结果。之后,您可以从这些结果中进行过滤。