Questions tagged «search»

有关搜索算法机制和实现的问题。*不是*有关在API中使用搜索工具(例如Google,Bing,Facebook)的问题。


13
如何在Vim中进行不区分大小写的搜索
我想搜索一个大写单词,例如文件中的COPYRIGHT。我尝试执行类似的搜索: /copyright/i # Doesn't work 但这不起作用。我知道在Perl中,如果我将i标志放入正则表达式中,它将把正则表达式变成不区分大小写的正则表达式。Vim似乎有其自己的方式来表示不区分大小写的正则表达式。

11
grep,但仅某些文件扩展名
我正在为grep某些目录编写一些脚本,但是这些目录包含各种文件类型。 我想grep只是.h和.cpp现在,但也许其他几个人的未来。 到目前为止,我有: { grep -r -i CP_Image ~/path1/; grep -r -i CP_Image ~/path2/; grep -r -i CP_Image ~/path3/; grep -r -i CP_Image ~/path4/; grep -r -i CP_Image ~/path5/;} | mailx -s GREP email@domain.com 谁能告诉我我现在如何只添加特定的文件扩展名?

22
使用grep --exclude /-include语法不对某些文件进行grep
我正在寻找foo=目录树中文本文件中的字符串。在普通的Linux机器上,我有bash shell: grep -ircl "foo=" * 目录中还包含许多匹配“ foo =“的二进制文件。由于这些结果无关紧要,并且拖慢了搜索速度,因此我希望grep跳过对这些文件(主要是JPEG和PNG图像)的搜索。我该怎么做? 我知道有--exclude=PATTERN和--include=PATTERN选项,但是模式格式是什么?grep的手册页显示: --include=PATTERN Recurse in directories only searching file matching PATTERN. --exclude=PATTERN Recurse in directories skip file matching PATTERN. 搜索grep包含,grep包含排除,grep排除和变体未找到任何相关内容 如果只在某些文件中有一种更好的grepping方式,我全力以赴。移动有问题的文件不是一种选择。我无法仅搜索某些目录(目录结构混乱不堪,到处都是东西)。另外,我什么也无法安装,因此必须使用通用工具(例如grep或建议的find)。

12
Solr对比ElasticSearch [关闭]
已关闭。这个问题是基于观点的。它当前不接受答案。 想改善这个问题吗?更新问题,以便通过编辑此帖子以事实和引用的形式回答。 去年关闭。 这些技术之间的核心架构差异是什么? 另外,哪种用例通常更适合每种用例?

30
生成一个整数,该整数不在给定的40亿个整数中
我得到了这个面试问题: 给定一个具有40亿个整数的输入文件,请提供一种算法来生成文件中不包含的整数。假设您有1 GB的内存。如果只有10 MB的内存,请执行后续操作。 我的分析: 文件大小为4×10 9 ×4字节= 16 GB。 我们可以进行外部排序,从而让我们知道整数的范围。 我的问题是在已排序的大整数集中检测丢失的整数的最佳方法是什么? 我的理解(阅读所有答案之后): 假设我们正在谈论32位整数,那么有2 32 = 4 * 10 9个不同的整数。 情况1:我们有1 GB = 1 * 10 9 * 8位= 80亿位内存。 解: 如果我们用一位代表一个不同的整数,那就足够了。我们不需要排序。 实现方式: int radix = 8; byte[] bitfield = new byte[0xffffffff/radix]; void F() throws FileNotFoundException{ Scanner in = new …

12
如何在Django视图中合并两个或多个查询集?
我正在尝试为正在构建的Django网站建立搜索,在该搜索中,我正在3种不同的模型中进行搜索。为了在搜索结果列表上进行分页,我想使用一个通用的object_list视图来显示结果。但是要做到这一点,我必须将3个查询集合并为一个。 我怎样才能做到这一点?我已经试过了: result_list = [] page_list = Page.objects.filter( Q(title__icontains=cleaned_search_term) | Q(body__icontains=cleaned_search_term)) article_list = Article.objects.filter( Q(title__icontains=cleaned_search_term) | Q(body__icontains=cleaned_search_term) | Q(tags__icontains=cleaned_search_term)) post_list = Post.objects.filter( Q(title__icontains=cleaned_search_term) | Q(body__icontains=cleaned_search_term) | Q(tags__icontains=cleaned_search_term)) for x in page_list: result_list.append(x) for x in article_list: result_list.append(x) for x in post_list: result_list.append(x) return object_list( request, queryset=result_list, template_object_name='result', paginate_by=10, extra_context={ 'search_term': …

8
如何grep Git提交特定单词的差异或内容?
在Git代码存储库中,我想列出所有包含特定单词的提交。我试过了 git log -p | grep --context=4 "word" 但这并不一定会返回文件名(除非它与我搜索的单词相距少于5行。我也尝试过 git grep "word" 但是它只给我当前文件而不是历史记录。 如何搜索整个历史记录,以便可以跟踪特定单词的变化?我打算在我的代码库中搜索单词的出现以跟踪更改(在文件历史记录中搜索)。
622 git  search  grep 


8
re.search和re.match有什么区别?
search()和Python 模块中的match()函数和有什么区别?re 我已经阅读了文档(当前文档),但是我似乎从未记得它。我一直在查找并重新学习它。我希望有人会用示例清楚地回答它,以便(也许)它会贴在我的头上。或者至少我将有一个更好的地方来回答我的问题,并且重新学习它所花的时间会更少。
526 python  regex  search  match 



7
如何设计RESTful搜索/过滤?[关闭]
已关闭。这个问题是基于观点的。它当前不接受答案。 想改善这个问题吗?更新问题,以便通过编辑此帖子以事实和引用的形式回答。 2年前关闭。 我目前正在用PHP设计和实现RESTful API。但是,我一直无法实现我的初始设计。 GET /users # list of users GET /user/1 # get user with id 1 POST /user # create new user PUT /user/1 # modify user with id 1 DELETE /user/1 # delete user with id 1 到目前为止,还算标准,对吗? 我的问题是第一个GET /users。我正在考虑在请求正文中发送参数以过滤列表。这是因为我希望能够指定复杂的过滤器而无需获取超长网址,例如: GET /users?parameter1=value1&parameter2=value2&parameter3=value3&parameter4=value4 相反,我想拥有类似的东西: GET /users # …
456 api  search  rest  filter 

20
字典搜索的Python列表
假设我有这个: [ {"name": "Tom", "age": 10}, {"name": "Mark", "age": 5}, {"name": "Pam", "age": 7} ] 并通过搜索“ Pam”作为名称,我想检索相关的字典: {name: "Pam", age: 7} 如何实现呢?

7
如何找到在任何分支中引入了字符串的Git提交?
我希望能够找到在任何分支的任何提交中引入的某个字符串,我该怎么做?我找到了一些东西(我为Win32修改了),但git whatchanged似乎并没有考虑其他分支(忽略py3k块,这只是一个msys / win换行修复) git whatchanged -- <file> | \ grep "^commit " | \ python -c "exec(\"import sys,msvcrt,os\nmsvcrt.setmode(sys.stdout.fileno(), os.O_BINARY)\nfor l in sys.stdin: print(l.split()[1])\")" | \ xargs -i% git show origin % -- <file> 解决方案是否缓慢并不重要。
396 git  search 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.