Questions tagged «regex»

正则表达式提供了一种声明性语言来匹配字符串中的模式。它们通常用于字符串验证,解析和转换。由于正则表达式尚未完全标准化,因此带有此标签的所有问题还应包括一个标签,用于指定适用的编程语言或工具。注意:询问HTML,JSON等正则表达式往往会产生负面反应。如果有解析器,请改用它。

25
如何使用grep在多行中查找模式?
我想查找具有该顺序的“ abc”和“ efg”的文件,并且这两个字符串在该文件的不同行上。例如:一个包含以下内容的文件: blah blah.. blah blah.. blah abc blah blah blah.. blah blah.. blah blah.. blah efg blah blah blah blah.. blah blah.. 应该匹配。
208 regex  grep 

18
使用正则表达式解析HTML:为什么不呢?
似乎在stackoverflow上,每个问询者都在使用正则表达式从HTML中获取某些信息,每个问题不可避免地会有一个“答案”,说不使用正则表达式来解析HTML。 为什么不?我知道那里有没有引号的“真实” HTML解析器,例如Beautiful Soup,而且我敢肯定它们功能强大且有用,但是如果您只是在做简单,快速或肮脏的事情,那为什么呢?当使用一些正则表达式语句就可以了吗? 此外,对于正则表达式,我是否不了解某些基本知识,因而使它们成为一般解析的错误选择?

21
您如何实现良好的亵渎过滤器?
我们中的许多人需要处理用户输入,搜索查询以及输入文本可能包含亵渎或不受欢迎语言的情况。通常,这需要过滤掉。 在哪里可以找到各种语言和方言的咒骂单词的好清单? 是否有API可供包含良好列表的来源使用?还是仅使用某些参数简单地说“是的干净”或“没有这个脏”的API? 有什么好的方法可以捕获试图欺骗系统的人员,例如a $$,azz或a55? 如果您提供PHP解决方案,则可以加分。:) 编辑:回答说只是避免程序性问题的答案: 我认为,例如当用户可以使用公共图像搜索来查找添加到敏感社区池中的图片时,就可以使用这种过滤器。如果他们可以搜索“阴茎”,那么他们可能会得到很多照片。如果我们不想要这样的图片,那么将单词作为搜索词是一个很好的看门人,尽管公认这不是万无一失的方法。首先获取单词列表是真正的问题。 因此,我实际上指的是一种找出单个令牌是否脏的方法,然后直接禁止它。我不会像完全热闹的“长颈长颈鹿”参考文献那样阻止这种情绪。您无能为力。:)
207 php  regex  user-input 



6
VSCode正则表达式查找和替换子匹配数学?
%s@{fileID: \(213[0-9]*\)@\='{fileID: '.(submatch(1)-1900)@ 我在vim中使用此正则表达式搜索和替换命令从每个匹配的id中减去一个常数。 我可以在VSCode中找到正则表达式,但是如何submatch为数学引用&替换呢?submatch(1)在VSCode中不起作用? 谢谢。

13
将String.split()与多个定界符一起使用
我需要基于定界符-和分割字符串.。以下是我想要的输出。 AA.BB-CC-DD.zip -> AA BB CC DD zip 但我的以下代码不起作用。 private void getId(String pdfName){ String[]tokens = pdfName.split("-\\."); }
201 java  regex 




7
使用split(“ |”)通过管道符号分割Java字符串
Java官方文档指出: "boo:and:foo"例如,字符串使用这些表达式Regex Result产生以下结果: { "boo", "and", "foo" }" 这就是我需要它工作的方式。但是,如果我运行此命令: public static void main(String[] args){ String test = "A|B|C||D"; String[] result = test.split("|"); for(String s : result){ System.out.println(">"+s+"<"); } } 它打印: >< >A< >|< >B< >|< >C< >|< >|< >D< 这与我的预期相去甚远: >A< >B< >C< >< >D< 为什么会这样呢?
195 java  regex  string 


4
Ruby正则表达式中\ A \ z和^ $之间的区别
在文档中,我读到: 使用\ A和\ z匹配字符串的开头和结尾,^和$匹配行的开头/结尾。 我将使用正则表达式来检查用户提交的用户名(或电子邮件是否相同)。我应该validates_format_of在模型中使用哪个表达式?我不明白其中的区别:我一直使用^和$ ...
195 ruby  regex 

5
如何仅替换捕获的组?
我在字符串前后有HTML代码: name="some_text_0_some_text" 我想将替换为0:!NEW_ID! 所以我做了一个简单的正则表达式: .*name="\w+(\d+)\w+".* 但是我看不到如何专门替换捕获的块。 有没有办法用其他字符串替换捕获的结果($ 1)? 结果将是: name="some_text_!NEW_ID!_some_text"
194 javascript  regex 


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.