程序设计 regex

25

我想查找具有该顺序的“ abc”和“ efg”的文件，并且这两个字符串在该文件的不同行上。例如：一个包含以下内容的文件： blah blah.. blah blah.. blah abc blah blah blah.. blah blah.. blah blah.. blah efg blah blah blah blah.. blah blah.. 应该匹配。

208 regex grep

18

使用正则表达式解析HTML：为什么不呢？

似乎在stackoverflow上，每个问询者都在使用正则表达式从HTML中获取某些信息，每个问题不可避免地会有一个“答案”，说不使用正则表达式来解析HTML。为什么不？我知道那里有没有引号的“真实” HTML解析器，例如Beautiful Soup，而且我敢肯定它们功能强大且有用，但是如果您只是在做简单，快速或肮脏的事情，那为什么呢？当使用一些正则表达式语句就可以了吗？此外，对于正则表达式，我是否不了解某些基本知识，因而使它们成为一般解析的错误选择？

207 regex html-parsing

21

您如何实现良好的亵渎过滤器？

我们中的许多人需要处理用户输入，搜索查询以及输入文本可能包含亵渎或不受欢迎语言的情况。通常，这需要过滤掉。在哪里可以找到各种语言和方言的咒骂单词的好清单？是否有API可供包含良好列表的来源使用？还是仅使用某些参数简单地说“是的干净”或“没有这个脏”的API？有什么好的方法可以捕获试图欺骗系统的人员，例如a $$，azz或a55？如果您提供PHP解决方案，则可以加分。:) 编辑：回答说只是避免程序性问题的答案：我认为，例如当用户可以使用公共图像搜索来查找添加到敏感社区池中的图片时，就可以使用这种过滤器。如果他们可以搜索“阴茎”，那么他们可能会得到很多照片。如果我们不想要这样的图片，那么将单词作为搜索词是一个很好的看门人，尽管公认这不是万无一失的方法。首先获取单词列表是真正的问题。因此，我实际上指的是一种找出单个令牌是否脏的方法，然后直接禁止它。我不会像完全热闹的“长颈长颈鹿”参考文献那样阻止这种情绪。您无能为力。:)

207 php regex user-input

9

Javascript Regex：如何将变量放入正则表达式中？

因此，例如： function(input){ var testVar = input; string = ... string.replace(/ReGeX + testVar + ReGeX/, "replacement") } 但这当然是行不通的:)有什么办法可以做到这一点？

206 javascript regex variables

5

检查字符串是否与Bash脚本中的正则表达式匹配

我的脚本收到的参数之一是以下格式的日期：yyyymmdd。我想检查输入的日期是否有效。我怎样才能做到这一点？我正在尝试使用如下正则表达式：[0-9]\{\8}

204 regex bash shell scripting

6

VSCode正则表达式查找和替换子匹配数学？

%s@{fileID: $213[0-9]*$@\='{fileID: '.(submatch(1)-1900)@ 我在vim中使用此正则表达式搜索和替换命令从每个匹配的id中减去一个常数。我可以在VSCode中找到正则表达式，但是如何submatch为数学引用＆替换呢？submatch(1)在VSCode中不起作用？谢谢。

204 regex visual-studio-code

13

将String.split（）与多个定界符一起使用

我需要基于定界符-和分割字符串.。以下是我想要的输出。 AA.BB-CC-DD.zip -> AA BB CC DD zip 但我的以下代码不起作用。 private void getId(String pdfName){ String[]tokens = pdfName.split("-\\."); }

201 java regex

20

最终的邮政编码和正则表达式是什么？

我正在寻找最终的邮政编码和正则表达式。我正在寻找可以覆盖世界大部分（希望是整个）的东西。

200 regex zipcode postal-code

7

正则表达式测试字符串是否以http：//或https：//开头

我试图设置一个正则表达式，它将检查字符串的开头，以及是否包含其中一个http://或https://应与之匹配。我怎样才能做到这一点？我正在尝试以下不起作用的方法： ^[(http)(https)]://

200 regex

13

用空字符串替换所有非字母数字字符

我尝试使用此工具，但没有成功- return value.replaceAll("/[^A-Za-z0-9 ]/", "");

197 java regex non-alphanumeric

7

使用split（“ |”）通过管道符号分割Java字符串

Java官方文档指出： "boo:and:foo"例如，字符串使用这些表达式Regex Result产生以下结果： { "boo", "and", "foo" }" 这就是我需要它工作的方式。但是，如果我运行此命令： public static void main(String[] args){ String test = "A|B|C||D"; String[] result = test.split("|"); for(String s : result){ System.out.println(">"+s+"<"); } } 它打印： >< >A< >|< >B< >|< >C< >|< >|< >D< 这与我的预期相去甚远： >A< >B< >C< >< >D< 为什么会这样呢？

195 java regex string

1

不以序列开头的字符串的正则表达式

我正在使用此程序处理一堆表，但是我需要忽略那些以标签“ tbd_”开头的表。到目前为止，我有类似[^ tbd_]的东西，但是根本不匹配那些字符。

195 regex

4

Ruby正则表达式中\ A \ z和^ $之间的区别

在文档中，我读到：使用\ A和\ z匹配字符串的开头和结尾，^和$匹配行的开头/结尾。我将使用正则表达式来检查用户提交的用户名（或电子邮件是否相同）。我应该validates_format_of在模型中使用哪个表达式？我不明白其中的区别：我一直使用^和$ ...

195 ruby regex

5

如何仅替换捕获的组？

我在字符串前后有HTML代码： name="some_text_0_some_text" 我想将替换为0：!NEW_ID! 所以我做了一个简单的正则表达式： .*name="\w+(\d+)\w+".* 但是我看不到如何专门替换捕获的块。有没有办法用其他字符串替换捕获的结果（$ 1）？结果将是： name="some_text_!NEW_ID!_some_text"

194 javascript regex

15

使用javascript获取两个字符之间的子字符串

我试图从一个较大的字符串中提取一个字符串，使它在'：'和';'之间得到一切。当前 Str = 'MyLongString:StringIWant;' 期望的输出 newStr = 'StringIWant'

194 javascript regex string substring

Questions tagged «regex»