From b2805148b64fe72b93fdc815468f79209f35917d Mon Sep 17 00:00:00 2001 From: asahi Date: Sun, 10 Mar 2024 22:54:03 +0800 Subject: [PATCH] =?UTF-8?q?=E9=98=85=E8=AF=BBregex=E7=9B=B8=E5=85=B3?= =?UTF-8?q?=E6=96=87=E6=A1=A3?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- regular expression/正则进阶语法.md | 92 ++++++++++++++++++++++++ 1 file changed, 92 insertions(+) create mode 100644 regular expression/正则进阶语法.md diff --git a/regular expression/正则进阶语法.md b/regular expression/正则进阶语法.md new file mode 100644 index 0000000..ef611fe --- /dev/null +++ b/regular expression/正则进阶语法.md @@ -0,0 +1,92 @@ +# 正则表达式 +## 语法 +### No Capturing Group `(?:regex)` +如果不想要正则表达式中的group捕获其匹配,可以通过在group的左`(`符号后指定`?:`,其会将group设置为非捕获匹配。 +```bash +# 使用示例如下 +color=(?:red|green|blue) +``` + +### Named Caputure Group `(?regex)` +在java中,支持named group机制,从而可使用name来获取识捕获的匹配。其可以避免在复杂表达式中通过下表进行匹配时带来的复杂解析问题。 + +使用语法为`(?regex)`,使用示例如下所示: +```bash +[Ww]indows(?95|98|7|8|10|11) +``` +```java +public static void testRegex() { + Pattern pattern = Pattern.compile("[Ww]indows(?95|98|7|8|10|11)"); + Matcher matcher = pattern.matcher("I use windows11 Operating System..."); + if(matcher.find()) { + String versionTag = matcher.group("versionTag"); + System.out.printf("windows version used is %s%n", versionTag); + } else { + System.out.println("I don't use Windows System"); + } +} +``` + +### Atomic Grouping `(?>regex)` +在正则表达式中,支持通过`(?>regex)`的语法来指atomic grouping。当指定匹配为atomic grouping后,例如`a(?>bc|b)c`,其会匹配abcc,但是不会匹配abc。 + +因为当一个group被指定atomic grouping后,一旦该group成功匹配过一次,那么其会丢弃group中token记录的backtracking position,不会再尝试group中指定的其他匹配。例如在匹配abc时,`(?>bc|b)`表达式和`bc`匹配成功后,atomic grouping即会丢弃回溯位置,后续regex的末尾`c`字符无法匹配,即会导致整个匹配失败,而不会回溯后重新匹配`(?>bc|b)`中的`b`。 + +使用示例如下所示: +```bash +# 其会匹配abcc,但是不会匹配abc + a(?>bc|b)c + ``` + +### Negative Lookahead `(?!regex)` +通过negative Lookahead语法,可以指定`后面不被...跟随`的正则表达式。例如,`q(?!u)`,其会匹配`aqe`字符串中的`q`。 + +注意,`q[^u]`是无法表示和`q(?!u)`一样的效果的,因为`q(?!u)`匹配的是`aqe`字符串中的`q`,而`q[^u]`匹配的则是`aqe`字符串中的`qe`。 + +并且,**Negative Lookahead是No Caputure Group**。 + +使用示例如下所示: +```bash +# 其会匹配aqe字符串中的q +q(?!u) +``` + +### Positive Lookahead `(?=regex)` +通过positive lookahead的语法,则是可以指定`后面被...跟随`的正则表达式,例如`q(?=u)`。但是,`u并不会成为该regex匹配的一部分。` + +并且,**Negative Lookahead是No Caputure Group**。 + +使用示例如下所示: +```bash +# 匹配后缀有u的q,例如aqua中的q +q(?=u) +``` + +> 如果想要捕获Lookahead中的匹配内容,可以使用`(?=(regex))`的语法。 + +### Negative Lookbehind `(?