正则表达式-分组括号以及捕获分组

本文介绍: 在java正则表达式中，（）是分组的意思，每组都有一个组号。

分组：

在java正则表达式中，（）是分组的意思，每组都有一个组号

只看左括号，不看右括号，按照左括号的顺序，从左往右，依次为第一组，第二组，第三组等等，如图：

根据左括号分成了三组

捕获分组，非捕获分组

可以获取某一组中的内容反复使用

规则：

正则表达式内部使用：\ 组号

外：$ 组号

需求1:判断一个字符串的开始字符和结束字符是否一致?只考虑一个字符

String regex1="(.).+\1";
System.out.println("_123_".matches(regex1));//true
System.out.println("_123_1".matches(regex1));//false

(.)表示第一个分组

需求2:判断一个字符串的开始部分和结束部分是否一致?可以有多个字符

String regex2="(.+).+\1";

System.out.println("ab_123ab_".matches(regex2));//true
System.out.println("asb_123ab_".matches(regex2));//false

需求3:判断一个字符串的开始部分和结束部分是否一致?开始部分内部每个字符也需要一致

String regex3="(.)\1*.+\1";
System.out.println("aaa123aaa".matches(regex3));//true
System.out.println("aaa123aab".matches(regex3));//false

(.)：匹配任意一个字符，并将其捕获为第一组（1就是引用这个被捕获的字符）。

\1*：表示匹配前面捕获的第一组（即与第一个字符相同的字符）零个或多个。

.+：匹配一个或多个任意字符（除换行符外）。

\1：再次引用第一组捕获的字符，要求以与开头相同的字符结尾。

任务：把重复的内容替换为单个的

String str = "今天有亿亿亿亿亿点点点懒懒懒";

String regex="(.)\1+";

String s = str.replaceAll(regex, "$1");
System.out.println(s);//今天有亿点懒

(.)表示把重复内容的第一个字符看做一组

\1+表示第一组字符至少再出现一次

$1 表示把正则表达式中第一组的内容，再拿出来用

分组之后不需要再用本组数据，仅仅是把数据括起来。不占组号

如：（在“带条件爬取”中已经见过）

原文地址:https://blog.csdn.net/2301_79947226/article/details/135721457

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。