湖南万树it学院官网
Java正则表达式
更新时间:2017-10-25 16:31   来源:未知   浏览次数:  
  • 分享到:

 

 

 

定义

首先,正则表达式是一种强大而灵活的文本处理工具,使得我们能够以编程的方式,构造复杂的文本模式,对输入的字符串进行搜索,一旦找到了匹配这些模式的分,你就能够随心所欲地对它们进行处理。因此,正则表达式提供的是一种完全通用的方式,能够解决各种字符串处理相关问题:匹配、选择、编辑以及验证。

 

注:正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。

 


语法

 

在其他语言中, 表示:我想要在正则表达式中插入一个普通的(字面上的)反斜杠,请不要给它任何特殊的意义。

 

在 Java 中, 表示:我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义。

 

所以,在其他的语言中,一个反斜杠就足以具有转义的作用,而在正则表达式中则需要有两个反斜杠才能被解析为其他语言中的转义作用。也可以简单的理解在正则表达式中,两个 代表其他语言中的一个 ,这也就是为什么表示一位数字的正则表达式是 d,而表示一个普通的反斜杠是 \。

 

 

普通字符

包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。

 

 

非打印字符

 

 

特殊字符

 

 

 

 

限定符

 

 

 

边界符

 

这些字符构成了我们书写正则表达式的要素.比如写一个匹配六位数字的表达式为d{6},可以根据自己的需求查阅表格,书写自己的正则表达式.

 

 

 

String中的正则表达式

 

应用正则表达式最简单的途径,就是使用String类的内建功能.

 

 

 

 

matches()

 

检查一个String是否匹配所给的正则表达式.

 

 

 

split()

 

split()方法的功能是"将字符串从正则表达式匹配的地方切开", 组装到一个数组中去.

第一个用的普通字符作为正则表达式,即使用空字符来划分,第二个和第三个都用到了'//W' ,意思是非单词字符(可以去上面找一下该字符的说明),它将标点删掉了通过例子二可以看出来.第三个表示"字母e后面跟着一个或多个非单词字符".可以看到,在原始字符串中,与正则表达式匹配的部分,在输出的结果中都不存在了.

 

String.split()还有一个重载版本,它允许你限制字符串分割次数.

 

 

 

replaceXXX()

 

String类自带的最后一个正则表达式工具是"替换",可以只替换正则表达式第一个匹配的子串,或是替换所有匹配的地方.

第一个表达式要匹配的是以字母o开头,后面跟一个或多个字母(这里是小写的w),并且只替换掉第一个匹配的部分,"oh"被换成了"gogogo".

 

第二个是匹配两个单词中的任意一个,竖线表示或,并且替换所有匹配部分.

 

 

 

创建正则表达式

 

一般来说,比起功能有限的String类,我们更愿意构造功能强大的正则表达式.因此我们需要用到java.util.regex 包中的三个类:

 

Pattern 类:

 

pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。

 

Matcher 类:

 

Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。

 

PatternSyntaxException:

 

PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。

  • 分享到:

联系我们

万树IT软件学院地图导航

如有问题,可在线提交表单

  • 提交后,我们的老师会及时为您回复

© 2017 www.wanshuit.com 湖南万树信息技术有限公司 版权所有 丨 备案号:湘ICP备16021152号

友情链接:湖南万树IT学院 sem软件 模特培训 重庆网站优化 万树XML地图 顺德网络公司 遴选 东莞seo 成都小程序 天津化妆培训 杭州翻译公司