您现在的位置是:首页 > 领风资讯 > >> 返回

[网站建设]正则表达式入门教程[學(xué)习]

在你已經(jīng)知道(dào)几个很有用的元字符了,如\b,.,*,還(hái)有\d.正则表达式裡(lǐ)還(hái)有更多的元字符,比如\s匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等\w匹配字母或数字或下划线或汉字等

下面(miàn)来看看更多的例子:

\ba\w*\b匹配以字母a開(kāi)头的单词——先是某个单词開(kāi)始处(\b),然後(hòu)是字母a,然後(hòu)是任意数量的字母或数字(\w*),最後(hòu)是单词结束处(\b)

\d+匹配1个或更多连续的数字。這(zhè)裡(lǐ)的+是和*类似的元字符,不同的是*匹配重复任意次(可能(néng)是0次),而+则匹配重复1次或更多次

\b\w{6}\b 匹配刚好(hǎo)6个字符的单词

代码說(shuō)明
.匹配除换行符以外的任意字符
\w匹配字母或数字或下划线或汉字
\s匹配任意的空白符
\d匹配数字
\b匹配单词的開(kāi)始或结束
^匹配字符串的開(kāi)始
$匹配字符串的结束

元字符^(和数字6在同一个键位上的符号)和$都(dōu)匹配一个位置,這(zhè)和\b有点类似。^匹配你要用来查找的字符串的開(kāi)头,$匹配结尾。這(zhè)兩(liǎng)个代码在验证输入的内容時(shí)非常有用,比如一个网站如果要求你填写的QQ号必须为5位到12位数字時(shí),可以使用:^\d{5,12}$

這(zhè)裡(lǐ)的{5,12}和前面(miàn)介绍過(guò)的{2}是类似的,只不過(guò){2}匹配只能(néng)不多不少重复2次{5,12}则是重复的次数不能(néng)少于5次,不能(néng)多于12次,否则都(dōu)不匹配。

因为使用了^$,所以输入的整个字符串都(dōu)要用来和\d{5,12}来匹配,也就(jiù)是說(shuō)整个输入必须是5到12个数字,因此如果输入的QQ号能(néng)匹配這(zhè)个正则表达式的话,那就(jiù)符合要求了。

和忽略大小写的选项类似,有些正则表达式处理工具還(hái)有一个处理多行的选项。如果选中了這(zhè)个选项,^$的意义就(jiù)变成(chéng)了匹配行的開(kāi)始处和结束处

字符转义

如果你想查找元字符本身的话,比如你查找.,或者*,就(jiù)出现了问题:你沒(méi)办法指定它们,因为它们會(huì)被(bèi)解释成(chéng)别的意思。這(zhè)時(shí)你就(jiù)得使用\来取消這(zhè)些字符的特殊意义。因此,你应该使用\.\*。当然,要查找\本身,你也得用\\.

例如:deerchao\.net匹配deerchao.netC:\\Windows匹配C:\Windows

重复

你已經(jīng)看過(guò)了前面(miàn)的*,+,{2},{5,12}這(zhè)几个匹配重复的方式了。下面(miàn)是正则表达式中所有的限定符(指定数量的代码,例如*,{5,12}等):

表2.常用的限定符
代码/语法說(shuō)明
*重复零次或更多次
+重复一次或更多次
?重复零次或一次
{n}重复n次
{n,}重复n次或更多次
{n,m}重复n到m次

下面(miàn)是一些使用重复的例子:

Windows\d+匹配Windows後(hòu)面(miàn)跟1个或更多数字

^\w+匹配一行的第一个单词(或整个字符串的第一个单词,具体匹配哪个意思得看选项设置)

字符类

要想查找数字,字母或数字,空白是很简单的,因为已經(jīng)有了對(duì)应這(zhè)些字符集合的元字符,但是如果你想匹配沒(méi)有预定义元字符的字符集合(比如元音字母a,e,i,o,u),应该怎麼(me)办?

很简单,你只需要在方括号裡(lǐ)列出它们就(jiù)行了,像[aeiou]就(jiù)匹配任何一个英文元音字母[.?!]匹配标点符号(.或?或!)

我们也可以轻松地指定一个字符范围,像[0-9]代表的含意与\d就(jiù)是完全一致的:一位数字;同理[a-z0-9A-Z_]也完全等同于\w(如果只考虑英文的话)。

下面(miàn)是一个更复杂的表达式:\(?0\d{2}[) -]?\d{8}

“(”和“)”也是元字符,後(hòu)面(miàn)的分组节裡(lǐ)會(huì)提到,所以在這(zhè)裡(lǐ)需要使用转义

這(zhè)个表达式可以匹配几種(zhǒng)格式的电话号码,像(010)88886666,或022-22334455,或02912345678等。我们對(duì)它進(jìn)行一些分析吧:首先是一个转义字符\(,它能(néng)出现0次或1次(?),然後(hòu)是一个0,後(hòu)面(miàn)跟著(zhe)2个数字(\d{2}),然後(hòu)是)-空格中的一个,它出现1次或不出现(?),最後(hòu)是8个数字(\d{8})。





表1.常用的元字符
代码說(shuō)明
.匹配除换行符以外的任意字符
\w匹配字母或数字或下划线或汉字
\s匹配任意的空白符
\d匹配数字
\b匹配单词的開(kāi)始或结束
^匹配字符串的開(kāi)始
$匹配字符串的结束

表1.常用的元字符
代码說(shuō)明
.匹配除换行符以外的任意字符
\w匹配字母或数字或下划线或汉字
\s匹配任意的空白符
\d匹配数字
\b匹配单词的開(kāi)始或结束
^匹配字符串的開(kāi)始
$匹配字符串的结束