正则表达式字符类加深理解:
一.基本概念:
字符类相对来说是比较简单的,但是也有可能由于理解不够深入或者大意造成一些误区,下面再来做一下介绍。
字符类[]能够匹配包含在中括号中的一系列字符中的任意一个,但是匹配的结果只能够是其中的一个而不是多个,例如:
1
2
3
|
var str= "abcd" ; var reg=/[abcd]/; console.log(str.match(reg)); |
以上正则表达式只能够匹配字符"a"。
二.使用连字符"-":
字符类可以使用连字符"-"来确定一个匹配的范围,当然使用连字符也是有原则的,前后两个字符是有顺序的,如果使用相同的编码,后面的字符码位应大于或等于前面字符的码位,例如:
[0-9]//正确的
[9-0]//错误的
三.字符类中的特殊字符是否需要转义:
大部分在正则中有特殊意义的字符在匹配其本身时需要进行转义,例如"."可以匹配任意字符,"$"用来匹配字符串的结尾,在字符类中就不需要进行转义,代码实例如下:
1
2
3
|
var str= "abc.efcd" ; var reg=/c\./g; console.log(str.match(reg)); |
以上正则中,在点号前面添加了反斜杠进行转义,所以只会匹配字符串"c.",否则也会匹配"cd"。
但是在字符类中绝大多数元字符都不需要进行转义,必须要进行转义的字符只有"\",字符"^"和"-"是否需要转义要看具体的应用场景,代码实例如下:
实例一:
1
2
3
|
var str= "ab$c.efcd" ; var reg=/[$.]/g; console.log(str.match(reg)); |
以上代码可以匹配字符串中的"$"和"."本身。
实例二:
1
2
3
|
var str= "a\\b$c.efcd" ; var reg=/[\\$.]/g; console.log(str.match(reg)); |
以上代码为匹配反斜杠必须要进行转义。
实例三:
1
2
3
|
var str= "ab-c^569" ; var reg=/[\^0\-9]/g; console.log(str.match(reg)); |
在以上代码中"^"和"-"已经不具有特殊意义了,而是表示它们本身,因为使用了转义。
实例四:
1
2
3
|
var str= "ab-c^569" ; var reg=/[-a^c0]/g; console.log(str.match(reg)); |
上面的代码"-"和"^"就没有进行转义,这是因为它们所在点位置使它们失去了特殊意义。
字符类中也可以使用转义字符:
代码实例如下:
1
2
3
|
var str= "abc<|12" ; var reg=/[\w]/g; console.log(str.match(reg)); |
特别注意:\b在字符类外表示单词边界,但是在字符类内[\b]表示退格符。
四.排除型字符类:
[^]是一个排除型字符类,用以匹配不在中括号中的任一字符,当然匹配结果也只能够是一个字符,例如:
[^antzone]
以上正则可以匹配除了字符"a"、"n"、"t"、"z"、"o"、"n"和"e"之外的任意字符。
排除型字符类同样也支持连字符"-",例如:
[^0-9]
可以匹配除了数字之外的其他字符。