正则表达式的用处还是很大的,最近在抓取网页的时候使用到了正则表达式。在这里简单介绍下正则。
1. 元字符
1.1元字符类型
元字符 | 意义 |
. | 匹配除换行符的任意字符 |
\d | 匹配数字 |
\D | 匹配非数字 |
\w | 匹配数字,大小写字母,和下划线 |
\W | 匹配非数字,大小写字母,和下划线 |
\s | 匹配空白字符 |
\S | 匹配非空白字符 |
1.2限定符
限定符 | 意义 |
^ | 匹配开头 |
$ | 匹配结尾 |
{n} | 匹配前面字符n次 |
{n,m} | 匹配前面字符n到m次 |
* | 匹配前面字符任意多次 |
+ | 匹配前面字符至少一次 |
? | 匹配前面字符最多一次 |
1.3多选结构
限定符 | 意义 |
(x|y|abx) | 匹配|之间任意一组 |
[abc123] | 匹配[]之间任意字符 |
[a-z] | 匹配全部小写字母 |
[^a-z] | 匹配非小写字母 |
[\u4e00-\u9fa5] | 匹配汉字 |
文章转载自菜鸟也有梦想,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




