这篇文章主要介绍了Python中re模块匹配方法怎么用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python中re模块匹配方法怎么用文章都会有所收获,下面我们一起来看看吧。
匹配开头结尾
字符 | 功能 |
^ | 匹配字符串开头 |
$ | 匹配字符串结尾 |
示例1:$
需求:匹配163.com的邮箱地址
email_list = [ " xiaoWang@163.com " , " xiaoWang@163.comh eihei" , ". com.xiaowang@qq.com " ]
for email in email_list: ret = re.match("[w]{4,20}@163.com$", email) .代表只是一个点 $代表以xxx结尾的字符串 if ret: print("%s ---是符合规定的邮件地址” % email) else: print("%s ---不符合要求" % email)
运行结果:
xiaoWang@163.com # ---是符合规定的邮件地址
xiaoWang@163.comheihei # ---不符合要求 # 如果没有$,这个字符串会匹配出来
.com.xiaowang@qq.com # ---不符合要求
匹配分组
字符 | 功能 |
| | 匹配左右任意一个表达式 |
(ab) | 将括号中字符作为一个分组 |
um | 引用分组num匹配到的字符串 |
(?P<name>) | 分组起别名 |
(?P=name) | 引用别名为name分组匹配到的字符串 |
示例1:|
需求:匹配出0-100之间的数字
#coding=utf-8 import re ret = re.match("[1-9]?d","8”) # ?匹配前面的字符出现1次或者0次 类似78也可以匹配 print(ret.group()) # 结果:8
# 可能匹配不成功时? import re ret = re.match("[1-9]?d$","08") if ret: print(ret.group()) else: print("不在0-100之间”) # 结果:不在0-100之间
# 添加|
import re ret = re.match("[1-9]?d$|100","78") print(ret.group()) # 结果: 78 ret = re.match("[1-9]?d$|100","100") print(ret.group()) # 结果: 100
示例2:( )
需求:匹配出163、126、qq邮箱
#coding=utf-8 import re ret = re.match("w{4,20}@163.com", "test@163.com”) print(ret.group()) # 结果: test@163.com ret = re.match("w{4,20}@(163|126|qq).com", "test@gmail.com") if ret: print(ret.group()) else: print("不是163、126、qq邮箱") # 结果: 不是163、126、qq邮箱
需求:不是以4、7结尾的手机号码(11位)
import re tels = ["13100001234", "18912344321", "10086", "18800007777"] for tel in tels: ret = re.match("1d{9}[0-3,5-6,8-9]", tel) if ret: print(ret.group()) else: print("%s 不是想要的手机号" % tel)
结果如下:
13100001234 不是想要的手机号
18912344321
10086 不是想要的手机号
18800007777 不是想要的手机号
示例三:分组匹配
需求:提取区号和电话号码
import re ret = re.match("([^-]*)-(d+)", "010-12345678") print(ret.group()) print(ret.group(1)) print(ret.group(2))
结果如下:
010-12345678
010
12345678
^在[ ]里面代表非的含义:
例如:
[^-]* *代表前所有字符0个或者多个,非-的字符串
[^abc] 代表非a、且非b 、且非c的字符