import re
pattern = '(.*?)'
with open("绝困衡test.html", "r") as fp:
并做 for line in fp:
ret = re.search(pattern, line)
if ret:
尺迟 for x in ret.groups(): print x
不知道具体格式是怎样的,我这里也就简单举个例子。
groups获取到的就是正则pattern里面( )中的内容,以元组形式返回。
<纤判a.*?href="([^"李竖汪]*)".*?>([\S\s]*?)哪仔