python 正则如何抓取 <a><⼀a> 中 href 属性和标签里的内容?

2024-11-02 09:32:10
有2个网友回答
网友(1):

import re
pattern = '(.*?)'
with open("绝困衡test.html", "r") as fp:
   并做 for line in fp:
        ret = re.search(pattern, line)
        if ret:
 尺迟           for x in ret.groups(): print x

不知道具体格式是怎样的,我这里也就简单举个例子。

groups获取到的就是正则pattern里面( )中的内容,以元组形式返回。

网友(2):

<纤判a.*?href="([^"李竖汪]*)".*?>([\S\s]*?)哪仔