Python网络爬虫技术与实战
上QQ阅读APP看书,第一时间看更新

4.2 正则表达式语法

我们首先需要了解一下正则表达式的匹配过程:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界,那么这个过程会有一些不同,匹配流程如图4-2所示。

图4-2 正则表达式进行匹配的流程