第三周:网络爬虫之实战 第一节:Re(正则表达式)库入门 正则表达式是用来简洁表达一组字符串的表达式。它可以用来表达文本类型的特征。 正则表达式编译:将符合正则表达式语法的字符串转换成正则表达式特征。 1.正则表达式的语法 例如: P(Y|YT|YTH|YTHO)?N 正则表达式语法由字符和操作符构成。正则表达式的常用操作符见表1.1所示。 表1.1 正则表达式的常用操作符 操作符 说明 实例 . 表示任何单个字符 [] 字符集,对单个字符给出取值范围 [abc]表示a,b,c,[a-z]表示a到z单个字符 [^]…