第三周:网络爬虫之实战 第一节:Re(正则表达式)库入门 正则表达式是用来简洁表达一组字符串的表达式。它可以用来表达文本类型的特征。 正则表达式编译:将符合正则表达式语法的字符串转换成正则表达式特征。 1.正则表达式的语法 例如: P(Y|…
标签:Python
Python语言程序设计(第8周)知识点整理
第八周:程序设计方法学 8.1 实例13:体育竞技分析 1.自顶向下(设计) 它是解决复杂问题的有效方法,它将一个总问题表达为若干个小问题的组成形式,使用同样的方法进一步分解小问题,直至小问题可以用计算机简单明了解决。 2.自底向上(执行)…
Python语言程序设计(第7周)知识点整理
第七周:文件和数据格式化 7.1 文件的使用 1.文件的类型 文件是数据的抽象和集合:文件是存储在辅助存储器上的数据序列;文件是数据存储的一种形式;文件展现形态有文本文件和二进制文件。最根本上是二进制文件。 (1)文本文件:由单一特定编码组…
Python网络爬虫与信息提取(第2周)知识点整理
第二周:网络爬虫之提取 2.1BeautifulSoup库入门 1.使用BeautifulSoup的方式 from bs4 import BeautifulSoup soup = Beaut…
Python网络爬虫与信息提取(第1周)知识点整理
第一周:网路爬虫之规则 单元1:Requests库入门 1.Requests库综述 表1.1 Requests库的7个主要方法 方法 说明 request() 构造一个请求,支撑以下各方法的基础方法 get() 获取HTML网页的主要方法,…