第三周:网络爬虫之实战 第一节:Re(正则表达式)库入门 正则表达式是用来简洁表达一组字符串的表达式。它可以用来表达文本类型的特征。 正则表达式编译:将符合正则表达式语法的字符串转换成正则表达式特征。 1.正则表达式的语法 例如: P(Y|…
分类:Study-notes
Python语言程序设计(第8周)知识点整理
第八周:程序设计方法学 8.1 实例13:体育竞技分析 1.自顶向下(设计) 它是解决复杂问题的有效方法,它将一个总问题表达为若干个小问题的组成形式,使用同样的方法进一步分解小问题,直至小问题可以用计算机简单明了解决。 2.自底向上(执行)…
Python语言程序设计(第7周)知识点整理
第七周:文件和数据格式化 7.1 文件的使用 1.文件的类型 文件是数据的抽象和集合:文件是存储在辅助存储器上的数据序列;文件是数据存储的一种形式;文件展现形态有文本文件和二进制文件。最根本上是二进制文件。 (1)文本文件:由单一特定编码组…
数据结构【浙江大学】(第6节)整理
第六节:图(上) 6.1 图 1.关于图 图表示的是“多对多”的关系。它包含: (1)一组顶点:通常用V(Vertex)表示顶点集合。 (2)一组边:通常用E(Edge)表示边的集合,表示顶点与顶点的关系: ①边是顶点对:(v,w)∈E,其…
Python网络爬虫与信息提取(第2周)知识点整理
第二周:网络爬虫之提取 2.1BeautifulSoup库入门 1.使用BeautifulSoup的方式 from bs4 import BeautifulSoup soup = Beaut…
数据结构【浙江大学】(第5节)整理
第五节:树(下) 5.1 堆 1.堆的介绍 优先队列:特殊的“队列”,取出元素的顺序是依照元素的优先权(关键字)大小,而不是元素进入队列的先后顺序。 堆的两个特性: (1)结构性:用数组表示的完全二叉树; (2)有序性:任一结点的关键字是其…
数据结构【浙江大学】(第4节)整理
第四节:二叉搜索树 4.1 二叉搜索树 二叉搜索树(BST),也称二叉排序树和二叉查找树。一棵这个树,可以为空。如果不为空,满足以下性质: (1)非空左子树的所有键值小于其根结点的键值。 (2)非空右子树的所有键值大于其根结点的键值。 (3…