第二周:网络爬虫之提取 2.1BeautifulSoup库入门 1.使用BeautifulSoup的方式 from bs4 import BeautifulSoup soup = BeautifulSoup(‘<p>data</p>’, ‘html.parser’) 第一个参数是一个html格式的信息。 2. BeautifulSoup的基本元素 BS库是解析、遍历、维护“标签树”的功能库。例如: soup = …
第二周:网络爬虫之提取 2.1BeautifulSoup库入门 1.使用BeautifulSoup的方式 from bs4 import BeautifulSoup soup = BeautifulSoup(‘<p>data</p>’, ‘html.parser’) 第一个参数是一个html格式的信息。 2. BeautifulSoup的基本元素 BS库是解析、遍历、维护“标签树”的功能库。例如: soup = …
第五节:树(下) 5.1 堆 1.堆的介绍 优先队列:特殊的“队列”,取出元素的顺序是依照元素的优先权(关键字)大小,而不是元素进入队列的先后顺序。 堆的两个特性: (1)结构性:用数组表示的完全二叉树; (2)有序性:任一结点的关键字是其子树所有结点的的最大值(最小值): ①最大堆:也称“大顶堆”:最大值 ②最小堆,也称“小顶堆”:最小值。 类型名称:最大堆(MaxHeap) 数据对象集:一个有N>0个元素的最大堆H是一棵完全二叉树,每个结点上的元素值不小于其子结点元素的值。 操作集:对于任意最多有MaxS…
第四节:二叉搜索树 4.1 二叉搜索树 二叉搜索树(BST),也称二叉排序树和二叉查找树。一棵这个树,可以为空。如果不为空,满足以下性质: (1)非空左子树的所有键值小于其根结点的键值。 (2)非空右子树的所有键值大于其根结点的键值。 (3)左、右子树都是二叉搜索树。 1.二叉搜索树操作的函数: Position Find(ElementType X, BinTree BST):从二叉搜索树BST中查找元素X,并返回其结点地址; Position FindMin(ElementType X, BinTree BST…
第三讲 树(上) 3.1 树与树的表示 1.查找 查找是指根据某个给定关键字K,从集合R中找出关键字与K相同的记录。它分为以下两类: (1)静态查找:集合中记录是固定的,没有插入和删除操作。 (2)动态查找:集合中记录是动态变化的,除了查找,还可能发生插入和删除。 首先举一个顺序查找的例子。此例需要注意,其设置了一个哨兵,因此可以减少判断中的一个条件。这个例子要求是在Element[1]~Element[n]中查找关键字为K的数据元素,其结构体如下: typedef struct LNode&n…
第一周:网路爬虫之规则 单元1:Requests库入门 1.Requests库综述 表1.1 Requests库的7个主要方法 方法 说明 request() 构造一个请求,支撑以下各方法的基础方法 get() 获取HTML网页的主要方法,对应于HTTP的GET head() 获取HTML网页头的主要方法,对应于HTTP的HEAD post() 向HTML网页提交POST请求的方法,对应于HTTP的POST put() 向HTML网页提交PUT请求的方法,对应于HTTP的PUT patch() 向HTML网页提交局…
第六周 6.1 集合类型及操作 1.集合类型的定义 集合是多个元素的无序组合,每个元素唯一,不存在相同元素。集合元素不可更改,不能是可变数据类型。这是因为,若集合元素可以改变,那么万一改变成和其它元素重复的,必然造成错误。 集合用大括号{}表示,元素之间用逗号分隔。建立集合类型有{}或set()。如果建立空集合,必须用set()。例如: A={“python”,123,(“python”,123)}#使用{}建立集合 结果是:{‘python’,123,(‘python’,123)} B=set(“pypy123”…
第八章:反射与代理机制 8.1 Java反射机制 1.Java类型信息 (1)获取Java运行时的类型信息有两种方法: ①RTTI。在运行时,需要识别一个对象的类型。当从数组中取出元素时,会自动将结果转型回Shape,这是RTTI最基本的使用形式,因为在Java中,所有的类型转换都是在运行时进行正确性检查的。 在写代码时,大部分代码应尽可能少地了解对象的具体类型,而是只与对象家族中的一个通用表示打交道。 ②Java反射机制。它指在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法;对于任意一个对象,都能够…