方法一:
完整分析信息的标记格式,提取重要信息
XML JSON YAML
遍历需要标记解析器(如bs库)的标记树
优点:信息分析准确
缺点:提取过程繁琐
方法2 :无标记直接搜索重要信息
搜索
可以是针对信息的文本检索函数
优点、流程简洁、速度快
缺点,提取结果的准确性与内容有关
其中的方法
. find_all(name、attrs、recursive、string、**kwargs ) ) )。
返回保存搜索结果的列表类型。
name :标签名称的搜索字符串。
attrs:标签属性值搜索字符串,可标记属性搜索。
recursive:是否搜索所有后代,默认为True。 布尔型。
string:…/中字符串区域的搜索字符串
**kawargs :
() )等效于. find_all(…)…
soup(…)等效于soup.find_all(…)…
.find 拓展方法