首页 > 编程知识 正文

语文提取信息的方法有哪些(提炼信息的方法)

时间:2023-05-05 17:13:57 阅读:65862 作者:3228

方法一:

完整分析信息的标记格式,提取重要信息

XML JSON YAML

遍历需要标记解析器(如bs库)的标记树

优点:信息分析准确

缺点:提取过程繁琐

方法2 :无标记直接搜索重要信息

搜索

可以是针对信息的文本检索函数

优点、流程简洁、速度快

缺点,提取结果的准确性与内容有关

其中的方法

. find_all(name、attrs、recursive、string、**kwargs ) ) )。

返回保存搜索结果的列表类型。

name :标签名称的搜索字符串。

attrs:标签属性值搜索字符串,可标记属性搜索。

recursive:是否搜索所有后代,默认为True。 布尔型。

string:…/中字符串区域的搜索字符串

**kawargs :

() )等效于. find_all(…)…

soup(…)等效于soup.find_all(…)…

.find 拓展方法

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。