jieba库是python的第三方词典,用于中文分词的库需要下载。 必须在命令行中键入pip install jieba进行下载
pip安装Jie ba
必须找到python安装路径的Scripts目录只有切换到该目录并使用pip才能有用。 当然,不需要带有环境变量的东西。 如果使用的是pycharm,也可以直接在pycharm控制台中使用该目录
我安装好了。 用它指出了我的安装位置
安装完成后,使用jieba库
jieba库主要有四种方法
jieba.lcut(s )严格模式返回列表类型的分词结果
例如: jieba.lcut (中国是一个伟大的国家) )。
[《中国》、《是》、《个》、《伟大》、《的》、《国家》]
jieba.lcut(s,cut_all=Ture )全模式返回一个列表类型的分词结果,具有冗馀性
例[《中国》、《国是》、《个》、《伟大》、《的》、《国家》]
jieba.lcut_for_search (“中华人民共和国伟大”) #搜索引擎模型返回一种类型的分词结果,具有冗馀性
例)“中华”、“华人”、“人民”、“共和”、“共和国”、“中华人民共和国”、“是的”、“伟大”、“的
在词分开写的词典中添加新单词w
jieba.add_word(w )示例: Jieba.add_word“蟒蛇语言”
import jiebals=jieba.lcut (中国是伟大的国家) ) ls1=jieba.lcut )、cut_all=True ) ls2=Jieba.lcut_for_ )。
jieba.add_word(w ) w用您想添加的新词替换的Jieba库的使用到此为止。 很简单吗? 其实最长使用的是jieba.lcut ) )。 也请记住这个其他的基本知识。 JBA库是一个重要的库,经常使用。 python级也将通过jieba库。 报考2级的学生请加油哦。