首页 > 编程知识 正文

词频统计软件,jieba分词统计词频

时间:2023-05-06 17:49:03 阅读:32507 作者:1119

fromwordcloudimportwordcloudimportmatplotlib.pyplotaspltimportnumpyasnpfrompilimportimagefromjiebaimport * def replace 读取替换列表中的字符串forcharinold : text=text.replace (char,new ) returntextdefgettext (文件名称) 3360#文件内容(utf-(new ) "," ","。 ' ' withopen ' { }.txt '.format (filename )、' r ' ) as f: #配置文件对象txt=f.read ) returnreplace ) txt,sign '') defcreat_word_cloud(filename ) : # )按出现次数将filename文件中的字作为字图text=gettext ) filename )读取文件wordlist=lcut ) text )输出的jieba库的严格模式分词wl=' ' . (windows (fonts (simfang.TTF )字体路径WC=wordcloud设置#背景色max_words=2000,#设置要显示的最大单词组数font_path=font,然后单击#图像高度width=1600, #设定图像宽度max_Font_ )的#字体最大值random_state=250、# 配色方案类型(myword=WC.generate(wl )生成语云)演示语云图plt.show (my word ) PLT.axis (off ' ) PLT.show ) )在原始filename中

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。