首页 > 编程知识 正文

python词云图怎么做,破解微信聊天记录文件

时间:2023-05-04 00:24:49 阅读:165737 作者:387

Python使用微信聊天记录生成单词云本文将使用工具。

1、微信电脑版

2、模拟器(本文使用夜神模拟器) )。

3、https://md5jiami.bmcx.com/MD5加密工具

4、Sqlcipher.exe

5、Excel

6、Pycharm

正文目录Python使用微信记录生成单词云一、导出微信记录二、获取数据库密码三、编译sqlcipher.exe四、导出csv文件

33558 www.Sina.com/data/data/com.Tencent.mm/micro msg/2 bf2a 2d 7d 94578 B3 n 2d 9v (文件中的长名称文件夹)/EnMicroMsg.db

通过文件助手将EnMicroMsg.db保存在共享文件夹(Pictures )中,可以在电脑文件夹中查看EnMicroMsg.db文件。

二.获取数据库密码

微信记录数据库的密码由手机的IMIE UIN构成,为了绕过root,需要使用模拟器root获取IMEI,模拟器需要寻找1、IMEI和2、UIN。

1、在模拟器系统设置中,在手机菜单下,查找IMEI并保存。

2、在Amaze中,在/data/data/com.Tencent.mm/shared _ prefs下查找com.tencent.mm_preferences.xml。

3、打开文件后,string name=' last _ log in _ uin ' 734432902/string,734432902为uin,并将其存储。

4、到此为止,我们已经获得了IMEI和UIN,并将IMEI UIN连接起来。 即351564288183262734432902=35156428183262734432902。 5、将351564288183262734432902复制到https://md5jiami.bmcx.com/MD5加密网站进行解析。 其中,32位小写的前7位是微信聊天记录数据库密码: 737ecee6,至此,获得了数据库密码。 当然这里有个洞。 IMEI无论怎么找,都知道加密后的密码是错误的。 请尝试1234567890ABCDEF代替IMEI。 有惊喜哦。 三、编译sqlcipher.exe现在网络这么强大,不需要自己编译。 另外,由于编译问题很多,不建议初学者自己编译。 特别不亲切。 你可以自己搜索下载。 网上有很多。 你可以在夸奖后留言,请求我。

在此,在Sqlcipher.exe中打开并输入微信聊天记录数据库,在我们得到的数据库密码后,导出csv文件。

四、记住导出csv文件导出csv文件,选择message,这才是聊天的内容。

五.简单处理csv文件在csv文件中,content被列为聊天内容,可以自己筛选消除无用的数据,保留有用的数据。 然后,将此列中的数据复制到txt文件中,以便于使用python生成单词云。

六、使用pycharm生成云1,下载pycharm,制作项目。

2、这里需要部署软件包。 importjiebaimportnumpyimportcodecsimportpandasfrommatplotlib.imageimportimreadimportmatplotlib.pyplotaspltfromworm

您可以在Python Interpreter中添加上述包。

也可以用下面的Terminal放pip install以上的包…

发行以下完整的python代码。 importjiebaimportnumpyimportcodecsimportpandasfrommatplotlib.imageimportimreadimportmatplotlib.pyplotaspltfrotlib.imageimagegegeittttttpandecorimattttimpandecoratimphoratim o rt WordCloud, 加载imagecolorgeneratordefload _ file _ segment (: #自定义的词典单词Jie ba.load _ user dict (my words.txt ) )供我们处理将聊天文件读取到content content=f.read (#文件f.close ) #并保存分词结果segment=[] #对整个词进行分词的segs=jieba.cut ) ) 对于将分词添加到数组中的segment.append(seg ) returnsegmentdefget _ words _ count _ dict ) : #,确定上述分词segment=load _ file, #您可以通过在此处设置不需要的分词并将不需要的分词写入文件来移除设置的分词。 stop words=pandas.read _ CSV (stop words.txt )、index_col=False、quoting=3、sep='t '、names=) s totitis sep=encoding='utf-8 ' ) # df=df [~df.segment.isin (stop words.stop word ) ]如果在禁用词中没有按单词分组,则为每个单词(' segment '.agg ) )、numpy.size ) ) reset_ )计算的数字较大的是words _ count=words _ count.reset _ index () ) ascending=false (return words _ count words _ count=get _ words _ count _ dict ) #。 读取要生成的云的模板图像bimg=imread(ai2.jpt ) )的word cloud=word cloud (background _ color=' white ',mask=bimg ) font_path='simhei.ttf ' ) words=words _ count.set _ index (segment ).to_dict ) word cloud=word cloud img cold

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。