使用到了以下包:
爬虫 scrapy网络测试 requests数据分析 numpy和pandas绘图 matplotlib和wordcloud pip install scrapypip install requestspip install numpypip install pandaspip install matplotlibpip install wordcloud 爬取数据打开QQ音乐网页版的分类歌单界面,乍一看,一分析网页源码,看到下图:
那么看来它就是使用动态填充的,那么它肯定就调用了接口,请求数据,那么就去找,在检查里的network中找啊找,最终找到了它:
然后写上代码,经过调试,终于成功了。
最后我把它保存成一个csv文件,通过播放量排序,截取前20,得到了下图
分析数据对于这个数据的处理,就用到了numpy和pandas以及matplotlib。经过分析得出下图结果:
播放次数分析
标签分析
github地址: https://github.com/arvinljw/SpiderNet/blob/master/qqmusic/qqmusic/spiders/qqmusic.py转载于:https://www.cnblogs.com/dawning666/articles/9433946.html