qpython,文本数据挖掘与python应用

文本挖掘(TM )又称自然语言处理(NLP )，是AI时代炙手可热的数据分析挖掘前沿领域，其人机交互系统、推荐算法、文本分类等技术在BAT等企业得到广泛应用

本课程通过经典武侠小说、大众点评收集结果、微博资料数据等多种真实案例进行教学。

这次课程从最基础的分词、单词袋模型、分布式表示等概念开始，全面介绍文本挖掘技术的各个方面。特别是针对当前最热门的word2vec、gensim等实际案例进行学习，帮助您从零度基点直接升级到行业**技术前沿。

完成本课程后，学员可以独立使用Python环境进行中文文本挖掘。

本课程已全部更新。未来将根据方法论的**进展不定期更新。

【路线长度】

总时间：约11小时

【学习者的基础】

学员必须了解Python语言的基本编程知识。

建议学员提前参加本系列Pandas课程。本课程的数据管理使用Pandas知识和操作。

【课程概要】

第一章：文本挖掘概述

第二章：磨刀不误砍柴

第三章：分词

第四章：言云展示

第五章：文档信息矢量化

第6章：关键词抽取

第七章：文本主题提取

第八章：文本相似度

第九章：文档分类

第十章：情感分析

第十章：自动摘要

第11章：自动加注

Python数据分析系列视频课程文本挖掘

1-1什么是文本挖掘. mp4

1-2文本挖掘的基本流程和任务. mp4

1-3文本挖掘的基本思路. mp4

1-4数据化时应考虑的工作. mp4

2-1 Python常用IDE配置文件. mp4

2-2 Anaconda安装和配置. mp4

2-3 Jupyter Notebook的基本操作. mp4

2-4 NLTK的安装和配置. mp4

什么是2-5语料库. mp4

2-6《射雕》准备语料库. mp4

3-1分词原理概述. mp4

3-2结巴分词的基本用法. mp4

3-3使用自定义词典和Sogou细胞词典. mp4

3-4删除禁用语. mp4

3-5词性标注其他. mp4

4-1词数统计. mp4

4-2云概述. mp4

4-3 wordcloud软件包安装. mp4

4-4创建单词组. mp4

4-5设置云背景模板. mp4

4-6修改字云颜色. mp4

5-1词袋型号. mp4

5-2词袋模型的gensim实现. mp4

5-3用pandas生成文档词条矩阵. mp4

5-4在sk learns中生成文档-词条矩阵. mp4

从5-5词袋模型到N-gram模型. mp4

5-6文本信息的分布式显示. mp4

5-7共现矩阵. mp4

5-8 NNLM机型的突破. mp4

5-9 word2vec一出场，满座吓了一跳. mp4

6-1关键词抽取的基本思路. mp4

6-2 TF-IDF算法. mp4

6-3 TF-IDF算法的jieba实现. mp4

6-4 TF-IDF算法的sklearn实现. mp4

6-5 TF-IDF算法的gensim实现. mp4

6-6文本通道算法. mp4

7-1主题模型概述. mp4

7-2主题模型的sklearn实现. mp4

7-3主题模型的gensim实现. mp4

8-1基本概念. mp4

8-2词条相似度： word2vec培训. mp4

8-3词条相似度： word2vec APP应用. mp4

8-4文档相似度词袋模型的实现. mp4

8-5 doc2vec.mp4

8-6文档聚类. mp4

9-1文本分类概述. mp4

9-2朴素贝叶斯算法. mp4

9-3算法的sklearn实现. mp4

9-4算法的NLTK实现. mp4

10-1情感分析概述. mp4

10-2情感分析的语袋模型实现. mp4

10-3情感分析的方差表达实现. mp4

11-1自动摘要的基本原理. mp4

11-2自动摘要的效果评估. mp4

11-3自动摘要的python实现. mp4

12-1 RNN的基本原理. mp4

12-2 LSTM的基本原理. mp4

12-3 keras tensor流组的优势. mp4

12-4 Keras TensorFlow组合安装. mp4

12-5情况1 :数据准备. mp4

12-6情况1 :模型拟合. mp4

12-7情况2 :数据准备. mp4

12-8情况2 :模型拟合. mp4

Python数据分析系列视频课程文本挖掘. zip