文本挖掘(TM )又称自然语言处理(NLP ),是AI时代炙手可热的数据分析挖掘前沿领域,其人机交互系统、推荐算法、文本分类等技术在BAT等企业得到广泛应用
本课程通过经典武侠小说、大众点评收集结果、微博资料数据等多种真实案例进行教学。
这次课程从最基础的分词、单词袋模型、分布式表示等概念开始,全面介绍文本挖掘技术的各个方面。 特别是针对当前最热门的word2vec、gensim等实际案例进行学习,帮助您从零度基点直接升级到行业**技术前沿。
完成本课程后,学员可以独立使用Python环境进行中文文本挖掘。
本课程已全部更新。 未来将根据方法论的**进展不定期更新。
【路线长度】
总时间:约11小时
【学习者的基础】
学员必须了解Python语言的基本编程知识。
建议学员提前参加本系列Pandas课程。 本课程的数据管理使用Pandas知识和操作。
【课程概要】
第一章:文本挖掘概述
第二章:磨刀不误砍柴
第三章:分词
第四章:言云展示
第五章:文档信息矢量化
第6章:关键词抽取
第七章:文本主题提取
第八章:文本相似度
第九章:文档分类
第十章:情感分析
第十章:自动摘要
第11章:自动加注
Python数据分析系列视频课程文本挖掘
1-1什么是文本挖掘. mp4
1-2文本挖掘的基本流程和任务. mp4
1-3文本挖掘的基本思路. mp4
1-4数据化时应考虑的工作. mp4
2-1 Python常用IDE配置文件. mp4
2-2 Anaconda安装和配置. mp4
2-3 Jupyter Notebook的基本操作. mp4
2-4 NLTK的安装和配置. mp4
什么是2-5语料库. mp4
2-6《射雕》准备语料库. mp4
3-1分词原理概述. mp4
3-2结巴分词的基本用法. mp4
3-3使用自定义词典和Sogou细胞词典. mp4
3-4删除禁用语. mp4
3-5词性标注其他. mp4
4-1词数统计. mp4
4-2云概述. mp4
4-3 wordcloud软件包安装. mp4
4-4创建单词组. mp4
4-5设置云背景模板. mp4
4-6修改字云颜色. mp4
5-1词袋型号. mp4
5-2词袋模型的gensim实现. mp4
5-3用pandas生成文档词条矩阵. mp4
5-4在sk learns中生成文档-词条矩阵. mp4
从5-5词袋模型到N-gram模型. mp4
5-6文本信息的分布式显示. mp4
5-7共现矩阵. mp4
5-8 NNLM机型的突破. mp4
5-9 word2vec一出场,满座吓了一跳. mp4
6-1关键词抽取的基本思路. mp4
6-2 TF-IDF算法. mp4
6-3 TF-IDF算法的jieba实现. mp4
6-4 TF-IDF算法的sklearn实现. mp4
6-5 TF-IDF算法的gensim实现. mp4
6-6文本通道算法. mp4
7-1主题模型概述. mp4
7-2主题模型的sklearn实现. mp4
7-3主题模型的gensim实现. mp4
8-1基本概念. mp4
8-2词条相似度: word2vec培训. mp4
8-3词条相似度: word2vec APP应用. mp4
8-4文档相似度词袋模型的实现. mp4
8-5 doc2vec.mp4
8-6文档聚类. mp4
9-1文本分类概述. mp4
9-2朴素贝叶斯算法. mp4
9-3算法的sklearn实现. mp4
9-4算法的NLTK实现. mp4
10-1情感分析概述. mp4
10-2情感分析的语袋模型实现. mp4
10-3情感分析的方差表达实现. mp4
11-1自动摘要的基本原理. mp4
11-2自动摘要的效果评估. mp4
11-3自动摘要的python实现. mp4
12-1 RNN的基本原理. mp4
12-2 LSTM的基本原理. mp4
12-3 keras tensor流组的优势. mp4
12-4 Keras TensorFlow组合安装. mp4
12-5情况1 :数据准备. mp4
12-6情况1 :模型拟合. mp4
12-7情况2 :数据准备. mp4
12-8情况2 :模型拟合. mp4
Python数据分析系列视频课程文本挖掘. zip