工业
本仓库主要记录本人NLP相关知识的积累,之前做了很多笔记,考虑到秋天的招生来了,在复习的过程中,慢慢熟悉了这些知识,然后将相关的知识笔记组织成主题,帮助我更好的复习。
同时,出现了开源。 请允许我补充一下相关的技术堆栈,看看我在哪些方面比较弱。 另外,也有助于大家在秋季招生期间更好地复习。 想一起做的同学,请联系我。 到底一个人做这么多,确实很难。 前期的笔记都做好了真是太好了。
建议使用Typora编辑器打开。 一看就有了。
康泰
1 .编程语言基础
这个文件夹下主要记录了python和c几种语言的详细内容,但毕竟这两种语言是主流,基本上应该都能做到。 目前正在调查补漏白是否不足。
C面考试问题
Python问题
2 .数学基础
该文件夹下主要记录数学相关知识,包括高数、线性代数、概率论和信息论,不安的鸭子根据自己的经验,目前正在调查陷阱的不足之处。
概率论
高等数学
线性代数
信息论
3 .计算机基础理论知识
这部分的内容一般不怎么考试。 因此,没有重点。 至少现在我很少遇到问这方面的人。 有趣的是,我扔了蚂蚁某部的NLP算法,竟然来了一个不知道NLP的人。 整个过程真是胡说八道,全是开发。
4 .机器学习基础
这一部分已经开始进入正题,但事实证明一些大工厂提到了基础的机器学习算法知识,所以我认为这部分可以建立几个核心模型。
机器学习项目流程
判别模型vs生成模型
频率派vs贝叶斯派
数据预处理
特征工序
特征工程-关联规则
型号- SVM
模型-聚类算法
模型-决策树
模型-逻辑回归
模型-纯真
模型-随机森林
模型-线性回归
5 .深度学习基础
这一部分主要阐述深度学习的基础知识,是核心点,但很多面试官的问题基本相同,但我个人认为有这样一个全球全面的知识框架是有益的。
深度学习项目的流程
5.1基础理论部分
基础理论-多任务学习
基础理论-综合学习
基础理论-分类问题评价指标
基础理论-距离测量方法
基础理论-目标函数、损失函数、成本函数
基础理论-偏差vs方差、欠拟合vs过拟合
基础理论——从数据角度看深度学习
基础理论-梯度消失、梯度爆炸问题
基础理论-维度灾害问题
基础理论-指数加权平均
基础理论-局部最小值,鞍点
基础理论-综合学习
基础理论-综合学习
5.2基本单元
基本单元- CNN
基本单元- MLP
基本单元- RNN
5.3调参相关
参数-超参数调谐
参数-激活函数
参数-权重初始化方案
参数-优化算法
5.4涓流
瑞克-放下
直线标准化
点击-融合训练集、验证集、测试集
瑞克-提前结束
Trick -学习率下降
Trick -规范化
6 .统计自然语言处理
这上期笔记本的一部分做得很少,所以还没怎么开始。
7 .深度学习自然语言处理
这部分是核心知识,这部分需要逐渐完善,时间有点紧啊。
文本数据预处理
各项大任务的评价指标
改进NLP模型的几点思考
7.1词向量三部曲
词向量- Word2Vec
单词向量- Glove
词向量-快速文本
7.2预训练语言模型
预训练语言模型- BERT改进研究
预培训语言模型——融入知识图谱
预训练语言模型——自然语言生成
7.3身份验证机制
7.4文本分类
7.5语义匹配
7.6阅读理解
8 .阅读源代码
本部分主要推荐一些自己阅读的源代码。 既有与NLP相关的源代码,也有与深度学习相关的源代码。 有些源代码是个人评论的,所以我会相应地列出来。
9 .不安鸭渣算法
这部分主要是自己面试中的一些感悟,啊,我快自闭了。
参考
[1]深度学习- 500-questions-- -好仓库
[2] algorithm _ interview _ notes-Chinese--知识虽旧,但好
其他主要是自己的日常积累和阅读的论文。