首页 > 编程知识 正文

cda数据分析零基础入门,字节跳动数据分析薪资

时间:2023-05-04 19:13:46 阅读:53988 作者:448

从一无所知的radddd到现在的字节跳动数据分析师,我花了大约一年的时间。 我想在这里给你看看我的跳槽经验。 只要能帮上一点忙就太好了。

为了隐私,我都加了代码。 个人背景是,本科是工学系关系,非计算机非统计学,硕士是金融关系,基本上与数据分析关系不大。 我在毕业之前犹豫过。 我也不知道自己是否真的适合金融业,上学的时候没有认真做过银行和证券公司的实习,所以基本毕业很凉爽。 幸运的是毕业前,在和朋友的偶然对话中,知道了数据分析这个职业,自己似乎很感兴趣,当时没有其他选择,所以决定一个人试着扔了。 一体化数据分析,在此也感谢那位朋友。 生活确实取决于你是否能做出一些重要的选择。

变革决定后,首先去网上恶补了数据分析师这个行业的整体情况。 目前,数据分析师实际上很复杂,不同企业的数据分析师定位不同,但大致归纳起来可以分为两类。

偏技术型数据分析师和偏业务性数据分析师技术分析师与数据挖掘工程师、算法工程师、大数据工程师的概念相近,一般需要数据结构知识和算法知识,而不是计算机专家其实一开始我就想到这样的分析师,但在后面印了几百个leetcode问题后,我决定放弃这条路。

二是偏商业的数据分析师,是市场上职场最多的数据分析师。 这位分析师的门槛相对较低,但弄不好会成为报告分析师,提名分析师的可能性较高。 但是门槛还很低,对于想变革的学生,业务型数据分析师会更亲切

明确变革方向后,对于从零开始变革的同学来说,有两个紧迫的问题。 我该从哪里下手,简历上什么都没有吗? 对于第一个问题,我的选择是先列出我认为的业务型数据分析师所需的能力矩阵,然后有针对性地准备。 简而言之,主要包括这些层面:

基本工具数据分析师三板斧: Excel、SQL、Python

Excel、SQL和python是数据分析师必须知道的三个基本工具。 一个一个地看吧。

Excel

关于Excel的学习,如果你想要的工作地点不是纯Excel数据分析师的工作地点,我建议你不要在Excel上花太多时间。 就我个人而言,我几乎不在Excel上花时间。 主要掌握vlookup、数据透视表、常用图表,不能的函数直接设置为百度。

SQL

核心! sql一定要熟练,笔试基本上一定要参加考试,面试的时候很大概率会被人用手撕sql,写出来容易降温。 对于sql学习,完全没有基础的学生可以先阅读这个《sql必知必会》,了解sql的基本知识,增加删除检查,主要看查询的部分。

读了这本书之后,你应该对sql语法有了基本的了解,但是如果不多练习,面试手写sql这样的场景,就很容易掉以轻心。 在这里用力按几个练习网站。

1.牛客网编程牛客网在线编程,强大推荐,sql正误,纯中文,并可自动批改主题说明。 这个题库我刷了两次

2.Leetcode也是一个很有名的网站,学习计算机的人可能知道。 英语代码是在线练习网站,今天看了一下有中文。 但是,很多主题已经成为收费的主题。 如果觉得牛客网的刷子不够的话再来这里看看

总之,掌握sql就是读书理解基础,多磨多练,面试中一般问题很少。 当然,也不能排除有变态sql笔问题。 那要看缘分。

Python

对于上面的两个工具,python的学习难度会稍高一些。 python可以做很多事情。 对数据分析师来说,主要应该掌握基础语法和数据科学模块。主要包括pandas numpy 和机器学习库sklearn等答案虽然不是必须的,但加分项目是增加自己分量的芯片,特别是从零开始转换的情况下。

学习python时,建议不要向班级缴纳智商税。 coursera有很多资源。 我在学习密歇根大学的python课程《Python for everybody》。 读入门就没问题了。 套餐是免费的。

完成本课程后,您将对python有基本的了解,但与sql一样,要实现真正的融合,需要更多的练习和利用。 那么怎么练习python呢? 这里推荐一个可能很多人都知道的数据竞赛平台。 没错,我是国安。 我想不少人都看过泰坦尼克号的生存预测这个项目。 这个项目的来源是kaggle。 在kaggle比赛的话,可以练习python,还有可以写在简历上的项目,所以一举两得。

如果红圈里面是泰坦尼克项目入门的话,可以从泰坦尼克或者房价的预测开始,但是如果要写在简历上的话,我建议你选择几场正式的比赛试试。 这两个项目太泛滥了,黄金含量很低。 我在kaggle里面做了很多项目,最后选择了信用卡违约风险预测的项目。 《Home Credit Default Risk》在简历上。 除了kaggle

有其他很不错的数据比赛平台,后面在项目篇会给大家再详细讲一下。

数据分析理论知识

统计学和机器学习两手都要抓、两手都要硬

理论知识这块,数据分析师最需要掌握知识是统计学和机器学习,但掌握到什么程度、掌握哪些领域,还是有些门道。

统计学

如果不是统计学专业的同学,一般面试官心里都有数,不会问你很难的问题,大学统计学范畴。对于统计学基础不怎么好,或者已经忘干净的同学,可以看网易公开课里可汗学院的课程恶补一下,我在准备的时候复习了一遍,感觉效果不错,捡回了不少遗忘的知识。​如果说没有时间看完全部课程,应该重点掌握哪块知识呢?假设检验,假设检验,假设检验,重要的事情说3遍,假设检验绝对是面试中统计学最高频的问题,和以后的工作也会最息息相关(a/b test)。

机器学习

机器学习相关的知识学习成本会比较高,对某些同学来说可能会有一定难度,但对于业务型数据分析师来说,一般不会要求你去推导算法公式,能做到明白不同算法的适用场景、优缺点、原理大概懂就基本可以了。

在机器学习这一块,我的学习路径是这样的:

视频课程:

首先入门强推xsdjw刻苦的蓝天的coursera(www.coursera.org)机器学习课!!千万别花钱报班了,入门看这个就够了!

看完觉得不过瘾想要进阶的话,可以继续看xsdjw刻苦的蓝天斯坦福大学的公开课,难度会比coursera上的课程更高一些,对于可以翻墙的同学,可以去youtube上找台湾国立大学灵巧的果汁xxdgb的《机器学习基石》和《机器学习技法》,难度会再高一些。我当时是连续刷完了这3门课程,虽然刷完之后部分知识还是有理解不够深入的情况,但应付面试已经差不多了。

youtube机器学习课程 书籍

阅读书籍可以帮助你更好的把知识沉淀下来,除了上面视频课程之外,我还刷了2本书籍。第一本是西瓜书,第二本书是甜美的人生的统计学习方法,这两本就不用多说了,经典读物。内容可以挑着看,主要看一下常用的机器学习模型,svm、随机森林之类的。

 

数据分析项目实战

kaggle打的好,工作也好找

如果你已经学完了上面的python和机器学习课程的话,就可以进入实战阶段了,我的选择是去打比赛,既可以巩固学到的知识同时又可以解决简历中没有相关项目的问题。

打比赛和真实的数据分析工作其实非常接近,对于大部分常规数据科学比赛而言(比如泰坦尼克号/房价预测这种),大部分人的模型最后其实都大差不差,lgb/xgb搞一搞,再做个模型融合,决定成绩好坏的关键往往是在特征工程上,有时候一个magic feature就能让你的排名上升数百名。magic feature从何而来?是来自你对比赛业务的理解,只有你真正理解了业务,才能构思出好的特征,从而取得好的名次,这个业务型数据分析师的本质也是相通的,理解业务,改进业务。

我举个简单的例子,以我做的信用卡风险项目为例,比赛目标是根据用户的个人信息和一些行为数据来判断用户是否会违约。其中有一个特征是用户的工资,第二个特征是用户信用卡已使用的额度,从业务的角度考虑,如果一个用户使用信用卡的额度远高于他的工资,那么这个用户是不是很有可能就没有钱还信用卡,违约风险会比较大?基于这个假设,我设计了一个 信用卡使用额度 / 工资的特征,经过可视化发现,确实是这个比值越大,用户违约的风险就会越高,把这个特征放到模型里面,我的模型分数有了显著的提高。

这个就是一个基于业务理解做出假设、通过数据验证假设、改进业务的闭环,这也是你在面试中,应该向面试官表达的。

下面推荐几个常见的数据科学比赛平台:

1. Kaggle

首推,强烈推荐!kaggle的优势不仅在于比赛众多,更重要的是里面会有很多选手分享他们的思路和代码,是分享做的最好的一个平台,我的python和数据挖掘基本就是从kaggle练起来的。

2. 阿里天池

国内最有牌面的数据比赛平台,如果你能在阿里天池拿一个不错的名次,含金量就相当高了,但是难度很大,对于转型的同学基本不太可能,可以看看新人赛和一些分享之类的。

3.DataFountain

某数据比赛平台,难度相对天池会低一些,且比赛内容对于国内hr来说,可能会更熟悉一些,在这个平台上,我打了一个招商银行的比赛,1867个参赛选手中拿到了第34名,算是成绩最好的一次。

数据分析思维

没有比这个更重要的能力了

分析思维是数据分析师最最核心的竞争力,上面所学习的python、sql、机器学习知识等都是在工具层面,要想使用好他们,还需要分析思维的驾驭。在面试中,对分析思维的考察也是相当重要的一环。

对于分析思维的学习,我建议新人也是从读书开始,我看过的且比较推荐的书包括:

数据分析类:

《精益数据分析》、《增长黑客》、《数据化管理:洞悉零售及电子商务运营》、《数据挖掘与数据化运营实战 思路、方法、技巧与应用》

产品思维类,如果是想要从事互联网行业的数据分析师的话,产品思维也是必须要具备的,面试考察点之一

《从点子到产品:产品经理的价值观与方法论》、《俞军产品方法论》、《产品思维》

逻辑思维类:在面试中逻辑清晰的回答面试官的问题,会为你大大的加分

《金字塔原理》、《学会提问》、《麦肯锡思维》

看完这些书,我相信你已经具备了基本的数据分析思维。但书中的知识和实际工作毕竟还是有一些差距,在这里我结合我的工作经验,给大家列几个数据分析师真实工作场景中常遇到的问题,问题会比较偏向互联网行业,其他行业的同学可以作为参考。

1、假设抖音的人均活跃时长下降了,你该如何分析这个问题?

2、网易云音乐之前有一个每天给你推10首歌的功能,如果让你设计指标来衡量这个功能的效果,你会设计哪些指标?

3、很多信息流app在新用户第一次注册时,都会让他们去选择兴趣标签,如果想让你做这个功能的专题分析,你会怎么设计你的报告框架?

最后,希望大家都能找到理想的工作。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。