首页 > 编程知识 正文

怎么自学生物学,生物信息学怎么学

时间:2023-05-05 15:44:47 阅读:207610 作者:4472

为了不让大家再走我之前自学生信时候踩过的坑,走过的弯路,将一些比较重要的入门书籍,网站和后续的学习渠道总结如下,供大家参考。

目录 统计学系统操作编程语言生物学学习渠道 统计学

StatQuest

生物统计学视频,包含统计学基础和生信所涉及的统计学概念,作者力图用可视化并结合有意思的例子来让统计学菜鸟尽快熟悉内部原理。

作者是国外的大神,所以他的教程是全英文,在YouTube上首发。后来国内的B站UP取得作者授权,将视频传到国内并配上了中文字幕,后边代码也是这个xfdds上传的。

YouTube:https://www.youtube.com/playlist?list=PLblh5JKOoLUJo2Q6xK4tZElbIvAACEykp

B站网址:https://space.bilibili.com/257347536?from=search&seid=13661736885600696159

一部分R代码:https://pan.baidu.com/s/1GQXa0P0_vX_bHgrWVEmAYA 提取码:c2wk

深入浅出统计学

用大量例子来讲解统计学的一些概念,如果不习惯英语视频,可以先用这本书来熟悉。

系统操作

鸟哥的Linux私房菜 基础学习篇

生信的大部分软件和分析流程都需要依靠服务器来做,因此避免不了Linux的使用。开始学习不用背全部命令,常用命令和参数输入多遍就会记住,如果对某个命令想深入学习,可以将这本书翻开看看。

鸟哥的Linux私房菜:服务器架设篇

如果今后不涉及数据库设计或其他运维工作,这本书可以不看,只做了解。

编程语言

R语言实战

R语言是目前生信数据处理的主要编程语言,涵盖大量的包来处理不同的生信需求,因此对于R语言的学习必不可少。

ggplot2:数据分析与图形艺术

某种意义上讲,R吸引人们使用它的重要原因就是这个包的存在。它提供了大量的可设置的可视化操作方式,几乎可以绘制出任何用户想绘制的图形。

下面是利用ggplot2绘制的图形

廖雪峰 Python 教程

网站简洁大方,教程附带大量例子,可以使新手快速进入python的学习中。

网址:https://www.liaoxuefeng.com/wiki/1016959663602400

Python基础教程

Python 同样逐步进入生信领域,包括Pandas,Matlibplot,Biopython等库都可以方便的执行生信分析任务。同样,也包含一些机器学习包,可以用于生物信息学的工作中。

Biopython 包

一般生信分析脚本的工具集。包括核酸序列处理,NCBI,UniProt数据库操作等其他常用的生信工具。

中文教程:https://biopython-cn.readthedocs.io/zh_CN/latest

英文教程:http://biopython.org/DIST/docs/tutorial/Tutorial.html

GitHub:https://github.com/biopython/biopython

pandas 包

用于分析结构化数据的python包,包括对数据去空值,统计值计算,添加,删除,插入,修改,提取等等操作。由于底层基于C,所以可以处理大型文件而且具有很快的分析速度。

英文教程:https://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html

Matlibplot 包

其实就是在python环境中的MATLAB (科学制图里大神级的软件),而且和它语法结构和用法大致相同。

相当于上边提到的ggplot2,只是一个运行与R环境一个是Python环境里的可视化工具包,这两款看个人喜好来学习一个,另一个了解就好。

英文教程:https://matplotlib.org/

生物学

细胞生物学,翟中和

当年考试时候用的书,对涉及的细胞的知识做了全方位的解释。

分子生物学,jqdby

当年考试时候用的书,对这本书的理解,关系都后面对生信分析的理解。比如在数据分析中的基因组比对,转录本定量,单位点突变分析,测序里的接头,UMI,Barcode等等一些概念的理解。

**基因X,Lewin **

包含大量的文字和精美的配图来极致详尽的解释生物学过程,唯一的缺点就是太厚。

学习渠道(单纯好用,不是广告)

Rosalind

网址:http://rosalind.info/problems/locations/

通过编程来生物信息学实战的英文网站,提供了大量的试题,用户能在线提交来完成。

在正确提交后,可以通过评论来看世界各地的人们对同一道题的不同解法。

生信菜鸟团

公众号,适合生信初学者,包括常用软件,格式,流程的教程,主要由文献推荐,帮助新手快速进入生信状态。

生信技能树

包含论坛和公众号,有高质量的推文,包括生信分析的方法,软件教程,生信会议信息,还有彩蛋和吐槽推文。

生信人

公众号,生信文献的推文,研究方法的教程

宏基因组

公众号,主要发微生物方面的推文,也包含生信分析的教程

一些有趣的实操项目

Python + 生物信息 01 :从零认识基因序列

Python + 生物信息 02 :Biopython 分析序列

Python + 生物信息 03 :用Python操作NCBI

Python + 生物信息 04 :批量下载基因与文献

生物信息之多序列比对,进化树分析,保守位点分析

R 生信数据可视化 01 | 聚类热图

R 数据可视化 02 | 火山图

自己的CSDN:https://blog.csdn.net/u011262253

自己的简书:https://www.jianshu.com/u/edebc0f5f8ba

自己的知乎:https://zhuanlan.zhihu.com/c_187707704

自己的博客站:https://www.ziptop.top/

更新中…

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。