首页 > 编程知识 正文

生物信息数据库对发酵工程的影响,生物统计数据库

时间:2023-05-04 06:13:36 阅读:239311 作者:3738

生物信息与药物数据库 前言生物信息学与药物治疗一、蛋白质相关数据库1.STRING数据库2.Uniprot数据库3.DIP数据库4.HPRD数据库 二、基因相关数据库1.COXPRES db数据库2.Coexpedia数据库3.OMIM数据库 三、RNA,ncRNA数据库1.miRNA相关数据库2.ncRNA相关数据库 四、通路数据库1.KEGG数据库2.BioCyc数据库3.RegulonDB数据库 五、基因表达数据库1.TCGA数据库2.CGGA数据库3.GEO数据库 六、疾病与基因关联数据库1.DISNOR数据库2.DisGeNet数据库3.GeneCards数据库4.Phenopedia数据库 七、药物(化合物)数据库(西药为主)1.FDA数据库2.DrugBank数据库3.SIDER 4.1数据库4.ChEMBL数据库5.PubChem数据库6.药物组合数据库 八、药物(化合物)数据库(中药)1.CHEM-TCM数据库2.中医资源网3.TCMID数据库4.TCMSP数据库 九、药物(化合物)-基因(蛋白质)相互作用数据库1.DrugBank数据库2.TTD数据库3.BindingDB数据库4.STITCH数据库5.SwissTargetPrediction数据库 十、其他数据库1.DAVID数据库2.NCBI数据库 总结


前言

作为一名生物信息学“磕盐”道路上的jydxl,虽然在学术上没有太大的突破,但是在学习过程中积累一些干货,所以突然想分享一下。那话不多说,就直接进入正题吧。
这篇文章主要总结了一些常用的生物信息数据库以及药物数据库,就本人亲身的科研经历看,在生物信息学研究中数据真的十分的重要,处理数据也是个大工程,但是这篇文章就先只总结下数据库,某些数据库的具体使用以及数据处理后面有时间会再写啦~


生物信息学与药物治疗

生物信息学是研究生物信息的采集,处理,存储,传播,分析和解释等各方面的学科。它综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。那么生物信息数据库中就存储了大量已知的研究中所需的数据和一些已有的便捷的处理工具,掌握了可以大大加快后续的研究过程。
药物治疗是现有疾病的主要治疗方式,如何针对疾病进行正确的用药就十分关键。旧药新用是一个重要的方式,但是按照以往利用临床实验去寻求旧药新用的方式是十分耗时耗力的,所以现在多利用计算机技术先对药物做一个预选,这里就需要涉及到一些药物数据库,让我们了解现已有的药物信息以及药物与生物信息之间的联系。
这篇文章中的数据库主要就是针对生物信息和药物的数据。生物信息主要包括基因,蛋白质,RNA,LncRNA,表达数据,通路等,药物信息主要是单药,药物组合,西药,中药等。

一、蛋白质相关数据库 1.STRING数据库

网址:https://string-db.org/cgi/input.pl
STRING数据库十分便于获取蛋白质相互作用网络,即可以自己输入一组蛋白质,得到相互作用网络并可视化,也可以在DownLoad模块下载完整的蛋白质相互作用网络。同时其还有蛋白质功能富集分析的功能。

2.Uniprot数据库

网址:https://www.uniprot.org/
该数据库主要提供蛋白质的序列和功能等信息资源


3.DIP数据库

网址:http://dip.doe-mbi.ucla.edu
DIP数据库也主要是挖掘蛋白质相互网络数据的数据库,具体的可以参考论文《DIP:The database of interacting proteins》


4.HPRD数据库

网址:http://hprd.org/index_html
HPRD数据库全称为Human Protein Reference Database,它是专门存储人类蛋白质相互作用的数据库。


二、基因相关数据库 1.COXPRES db数据库

网址:https://coxpresdb.jp/
该数据库提供了11种动物基因共表达数据,并可以进行共表达网络可视化。


2.Coexpedia数据库

网址:http://www.coexpedia.org/
该数据库主要包含的也是基因共表达网络数据。


3.OMIM数据库

网址:https://omim.org/
人类孟德尔遗传病的数据库,主要关注人类变异基因和表型性状之间的关系。


三、RNA,ncRNA数据库 1.miRNA相关数据库

miRNA接触比较少,这里只简单列举一些数据库的名称,感兴趣的自己去搜索了解哦~

miRbasemiRDBmiRandaTargetScanmiRTarBase
2.ncRNA相关数据库

1.NPInter4.0

网址:http://bigdata.ibp.ac.cn/npinter4
该数据库中系统的收录了绝大多数种类非编码RNA(ncRNA)的相互作用,感兴趣可以参考论文《NPInter v4.0:An integrated database of ncRNA interactions》

2.chipBase
网址:http://rna.sysu.edu.cn/chipbase/index.php
研究转录因子结合位点和基序,从ChIP-seq数据中解码lncRNA,miRNAs、其他ncRNA和蛋白编码基因的转录调控网络。


四、通路数据库 1.KEGG数据库

网址:https://www.kegg.jp/
KEGG数据库中包含多个功能,里面有多个小的子数据库,最常用的是GENES数据库和PATHWAY数据库。GENES数据中主要包含基因组信息,PATHWAY数据库里包含生物系统中的通路信息,包含代谢,膜转运,信号传递,细胞周期等。另外其还可以链接到一些其他常用的大型生物信息数据库,感兴趣的这个数据库可以详细了解哦~


2.BioCyc数据库

网址:https://biocyc.org/
生物代谢途径数据库。


3.RegulonDB数据库

网址:http://regulondb.ccg.unam.mx/index.jsp
大肠杆菌K-12转录调控的主要数据库。


五、基因表达数据库 1.TCGA数据库

网址:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga
癌症基因组图谱,收录了各种人类癌症的临床数据,基因组变异,mRNA表达,miRNA表达,甲基化等数据,对于癌症研究是重要的数据来源。


2.CGGA数据库

网址:http://www.cgga.org.cn/
中国胶质瘤基因组图谱数据库,其中包含超过2000个样本的脑肿瘤数据集,包含图像基因组数据,单细胞测序数据,甲基化数据,mRNA测序数据,mRNA微阵列数据以及miRNA微阵列数据等。


3.GEO数据库

网址:https://www.ncbi.nlm.nih.gov/geo/
GEO是一个公共功能基因组学数据库,可以帮助用户查询和下载实验和精心策划的基因表达谱。


六、疾病与基因关联数据库 1.DISNOR数据库

网址: https://disnor.uniroma2.it/
以疾病为中心,探索和生成连接疾病基因的蛋白质相互作用网络。


2.DisGeNet数据库

网址:https://www.disgenet.org/home/
主要收录了与人类疾病相关的最大的公开可得的基因和变异。


3.GeneCards数据库

网址:https://www.genecards.org/
该数据库提供了所有注释和预测的人类基因,包括基因组,转录组,蛋白质组,遗传学信息。本人主要用于查找和特定疾病的相关基因。


4.Phenopedia数据库

网址:https://phgkb.cdc.gov/PHGKB/startPagePhenoPedia.action
基于疾病关联研究文章,针对疾病进行基因关键词的频次统计。


七、药物(化合物)数据库(西药为主) 1.FDA数据库

网址:https://www.fda.gov/
全称为食品药品监督管理局。是专门从事食品和药品管理的最高执法机关。一般获得FDA批准的药物是具有最高可信度的,它已经成为全球食品药品消费者心中的金刚盾牌。


2.DrugBank数据库

网址:https://www.drugbank.com/
DrugBank 将详细的药物数据和全面的药物目标信息结合起来,是一个真实可靠的生物信息学和化学信息学数据库。其中包含多种药物,营养品,实验药物等信息,还有与药物相关联的蛋白序列信息。


3.SIDER 4.1数据库

网址:http://sideeffects.embl.de/
该数据库包含了上市药品及其记录的药物不良反应的信息。


4.ChEMBL数据库

网址:https://www.ebi.ac.uk/chembl/
人工筛选的具有药物性质的生物活性分子数据库,将化学,生物活性和基因组数据结合在一起,以帮助将基因组信息转化为有效的新药。


5.PubChem数据库

网址:https://pubchem.ncbi.nlm.nih.gov/
世界上最大的免费化学信息收集网站,可以通过名称,分子式,结构和其他标识符搜索化学物质,查找化学和物理性质,生物活性,安全和毒性信息,专利,文献引用等。


6.药物组合数据库 DrugCombDB 网址:http://drugcombdb.denglab.org/mainDrugs.com 网址:https://www.drugs.com/eMedExpert 网址:https://www.emedexpert.com/DCDB 网址:http://public.synergylab.cn/dcdb/FDA 网址:https://www.fda.gov/
**注:**一般药物组合数据库里也都包含单药的信息 八、药物(化合物)数据库(中药) 1.CHEM-TCM数据库

网址:http://www.chemtcm.com/
传统草药中使用的植物的个体分子和成分的数据库。该数据库由化学鉴定、植物信息、针对常见西医治疗靶点的活性预测和根据中草药分类的分子活性预测四大部分组成。


2.中医资源网

网址:http://www.tcmdoc.cn/default.aspx


3.TCMID数据库

网址:http://www.megabionet.org/tcmid/
该数据库收集了中药的各个方面的信息,包括方剂、草药和草药成分,还收集了现代药理学和生物医学科学深入研究的药物、疾病的信息并将这两套独立的知识与药物靶点或疾病基因/蛋白质连接起来。


4.TCMSP数据库

网址:https://old.tcmsp-e.com/tcmsp.php
TCMSP是一个独特的中草药系统药理学平台,捕捉药物、靶标和疾病之间的关系。该数据库包括化学品、靶标和药物靶标网络、相关的药物靶标-疾病网络,以及天然化合物的药代动力学特性,包括口服生物利用度、药物相似性、肠上皮通透性、血脑屏障、水溶解度等。


九、药物(化合物)-基因(蛋白质)相互作用数据库 1.DrugBank数据库

网址:https://www.drugbank.com/
该数据库前面已经提过,获取药物-靶标信息也是十分的方便的。


2.TTD数据库

网址:http://db.idrblab.net/ttd/
TTD提供了已知和探索的治疗蛋白和核酸靶点、靶向疾病、通路信息以及针对每个靶点的相应药物信息的数据库。


3.BindingDB数据库

网址:http://www.bindingdb.org/bind/index.jsp
检索已知的以及被预测的化合物和蛋白质之间互作关系的平台。


4.STITCH数据库

网址:http://stitch.embl.de/
化合物-蛋白相互作用的数据库,包含了已知和预测的相互作用。


5.SwissTargetPrediction数据库

网址:http://www.swisstargetprediction.ch/
该数据库用于预测一个小分子的最可能的大分子目标,该预测是基于二维和三维相似性,以及来自三个不同物种的3000多个蛋白质上的37万个已知活性的文库。


十、其他数据库 1.DAVID数据库

网址:https://david.ncifcrf.gov/
主要用于基因symbol和基因ID之间的转换啦~其他功能有待学习。


2.NCBI数据库

网址:https://www.ncbi.nlm.nih.gov/
NCBI给分子生物学家提供了一个信息存储和处理的系统,里面包含了多个功能的数据库,提供了多功能强大的数据检索和分析工具。


总结

这里只总结了本人在磕盐道路上所接触到的数据库,当然总结的还不是很全面,也在不断的补充中~上述数据库中,就本人的经验来说,比较值得学习的有NCBI,FDA,Drugbank,KEGG等。第一篇文章有很多不足之处还请童鞋们多多指教啦,后面有时间也会更新一些其他的干货滴!

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。