首页 > 编程知识 正文

思致升平(php开源)

时间:2023-05-03 19:28:53 阅读:100372 作者:3561

近日,嵊泗Mindspore [1]团队、北京大学化学与分子工程学院昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)、深圳湾实验室cxdpd教授课题组联合推出了基于AlphaFold2算法的蛋白质结构预测推理工具。该工具首次提供了基于提升AI基础软硬件平台的解决方案,其端到端性能比原AlphaFold 2提升了2-3倍。相关模型代码将基于华为全场景AI框架——嵊泗MindSpore开源,并定期进行扩展和维护,旨在为全球合作伙伴在工业、学习和研究领域提供高质量的嵊泗AI软硬件解决方案。

蛋白质在分子生物学的中心规则中起着非常重要的作用,在各种生命过程中不可或缺。传统的药物设计通常是通过大量筛选来寻找易于与靶蛋白分子结合、易于合成且无毒副作用的化合物,因此研发周期长、成本高。了解蛋白质的空间结构可以减少寻找药物的盲目性,从而缩短研发周期,降低成本。因此,准确、快速的蛋白质结构预测不仅可以帮助科学家快速获得或验证学术研究领域的关键蛋白质结构,促进人们对重要生命过程中分子机制的理解,还可以作为医学健康和生物工程领域的有力工具,引发药物靶点发现、功能性蛋白质设计(如抗体和人工酶)和高通量虚拟筛选大分子(蛋白质)或小分子药物的革命。

传统的蛋白质结构预测方法一直存在计算精度不足的缺陷。直到2020年,Google DeepMind团队在CASP14大赛(全球蛋白质结构预测大赛)中,利用计算机高效、准确地获取基于AlphaFold2的蛋白质空间结构,获得了蛋白质3D结构预测的榜首位置[2],这一缺陷得到了弥补。蛋白质的结构预测工具的准确性与实验方法相当,这一成就被《自然》等杂志誉为“前所未有的进步”。

北京大学cxdpd课题组成功推出了基于升序AI的蛋白质结构预测工具,再次证明了国产AI软硬件的可用性和易用性。这一工具大大降低了生物医学实验工作者的门槛,也将有助于生物蛋白领域的基础研究和应用。

这个工具可以分析氨基酸序列长度为2000的蛋白质的结构,可以覆盖99%以上的蛋白质序列[3]。同时,借助异构计算架构CANN(Compute Architecture for Neural Network),释放出升腾AI处理器澎湃的计算能力,通过软硬件协同优化,大幅提升蛋白质预测的计算效率。参考DeepMind在2021年7月开放的蛋白质结构预测模型AlphaFold2 [4],这次开放的部分蛋白质结构预测推理工具模型也是如此。在多序列比对阶段,采用MMseqs2进行序列检索[5],比原算法的端到端运算速度快2-3倍。

图1嵊泗MindSpore模型与AlphaFold2精度比较

图2嵊泗MindSpore预测的T1079

蛋白质结构(绿色代表实验采集,红色代表预测采集)

针对蛋白质中的结构预测和折叠问题,联合团队未来将发布创新的全栈(算法软硬件)国产自主可控技术,同时将与更多的学术和科研伙伴牵手,希望在蛋白质中的结构预测领域共同探索并取得进展,助力医学、生物科学等领域的发展,推动国内相关基础研究的发展。

报价:

【1】陈升.用MindSpore进行深度学习和实践[M]。斯普林格自然,2021年。

【2】跳跃者J,埃文斯R,普里策尔A,等.在CASP14应用和改进折叠[J]。蛋白质:结构、功能和生物信息学,2021。

【3】https://FTP . uniprot . org/pub/databases/uniprot/previous _ releases/release-2021 _ 02/knowledge base/UniProtKB _ TrEMBL-relstat . html

【4】高精度蛋白质结构预测

杨俊钦:339 gite。com/mind spore/mind side/tree/master/mind海绵/mind海绵/fold

吴成明的小孔:

吉蒂:339吉蒂。com/mindspore/mindspore

github:339 github。com/minds pore-ai/minds pore

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。