商城首页欢迎来到中国正版软件门户

您的位置:首页 > 业界资讯 >腾讯AI Lab在国际顶级期刊发表三篇蛋白质组学论文,为生命科学研究提供关键技术参考

腾讯AI Lab在国际顶级期刊发表三篇蛋白质组学论文,为生命科学研究提供关键技术参考

  发布于2024-12-19 阅读(0)

扫一扫,手机访问

腾讯AI Lab 3篇蛋白质组论文入选国际顶级期刊,为阐释生命提供重要技术参考

编辑 | ScienceAI

只有蛋白质组才能从根本上阐释生命。

3月20日,腾讯AI Lab实验室的3篇蛋白质组论文相继被国际顶级学术期刊接受发表。这些论文分别探讨了蛋白质组的检测、分析和发现,提出了全新的研究方向。这些研究成果为揭示生命的奥秘提供了重要的技术支持,有助于推动人类对生命机制的深入理解。

科学界曾经认为,只要绘制出人类基因组序列图,就能了解疾病的根源,但事实并非如此。相同的基因往往有不同的表达,比如,人体不同组织器官的基因组是一样的,但是各个组织器官的蛋白质组不完全一样。人和鼠的基因组的差别仅为1%,但是其形态、性状差别非常大,这就是蛋白质组不一样的体现。

贺福初院士曾用一个生动的比喻来描述基因组和蛋白质组之间的关系,就好比词典和文章、元素表和化工厂之间的关系。他指出,基因组学中微小的差异在蛋白质组学中可以被放大成千倍甚至近万倍。这表明要彻底揭示生命的奥秘,必须从蛋白质组的角度去寻找答案。因为蛋白质是生物体内最重要的功能分子之一,它们承担着各种生物学过程的关键角色,包括细胞信号传导、代谢调控、结构支持等。 通过对蛋白质组的研究,科学家

蛋白质组学是指大规模地对蛋白质的表达水平、翻译后修饰、蛋白质相互作用等进行研究。 针对蛋白质组的研究不仅可以全景式地揭示生命活动的分子本质,还能阐明生命在生理或病理条件下的变化机制。蛋白组学测序技术发展迅速,相应的数据分析计算方法也方兴未艾。对此腾讯AI Lab从数据库、AI建模和AI辅助临床分析三个角度,通过AI技术助力蛋白组学研究。

首次推出世界数据量最大单细胞蛋白组数据库

目前,蛋白质组学研究已经发展到了单细胞层面。单细胞蛋白质组学技术的出现使得我们能够直接测定单个细胞中的蛋白质含量,从而提供了关于细胞表型的宝贵信息,这种信息是传统转录组分析无法提供的。然而,目前的挑战之一是缺乏足够的大规模集成数据库,这限制了研究人员获取和挖掘单细胞蛋白质组数据的能力,从而阻碍了该领域的进步。因此,建立更加完善的数据资源和数据库,促进数据共享和集成,将是推动单细胞蛋白质组学研究向前发展的关键因素。

为了填补这一不足,腾讯 AI Lab提供了一个综合性的数据库,即单细胞蛋白质组数据库SPDB(https://scproteomicsdb.com/),该数据库详细展示了单细胞蛋白质组数据,当前版本包括133个基于抗体的单细胞蛋白质组数据集,涉及超过3亿个细胞和超过800个标记/表面蛋白质,以及10个基于质谱的单细胞蛋白质组数据集,涉及超过4000个细胞和超过7000种蛋白质。

SPDB目前已经发展成为全球最大的单细胞蛋白组数据库,覆盖范围广泛,技术先进。它提供了标准化的数据处理和易于使用的网络界面,用户可以通过数据集级别和蛋白质级别的搜索和探索功能,深入了解蛋白质组学。这一数据库为科学家提供了重要的数据参考,帮助他们更深入地研究蛋白质组学领域。

腾讯AI Lab 3篇蛋白质组论文入选国际顶级期刊,为阐释生命提供重要技术参考

(图片来源:https://academic.oup.com/nar/article/52/D1/D562/7416372)

该技术可以供生命科学工作者和医生对世界上最全的单细胞蛋白组进行数据探索,也可以供生物信息和AI科学家对单细胞蛋白组提供更多的算法和工具,从而促进该领域的科学新发现和工具开发。本论文《SPDB: a comprehensive resource and knowledgebase for proteomic data at the single-cell resolution》也因此入选生物信息学领域数据库方面专业期刊Nucleic Acids Research。

全新的多功能算法,提升单细胞蛋白质组测序分析准确率

和基因检测类似,要研究蛋白质组,需要精准的检测技术。目前蛋白组学检测技术已经发展至单细胞分辨率。单细胞蛋白质组学测序技术,为揭示细胞中蛋白质-蛋白质相互作用、翻译后修饰和蛋白质形态动态的研究带来了新的启示。然而,肽段定量的不确定性、数据缺失、严重的批次效应和高噪声,阻碍了单细胞蛋白质组数据的准确分析和使用。

腾讯AI Lab研究人员提出了一种新颖的多功能算法scPROTEIN,它由基于多任务异方差回归模型的肽段不确定性估计,以及基于图对比学习设计的单细胞蛋白质组数据分析的细胞嵌入学习组成。scPROTEIN在一个统一的框架中估计了肽段定量的不确定性,去噪了蛋白质数据,消除了批次效应,并编码了单细胞蛋白质组特异性嵌入。该方法为首个针对单细胞蛋白组表征的框架,创造性解决了单细胞蛋白组学数据的特殊挑战。

随着单细胞蛋白组检测技术在生命科学和精准医疗领域的普及,该方法可以作为数据处理中重要的步骤,为基于单细胞蛋白组的肿瘤发生发展机制研究、药物靶点发现和肿瘤早筛和微环境研究提供重要的AI辅助作用。基于这项技术的《scPROTEIN:A Versatile Deep Graph Contrastive Learning Framework for Single-cell Proteomics Embedding》论文也入选Nature旗下方法学专业期刊Nature Methods。

腾讯AI Lab 3篇蛋白质组论文入选国际顶级期刊,为阐释生命提供重要技术参考

(图片来源:https://www.nature.com/articles/s41592-024-02214-9)

全新的反卷积方法,助力肿瘤辅诊和预后分析

同样入选Nature旗下专业期刊Nature Machine Intelligence的还有《Deep domain adversarial neural network for the deconvolution of cell type mixtures in tissue proteome profiling》,这篇论文从更为宏观的角度来分析特定组织中不同细胞类型的比例。例如,常用于分析肿瘤组织样本中不同细胞类型,该方法已经广泛适用于肿瘤微环境解释和临床诊断/分类等领域。

过去蛋白组学研究产生大量的数据,这些数据是组织中所有细胞的平均值,难以直接反映不同类型细胞的比例,而细胞比例对于肿瘤微环境分析较为重要。对此,腾讯AI Lab研究人员以单细胞蛋白组为参考,基于AI方法对现有的组织蛋白组数据进行反卷积(一种数学方法),从组织蛋白质组数据中挖掘出细胞类型比例这一新信息,应用大量现有的蛋白组数据,获取其中的肿瘤微环境信息,助力肿瘤辅诊和预后分析。

这种专为组织蛋白质组数据设计的基于深度学习的反卷积方法(scpDeconv),使用自动编码器利用整体蛋白质组数据的信息,从而提高单细胞蛋白质组数据的质量,并采用领域对抗模型来连接单细胞和整体数据分布,将标签从单细胞数据迁移到整体数据。大量实验验证了scpDeconv在反卷积来自不同物种/来源和不同蛋白质组技术产生的蛋白质组数据方面的性能。该方法是首个针对蛋白组进行反卷积的算法,解决了蛋白组独特的数据挑战。

腾讯AI Lab 3篇蛋白质组论文入选国际顶级期刊,为阐释生命提供重要技术参考

(图片来源:https://www.nature.com/articles/s42256-023-00737-y)

上述三篇论文分别展示了腾讯AI Lab为解决蛋白组学中数据库、AI建模和AI辅助临床分析问题而进行的一系列探索,为高效精准分析蛋白组数据、理解肿瘤微环境和发现生物学新机制打下坚实基础。

腾讯AI Lab在AI for Science特别是生命科学领域深耕数年,具有丰富的知识和技术积累,研究领域包括单细胞多组学、蛋白质结构设计、蛋白质折叠、AI制药、空间组学和免疫组库等,已发表scBERT和猕猴大脑图谱等研究成果。腾讯AI Lab成立于2016年,实验室强调研究与应用并重发展,以“学术有影响,工业有产出”为目标,基于扎实的学术研究,将AI能力运用在游戏、内容、虚拟人以及医疗、医药、基因计算等多个场景中。

论文链接:

https://academic.oup.com/nar/article/52/D1/D562/7416372
https://www.nature.com/articles/s41592-024-02214-9
https://www.nature.com/articles/s42256-023-00737-y

参考文献

[1] Wang F, Liu C, Li J, et al. SPDB: a comprehensive resource and knowledgebase for proteomic data at the single-cell resolution [J]. Nucleic Acids Research,  2024, 52(D1): D562-D571.
[2] Wang F, Yang F, Huang L, et al. Deep domain adversarial neural network for the deconvolution of cell type mixtures in tissue proteome profiling[J]. Nature Machine Intelligence, 2023, 5(11): 1236-1249.
[3] Li W, Yang F, Wang F, et al. A Versatile Deep Graph Contrastive Learning Framework for Single-cell Proteomics Embedding[J]. Nature Methods, 2024. 
本文转载于:https://www.jiqizhixin.com/articles/2024-03-20-9 如有侵犯,请联系admin@zhengruan.com删除

热门关注