文献解读 | 摄入淀粉反而利于减肥!上交医学院近20分肠道微生物+代谢组学Nature子刊文章,揭示维持健康体重新方案
之前为大家介绍了二代蛋白质组学(NGP)的优越性(详情请见:颠覆传统 | 三黍生物Astral DIA蛋白质组学产品重磅发布)。最新Orbitrap Astral仪器更高灵敏度、覆盖度、精确度的“三高”属性成为蛋白质组学新风向。Astral的出现也使蛋白质组学进入百元低价时代,我们该如何抓住机会赶上这趟车?
三黍生物新一代Astral系列检测服务已全面上线,技术细节及研究经验分享群开放中,对领先蛋白组技术感兴趣的老师们可扫码进群交流:
更多实测数据和产品信息,欢迎后台咨询~
由于目前使用Astral质谱仪进行蛋白质组学分析的文献还较少,很多小伙伴表示了兴趣,却不太清楚如何将这一新技术用于自己的课题。今天就从一篇结合衰老、蛋白质组学时钟等前沿热点的一区文献来为大家介绍如何将深度蛋白质组学技术用于疾病研究。
背景
随着年龄增长,人类大脑会逐渐衰老,患神经退行性疾病的可能性也会增加,而了解衰老期人类体液中蛋白质组的变化可能会为神经退行性疾病的治疗提供新的治疗方案。为此,筛选生物体年龄相关的标志物对了解衰老的机制及确定干预措施来逆转或延迟衰老都是非常重要的。
2024年6月24日,发表在Aging Cell(IF 8.0)上的题为“An interpretable machine learning-based cerebrospinal fluid proteomics clock for predicting age reveals novel insights into brain aging”的文章,由于脑脊液样本很容液通过腰椎穿刺获得,且可以更真实地反应大脑衰老的情况,作者在本研究通过对人类脑脊液(CSF)的蛋白质组学数据深入挖掘,利用机器学习的方法,开发出一个可以预测中枢神经年龄的模型。
脑脊液
蛋白质组学、机器学习
图1 技术路线
作者检测了437个临床痴呆症评级(CDR)为0即认知正常的不同年龄和种族的队列样本,该队列的脑脊液样本利用蛋白质组学技术共鉴定到7008种蛋白质。作者对蛋白质组学数据使用机器学习算法预测,得到一个1157种蛋白质模型来预测年龄(图2)。图2a显示了经训练的模型对年龄的预测(y轴)与验证队列中88名个体的实际年龄(x轴)。该模型的预测显示,与CSF提取时的实际年龄高度一致,Pearson相关性为0.85,平均估计误差为3.94年。
然后,在阿尔茨海默病(ADNI)的另外735名参与者的CSF蛋白质组上验证了训练后的模型。该模型在该队列中继续表现良好,Pearson与实际年龄的相关性为0.79,MAE为4.30(图2b)。
最后作者创建了一个由44名确认为淀粉样蛋白-β阴性和认知正常的个体组成的亚群,在这个亚群上验证了我CSF衰老模型,并获得了与整个队列相似的结果,Pearson相关性为0.81,MAE为4.85(图2c)。
这一验证证实了该模型从CSF蛋白质组学预测年龄的能力。
图2 通过CSF蛋白质组学弹性网络模型预测年龄与时间顺序年龄
为了了解队列中CSF蛋白如何随年龄变化,作者使用p<0.0001作为显著性阈值,对数据中所有蛋白质的含量进行了Spearman与年龄的相关性分析。结果,在7008个可能的蛋白质特征中,2117个蛋白质特征(30%)与年龄显著相关(图3a)。其中,机器学习模型使用了340种与年龄相关的蛋白质(图3b)。图3c显示了与年龄显著相关的前10个蛋白质。
图3 蛋白质通过斯皮尔曼相关性随年龄而显著变化
为了研究CSF中的哪些蛋白质可以预测衰老,作者从弹性网络中提取特征,并根据模型权重对其进行排序,这表明每种蛋白质对最终预测的影响有多大。正值表示较高的蛋白质浓度预示着年龄的增长,而负值表示较高的浓度预示着更年轻的状态。在7008种总蛋白质中,1157种被该模型用于预测衰老,589种蛋白质具有正值,而568种蛋白质具有负值。表1总结了从模型中提取的前10个蛋白质。
预测年龄增加的蛋白质主要有神经元损伤的生物标志物丙氨酸氨基转移酶1(ALT)、神经丝重肽(NFH),神经炎症标志物白细胞介素-7(IL-7)、粘附G蛋白耦合受体G1(GPR56),抗白蛋白酶(SLPI),肺表面活性剂相关蛋白D(SP-D)等。
预测年龄减小的蛋白质主要有抗炎和新陈代谢调节蛋白的丢失,比如补体C1q肿瘤坏死因子相关蛋白3(C1QT3),转录后修饰蛋白的丢失,比如GGPPS等。
表1 通过脑脊液蛋白质组学模型用于预测年龄的蛋白质
为了进一步了解CSF中年龄预测性蛋白质变化的生物学影响,作者对模型所用蛋白质的进行了通路富集。在该分析中使用了所有1157个蛋白质特征,并使用整个7008个可能的蛋白质集作为背景。Metascape总共发现了七种非冗余途径,在这些途径中,模型中的蛋白质显著富集(p<0.01)。表2中提供了富集途径和每种途径中富集的蛋白质的列表。主要有糖蛋白激素、补体系统、A类受体清除、非整合蛋白膜结合的细胞外基质蛋白及其配体之间的蛋白质相互作用、TP53调节死亡受体和配体的转录、线粒体脂肪酸不饱和脂肪酸的β氧化。
表2 模型蛋白的通路富集
除了完整的1157蛋白质模型外,作者还开始使用尽可能少的蛋白质构建模型,同时保持准确性。通过对模型的不断训练,绘制了每个模型的Pearson相关性图(图4a)。模型准确度在109种蛋白质附近急剧下降,109种蛋白质模型(Pearson 0.84,p=1.13E-24)(图4b)在ADRC测试数据上的表现几乎与完整1157种蛋白质模型一样好(Pearson0.85,p=2.79E-25)(图2)。
为了在另一个队列中验证109蛋白模型,在整个ADNI队列(Pearson 0.75,p=6.49E-132)(图4c)和经验证为淀粉样蛋白β阴性和认知正常的ADNI参与者子集(Pearson0.83,p=4.48E-12)(图4d)上运行预训练模型。然后从模型中提取顶部蛋白质特征(图4e),并将全部109个蛋白质特征用于通路分析。值得注意的是,来自全模型富集的所有途径的代表都存在于109蛋白模型富集的途径中。这些蛋白质可能含有足够的年龄预测信息。
图4 最小预测模型
图5 CSF衰老模型在具有淀粉样蛋白斑块的认知正常(CDR = 0)组预测能力良好
综上所述,本研究提出了一种新的基于CSF蛋白质组学的模型,它可以预测生物衰老,并为中枢神经系统的衰老生物学提供了新的见解。这些发现和工具可能为干预衰老和年龄相关疾病提供潜在的治疗靶点。
三黍生物全面上线新一代Astral系列检测服务!
相关研究文献解读,本公众号持续更新中……
如果您有蛋白组学检测分析需要,欢迎联系我们了解实测数据和更多产品信息!
更多推荐:
文献解读 | 中药文章提分思路大公开!福州市第二医院IF 6.7代谢+网络药理,多组学+简单实验方法立马学会
排版:野凌
审核:三黍生物企宣部