使用MaxLynx精确、高覆盖率地鉴定化学交联肽段

大家好,本周为大家分享一篇发表在Anal. Chem.上的文章,Accurate and Automated High-Coverage Identification of Chemically Cross-Linked Peptides with MaxLynx,该文章的通讯作者是德国马普所的 Jürgen Cox 教授。

交联质谱 (XL-MS) 能够提供有关蛋白质三维 (3D) 结构及蛋白质间相互作用 (PPIs) 的丰富信息。本文介绍了 MaxLynx ,一种集成到 MaxQuant 环境中的,用于 XL-MS 的计算蛋白质组学工作流程,它同时适用于质谱不可断裂和质谱可断裂的交联剂。此前,已经推广了 Andromeda 肽段数据库搜索引擎[1],以有效地进行蛋白质组学鉴定。在此基础上,对于不可断裂的交联肽,本文应用了一种新的双肽 Andromeda 评分,这是计算效率高的 N 平方搜索引擎的基础;对于质谱可断裂的交联剂,MaxLynx将标志峰得分与碎裂产物上的传统 Andromeda 得分相结合。此外,文章通过优化 MaxQuant 3D 峰值检测,以更加准确地鉴定交联产物。在合成肽的基准数据集上,MaxLynx在以上两种类型的交联剂上的数据和黑腹果蝇细胞断裂物的交联蛋白质组数据集上均优于所有其他测试软件。该工作流程还支持离子淌度增强的质谱数据。MaxLynx可在https://www.maxquant.org/.上免费获得。

XL-MS 肽段鉴定算法可以根据其支持的交联剂的类型进行细分,如质谱可断裂 (MS-cleavable) 交联剂和质谱不可断裂 (noncleavable) 交联剂的检索算法。质谱不可断裂的交联剂在质谱分析期间保持了它的完整性,而质谱可断裂的交联剂由于其不稳定键而容易发生断裂。由于 N 平方问题[2,3],质谱不可断裂的交联剂通常应用于较小的蛋白质或蛋白质复合物,而质谱可断裂的交联剂可以实现在整个蛋白质组范围内 XL-MS 的应用。

本文使用了由质谱不可断裂的交联剂和质谱可断裂的交联剂获得的交联合成肽数据集评估了MaxLynx,并将其性能与市面上的其他几个软件进行了比较。结果显示,在 1% 的错误发现率 (FDR) 下,MaxLynx 在质谱不可断裂的交联剂和质谱可断裂的交联剂数据集上的表现都优于其他软件。此外,文章还进行了一项复杂的全蛋白质组研究,并将其与 MeroX 已发表的结果进行了比较。结果显示,MaxLynx再次报告了更多的 CSM 以及更多独特的交联肽段。

MaxLynx 工作流程

MaxLynx 的算法在保留了大部分 MaxQuant 工作流程的基础上,加入了针对交联肽段的检索功能(图 1a)。此外,新颖的峰值优化功能(图 1b)可以改善由于噪声而导致的交联肽段的错误识别。根据所应用的交联剂是否为质谱可断裂或质谱不可断裂,使用两个专门的搜索引擎中的一个来进行检索(图 1c)。

图1 MaxLynx的工作流程

(a)MaxLynx主要算法步骤的简化框图。灰色的步骤与常规肽检索MaxQuant的工作流程保持不变,而蓝色的步骤是为交联搜索而新开发的。

(b)新添加的峰值优化功能,目的是“修复”由于噪音而没有很好地鉴定的峰。

(c)质谱可断裂或质谱不可断裂交联剂的检索模式。

质谱不可断裂的交联肽段检索

MaxLynx 为质谱不可断裂的交联肽段生成一个完整的搜索空间,并在其中执行详尽的搜索。第一步是根据 Andromeda 搜索设置生成初始肽,然后通过组合所有推定的肽来构建搜索空间。交联空间构建后的第二个主要步骤是 MS/MS 交联搜索,即将实验 MS/MS 谱图的前体质量与索引质量进行比较,当索引质量等于一定容差内的实验前体质量时,将生成理论交联肽谱。

质谱可断裂的交联肽段检索

在质谱分析过程中,可断裂的交联剂经过碎片化,将产生两个带有部分交联剂的肽段(图 1c)。两个肽中较长的用希腊字母 α 表示,较短的用 β 表示。因此,可断裂的交联剂通常会在质谱中生成具有特定质量差异(Δm)的特征双峰信号,也称为特征峰。在 MaxLynx 中,连续应用了三种方法来检测特征峰,即 ①严格质量差法、 ②最高强度法,和 ③放宽标准的质量差法。对于 MS/MS 谱图中的两对特征峰,严格质量差方法取决于观察同一条肽上断裂的交联剂剩余部分的长和短版本之间的质量差异(Δm)。最高强度方法检查 MS/MS 谱图中最高强度的峰是否可以解释为特征峰之一,而无需存在其他特征峰。在具有宽松标准的质量差方法中,只需要一对特征峰。在严格的质量差方法中,目标是找到所有四个特征峰,为此,该算法循环遍历 MS/MS 谱图中大于用户可定义的最小质量的所有峰,并假设它是具有较短交联剂残基的β -肽 (βs) 。然后,检查是否存在剩余相应的三个特征峰,它们分别是具有较长交联剂残基的 β -肽 (βl) 和两种形式的较长肽 ( αs 和 αl ),其质量由下式给出:

其中 mp 为交联肽段的前体离子质量。严格的质量差异法的一个缺点是必须观察到四个特征峰。然而,并非所有这些都存在于谱中。此外,还可能存在同源二聚体肽,这意味谱图中仅存在有两个特征峰。为了克服这个问题,该算法实施了第二步,即根据最高强度峰选定特征峰。只要严格的质量差异法找不到解决方案,就会执行此操作。这里的假设是,特征峰属于最强峰。对于每个最强峰,假设它携带较长或较短的交联剂残基。如果上述两种方法都没有找到 MS/MS 谱图的候选肽解释,则算法将使用放宽标准的质量差异法进行第三轮,即只要找到具有特征质量差异的一对峰即可。

合成交联肽库的基准测试

本文重新分析了几个公开可用的数据集。对于质谱不可断裂的交联剂数据集,与其他算法相比,MaxLynx 在 FDR = 1% 时报告的 CSM 数量最多,平均有 852 个正确和 12 个错误 CSM(图 2)。同时,MaxLynx 报告的独特交联肽段的数量也多于其他软件(平均 230 个)。在质谱可断裂的交联剂数据集上,与其他搜索引擎(MeroX、XlinkX)相比, MaxLynx 报告在 FDR = 1% 时正确交联的数量最多,其中有 185 个正确的和 3 个不正确的独特交联肽段(图 3)。

图2 MaxLynx与其他交联搜索引擎在质谱不可断裂的交联剂数据集上的比较

(a)显示CSM的数量

(b)显示FDR=1%的独特交联肽段的数量。

图3 MaxLynx与其他交联搜索引擎在质谱可断裂的交联剂数据集上的比较

(a)和(b)分别显示了FDR = 1 % 时的DSBU和DSSO数据集的独特交联肽段的数量。

蛋白质组范围内的MS-可断裂交联剂数据的基准测试

接下来,本文评估了 MaxLynx 分析大规模蛋白质组范围的交联数据集的能力。为此,文章重新分析了与 DBSU 交联的黑腹果蝇胚胎提取物的 PRIDE 数据集 PXD012546,并与已发表的结果进行了比较。在 FDR = 1% 时, MaxLynx 报告了总共 48,019 个 CSM 和 9035 个独特交联肽段,超过了 MeroX 最初报告的数量,在使用相同设置的情况下。虽然鉴定结果的三次生物学重复之间的重现性是 20%(图 4a),但正如 Götze 等所指出的,这种观察的原因可归因于实验和生物学条件[4]。接下来,文章考察了 MaxLynx 和 MeroX 软件之间重叠的独特交联肽段的数量,并观察到大约 42% 的独特交联肽段在这两者之间同时存在(图 4b)。

图4 在大规模蛋白质组全交联搜索中,三次生物学重复的独特交联肽段的重叠

(a)大规模交联试验分三次重复进行,并显示了绝对值和百分比。

(b)比较了MaxLynx和MeroX的独特交联肽段的总数。

离子淌度增强数据

文章还考察了 CCS 值如何作为不同类型的交联产物的分子质量的函数(图 5)。结果所示,与线性肽相比,交联肽往往具有更高的 CCS 值以及更高的电荷状态和更高的质量。

图5 timsTOF数据集的CCS值,CCS值与分子质量相对应

针对DSBU的结果(a)。针对DSSO的结果(b)。

重新处理中等大小的蛋白质复合物数据集

最后,文章重新分析了一个中等大小的复杂数据集(PXD013947),结果表明,MaxLynx在此数据集上的表现依然很好。MaxLynx和pLink2的CMS数分别为2542和2335,独特交联肽段总数分别为315和287。从这些独特的交联中,MaxLynx报告了120个蛋白间的交联,而pLink报告了94个。独特交联肽段之间的重叠程度为60%。

综上所述,MaxLynx 是一种新的 XL-MS 计算工作流程,已集成到 MaxQuant 软件中。本文展示了 MaxLynx 在 FDR = 1% 时优于检索质谱不可断裂的交联剂和质谱可断裂的交联剂数据集的其他软件。同时,它也适用于具有离子迁移淌度增强的数据集。除此之外,MaxLynx的成功还归于新添加的峰值优化功能。虽然,三次生物学重复之间的交联重叠百分比尚不理想,但这可以通过更好的采集策略和进一步的实验优化来克服,例如引入交联肽的匹配运行,以及对此类样本应用数据独立采集的方法。

参考文献

(1)Cox, J.; Neuhauser, N.; Michalski, A.; Scheltema, R. A.; Olsen, J. V.; Mann, M. J. Proteome Res. 2011, 10, 1794−1805.

(2)Liu, F.; Heck, A. J. Curr. Opin. Struct. Biol. 2015, 35, 100−108.

(3)Maes, E.; Dyer, J. M.; McKerchar, H. J.; Deb-Choudhury, S.; Clerens, S. Expert Rev. Proteomics 2017, 14, 917−929.

(4)Götze, M.; Iacobucci, C.; Ihling, C. H.; Sinz, A. Anal. Chem. 2019, 91, 10236−10244.


文章内容来自网络,如有侵权,联系删除、联系电话:023-85238885

参与评论

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

评论区