血浆作为疾病预测、诊断、预后和分层的重要资源,其蛋白质组具有阐明生理和病理机制的潜力。利用质谱(MS)技术,血浆蛋白质组学已在多个疾病领域发现生物标志物,如癌症、肝病、心血管疾病等。然而,血浆中动态范围广泛和高丰度蛋白质(HAP)的存在为全面探索血浆蛋白质组带来了挑战。
高峰度蛋白去除方法被广泛用于增加血浆蛋白质组的覆盖率,然而,在大规模的生物标志物的研究中发现了一些问题,包括有限的通量,高成本,重现性差。氨探生物开发了互补的高峰度蛋白亲和去除耗尽法(depletion)和沉淀法(precipitation),该方法具有通量高、成本低、重现性好的特点,提高生物标志物发现的效率和经济性(图1)。
图1:使用耗尽法(A)和沉淀法(B)在96孔板中处理的高通量和深度血浆蛋白质组学工作流程
HAPs去除推荐使用10 µL血浆和400 µL beads。然而,DIA-MS质谱分析具有较高的灵敏度,我们决定将血浆量减至1 µL,并扩大beads使用范围至40µL、60µL、80µL、100 µL。使用1 µL血浆作为初始样本,在耗尽过程中成功获得12 µg血浆蛋白,并在酶解后回收了10 µg血浆肽段。与其他bead体积相比,使用40µL beads处理1 µL血浆可鉴定相同数量的肽和蛋白质(图2A,且在所有定量蛋白质的强度总和上表现更佳(图2B),并具有更好的重现性(图2C)。过量beads会导致非特异性吸附增多,从而降低了蛋白质鉴定的数量和强度。因此,我们确定使用40µL beads是最佳选择。
图2:耗尽法的优化
(A)鉴定的肽和蛋白 (B)蛋白强度,(C)肽段CV分布
在优化耗尽方法后,进一步优化沉淀方法,以50 µL血浆为起始点。沉淀效果受化学品组成影响,调整两种沉淀剂的浓度(20% TCA和0.25M HCl),以及在沉淀前使用尿素和DTT溶液进行蛋白质变性。研究发现与Urea-HCl相比,Urea-TCA处理后肽和蛋白质数量更多(图2D)。Urea-TCA法的最佳血浆量为50µL,产肽量为1.8 ~ 9.3µg,增加血浆体积并不能增加肽和蛋白的鉴定数目(图2E)。用50µL的TCA进行沉淀效果最好,因为更大的体积会减少鉴定的肽和蛋白的数量。因此,确定血浆、尿素与TCA的最佳配比为1∶1∶1。
图2:沉淀法的优化
(D) 用尿素-TCA和尿素-HCl法鉴定50µL血浆中的肽和蛋白质。
(E) 用尿素-TCA法鉴定50µL和100µL血浆中的肽和蛋白质。
(F)用50 µ L变性缓冲液从50 µL血浆中鉴别肽和蛋白质,然后用50、100或200µL 20% TCA沉淀。
3、最佳上样量的优化
上述两种方法有效消除了大部分HAP,但仍有残留。通过DIA-MS全面分析了63 ng至2 µg肽段量以建立MS定量的线性,证明1 µg肽在线性范围内。随着进样量增加,肽段和蛋白质鉴定结果呈上升趋势,1 µg和2 µg时达到平稳(图3A-B和图3D-E)。计算了三次进样的肽和蛋白质强度的变异系数(CV)以评价MS分析重现性,耗尽样品中1 µg和2 µg进样的CV小于10%或20%的肽和蛋白质数量相等;沉淀样品中1 µg进样的CV小于10%或20%的数量大于2 µg进样(图3A-B,图3D-E)。对不同上样量的肽段强度总和的评估表明,耗尽样品和沉淀样品的肽段强度呈线性趋势(图3C和F)。最终确认1 µg上样量为可靠鉴定和定量重现性的最有效上样量。
图3:不同上样量的线性。
上样量为63 ng、125 ng、500 ng、1000 ng和2000 ng的耗尽样品(A-C)和沉淀样品(D-F)的肽段、蛋白质鉴定和总肽段强度。
4、耗尽法和沉淀法的对比和整合
在优化耗尽和沉淀方法后,对三种血浆制备方法进行了比较分析。未耗尽的血浆含有8207种肽和778种蛋白质;沉淀的血浆鉴定了7792种肽和802种蛋白质;耗尽的血浆结果最全面,含有15186种肽和1510种蛋白质(图4A)。耗尽法在所有MW区段中鉴定的蛋白质数量最多,包括包括370个低分子量蛋白和1125个中等分子量蛋白(图4C)。相比之下,沉淀法鉴定的蛋白质较少。未耗尽血浆中的前20种蛋白质在经过耗尽或沉淀处理后显著减少,尤其是血清白蛋白的比例下降。耗尽法单独鉴定了687种蛋白质,而沉淀法鉴定了254种。综合两种方法,共鉴定了1794种蛋白质(图4B)。
图4:耗尽、沉淀血浆与未耗尽血浆的比较。
将各样品一式三份进样至LC-MS。“×”表示在该方法中未检测到的蛋白质。
使用耗尽和沉淀方法测量的蛋白质动态范围约6个数量级(图5A),匹配HPPP Build 2021-07蛋白绝对浓度数据集,得到315种蛋白质浓度低于1 ng/mL,其中耗尽方法检测到188种,沉淀方法检测到127种。在1-10 ng/mL范围内检测到397种蛋白质,10-1000 ng/mL范围内发现583种蛋白质(图5B)。此外,将鉴定到的蛋白与多个数据库的血浆蛋白数据进行匹配,共识别出999种蛋白质,其中775种蛋白来自Olink Explore 3072,与炎症、心脏代谢疾病相关(图5C)。使用综合耗尽和沉淀方法,每个功能类别中的蛋白质与未耗尽方法显着增加了1-4倍(图5D)。这些发现证明了耗尽和沉淀方法在扩大其覆盖更广泛的重要功能蛋白质类别的能力方面的内在优势,从而促进了对血浆蛋白质组的更深度的分析。
图5:优化血浆蛋白质组学方法的动态范围和灵敏度。
(A)耗尽法和沉淀法的动态范围。(B)在耗尽方法中鉴别的不同估计浓度范围内和仅在沉淀方法中鉴别的覆盖蛋白的数量。(C)在未耗尽方法、耗尽方法或仅在沉淀方法中鉴别的血浆蛋白的功能类别。(D)与未耗尽方法相比,在整合耗尽和沉淀方法中检测到的每类蛋白质数量的倍数变化增加。
由于样品制备的复杂性,需要评估重现性。通过五次独立重复实验,蛋白质强度表现出高度一致性,相关系数约为0.99(图6A-B)。耗尽方法的中位CV为14.7%,沉淀方法为21.1%。进一步分析显示,耗尽方法和沉淀方法分别有66.38%和44.21%的蛋白质CV值低于20%(图6C),证明两种方法都具有良好的重现性。
图5:定量重现性
最后,在血浆样品中加入已知比例的酵母蛋白评估两种方法的定量准确性。为了解决耗尽法和沉淀法之间样品体积的差异,我们对酵母溶物的数量和血浆体积进行了调整,确保与血浆体积的比例一致(图7A)。在使用耗尽和沉淀的工作流程进行处理并随后通过DIA-MS进行量化后,观察到大多数酵母蛋白的定量比例始终与理论比例一致(图7B)。当整合耗尽和沉淀方法时,定量酵母蛋白数量显著高于单独方法(图7C)。通过FC > 1.5和p值< 0.05标准鉴定真阳性酵母蛋白(TP),整合两种方法显著提升TP数量,不同理论比率下的TP占比分别为90.1%、76.3%、70.9%和80.8%。(图7C)。结果表明,耗尽和沉淀相结合,显著提高了检测更多显示出浓度变化的蛋白质的能力。
图7:定量准确度。
(A)将不同量的酵母裂解物加标至血浆的实验方案,理论比例为5、2、0.5和0.2。(B)实验中位log2比值和标准差。(C)对于耗尽(depleted)、沉淀(precipitated)和整合耗尽和沉淀方法(depleted&precipitated),对于理论比率为5、2、0.5和0.2的定量酵母蛋白(定量)、真阳性(TP)蛋白和真阳性蛋白的百分比。
在这项研究中,我们开发了一种优化的血浆蛋白质组学方法,提高了效率和成本效益,同时确保了广泛的蛋白质覆盖和准确的定量性能。通过整合耗尽和沉淀技术,能在一次处理96个样品,仅用51 µL血浆,并大幅降低成本。此方法不仅提高了蛋白质组覆盖率,还证明了其优秀的重现性和准确性。
氨探生物建立了适用于多种生物样本的高通量和深度覆盖的蛋白质组学检测与分析的qULTRA多组学平台,能够高效、准确、深度地还原样本中的蛋白质、脂质、代谢物定性定量信息,帮助研究者全面解析生理病理活动的发生发展机制。
Zhou, Yue et al. “Optimizing and integrating depletion and precipitation methods for plasma proteomics through data-independent acquisition-mass spectrometry.” Journal of chromatography. B, Analytical technologies in the biomedical and life sciences 1235 (2024): 124046 .