马克斯-普朗克生物化学研究所、欧洲分子生物学实验室等机构的科学家在Nature Biotechnology上发表了题为“Global detection of human variants and isoforms by deep proteome sequencing”的文章。
◆背景
人类蛋白质组图谱为超过90%的蛋白质编码基因提供了其蛋白质翻译证据,而由于选择性剪接事件的存在,人类基因组约20,000个蛋白质编码基因中的蛋白质组多样性显著增加。因此,精确检测蛋白质多样性对于理解生物学功能至关重要。但由于目前蛋白质组学技术的局限性,常用的鸟枪法蛋白质组学检测方法是通过部分肽段序列来确定整个蛋白质的,其序列覆盖率不足以完全表征样本中存在的所有蛋白质状态。
◆实验概况
研究人员使用6种不同的蛋白酶(Trypsin、LysC、LysN、GluC、AspN、Chymotrypsin,其中前5种蛋白酶FUJIFILM Wako均可提供)消化6种人类细胞系蛋白质,碎片化后进行液相色谱分离和串联质谱分析。从17,717个蛋白质编码基因或蛋白质组中识别100万条特异性肽段,其序列覆盖度中位数达到80%,大大提高了鸟枪法蛋白质组学对单个蛋白的序列覆盖率,为全面绘制蛋白质多样性图谱奠定了基础。
◆实验结果
高蛋白质组序列覆盖度有助于更全面地检测
不同可变检测事件产生的蛋白isoform。依据RNA-Seq的数据,人体各器官和细胞系提供了超过95%的外显子可变剪接的基因产物。但由于质谱数据的覆盖度不足,导致编码出来的蛋白质与可变剪接转录本的数量不成正比。
从下图可以看到每种酶单独使用时,都会产生明显较低的检测水平(图1)。但是非精氨酸和非赖氨酸特异性的蛋白酶(GluC和AspN)与胰蛋白酶联合使用的时候,可以提高剪接位点的覆盖度(图2)。
图1. 单独蛋白酶对可变剪接位点的鉴定数(Total是所有蛋白酶组合)
图2. 所有蛋白酶组合对可变剪接位点的鉴定数
高蛋白质组序列覆盖度有助于药物靶点研究
高蛋白质序列覆盖度有助于膜蛋白的鉴定。众多膜蛋白是关键的药物靶点,而跨膜区域序列决定膜蛋白结构及功能,进而影响药物靶点特性。
图3. 跨膜蛋白与非跨膜蛋白的序列覆盖度对比
高蛋白质组序列覆盖度有助于检测SAP(单氨基酸多态性)
基因在转录和翻译过程中,会出现单氨基酸多态性(SAP),而低深度的蛋白质组覆盖度,使得大部分SAP无法鉴定到。高蛋白质序列覆盖度有助于SAP(单氨基酸多态性)的检测,为遗传病检测提供蛋白层面的数据支持。
图4. 检测到的SAP的性质,各细胞系中转录组学和蛋白质组学对于SAP的检测。不同组学,不同酶解方式鉴定到的数目
◆产品列表
论文来源:https://www.nature.com/articles/s41587-023-01714-x