作者:中国科学院生物物理研究所  赵倩倩、张自强、李岩

20世纪基因组学研究取得的巨大成就为蛋白质组学的发展奠定了基础。蛋白质组学是从整体水平上分析生命体、组织或细胞的蛋白质组成及其活动规律的科学,以基因表达产物为研究对象,延伸了基因组学研究深度,更深层次地揭示了生命活动规律。蛋白质组学的研究内容主要包括蛋白质表达存在方式(修饰形式)的鉴定、结构与功能分析、蛋白质定位、蛋白质差异表达以及蛋白质间相互作用分析等[1]。目前蛋白质组学研究技术主要包括:二维电泳技术、蛋白质芯片技术、质谱技术等[2]。其中,二维电泳技术是早期蛋白质组学的重要技术之一,但是由于实验步骤多,耗时长,重复性差等特点,已经逐步被新型技术所取代。蛋白质芯片技术是将多种蛋白质纯品点于芯片表面,形成蛋白质矩阵进行免疫等标记反应,主要受限于很多蛋白质无法获得纯品而不能用于芯片制备。质谱技术由于灵敏度高、特异性强、分析范围宽等优点逐渐成为蛋白质组学的主要研究手段,可以对特定生命过程中的功能性蛋白质分子进行定性和定量检测,因此在基础科研和临床研究中得到了广泛的应用[3,4]。

一、基于质谱的蛋白质组学技术

1.基于质谱的蛋白质组学定性技术:

蛋白质定性鉴定的基本原理在于:蛋白质组的基本序列已经通过基因组学信息获得,可以用来鉴定多肽的氨基酸序列,并且获得多肽与蛋白质的对应关系[1],即质谱提供的多肽碎片数据可以与蛋白质数据库自动匹配来确定多肽序列与蛋白质归属。基本技术策略分为:(1)自上而下(Top–down)策略[5],即完整蛋白质在质谱中进行分析,可以提供完整蛋白质的质量数,但是由于质谱仪受到质量分析范围的限制,此方法在常规实验室不易实现。(2)自下而上(Bottom–up)策略[6],即蛋白质被蛋白酶水解成多肽,然后对多肽进行质谱分析和碎裂。基于这条策略的大致步骤为:蛋白质样品首先经过酶解降解为多肽,然后对多肽进行色谱–质谱分离与鉴定,最后通过搜索引擎(MASCOT:http://www.matrixscience.com/server.html, SEQUEST:http://fields.scripps.edu/sequest等)在公共蛋白质组学数据库(SWISS–PORT: http://web.expasy.org/groups/swissprot, NCBI:http://www.ncbi.nlm.nih.gov/pubmed等)中自动完成质谱数据的解析,确定多肽序列与蛋白质种类。该技术灵敏度高,特异性好,仪器自动化程度高,可以鉴定出生物样品中成千上万种蛋白质,被认为是大规模、高通量蛋白质定性检测的首选方法。

2.基于质谱的蛋白质组学相对定量技术:

对于大多数生命科学和医学研究来说,仅完成样品中蛋白质组的定性研究是远远不够的,还需要对蛋白质组进行定量分析。由于组学的研究对象是多个蛋白质,单次检测很难实现所有蛋白质的绝对定量,因此蛋白质组学定量多为相对定量检测。蛋白质组学定量的质谱技术包括谱图计数、质谱峰强度定量、同位素定量技术等。其中使用同位素作为内标定量的方法是目前质谱定量的最佳手段,即对整体蛋白质组进行同位素标记,并使用每一种天然蛋白质与同位素蛋白质的比值进行相对定量分析。主要分为细胞层面标记和蛋白质层面标记两种技术路线:(1)细胞层面标记的细胞培养氨基酸稳定同位素标记(stable isotope labeling with amino acids in cell culture,SILAC)方法[7]:即在两种细胞样品中分别加入轻重同位素标记的培养基,经过传代培养后,两种细胞样品中的全部蛋白质中分别嵌合了轻重同位素,可以在质谱上根据同位素的不同质荷比直接判断样品来源并进行定量比对。(2)蛋白质层面标记:使用含有同位素的小分子与样品全部蛋白质直接标记,如同位素标记相对和绝对定量技术(isobaric tags for relative and absolute quantification,iTRAQ)[8]、同位素编码亲和标记(isotope–coded affinity tag,iCAT) [9]、18O标记[10]等方法,此类方法使用带有稳定同位素的小分子与特定氨基酸侧链反应,使得多个样品可以分别连接含有不同同位素个数(多至8个)的小分子,从而产生一级数据相同但是二级数据不同的质谱谱图,通过二级谱图强度比对进行多个样品的定量分析。

3.基于质谱的目标蛋白质绝对定量技术:

质谱技术对目标蛋白质的绝对定量检测主要通过质谱多反应监控技术与同位素多肽内标技术联用来实现[11]。该方法首先选定目标蛋白质的一个或多个多肽,合成序列相同但含有稳定同位素的多肽作为内标,定量加入样品中,通过监测特定多肽及其同位素多肽的质谱峰强度进行比对和计算获得目标蛋白质的定量值。质谱多反应监控技术通过进行母离子筛选与子离子筛选等二次选择过程,筛选出目标蛋白质,而非目标蛋白质由于无法通过筛选达到检测器,极大降低了噪音干扰。因此,此方法针对性强,本底噪音低,是目前质谱技术中定量能力最好的一种,可以控制变异系数小于15%,检测限低至纳克每毫升,适合血液、组织等临床样品的定量检测[11]。

二、质谱技术发现肿瘤蛋白质标志物

质谱技术作为一项强有力的研究工具在科学研究中发挥着巨大的作用,特别在肿瘤相关研究中,目前已经获得美国食品药品监督管理局(Food and Drug Administration,FDA)批准的肿瘤标志物包括多种蛋白质前列腺特异性抗原(prostate–specific antigen, PSA), 癌胚抗原(carcinoembryonic antigen CEA), 人类表皮生长因子受体2(human epidermal growth factor receptor 2,Her–2), 人绒毛膜促性腺激素(human chorionic gonadotropin, HCG), 糖类抗原CA125等,均揭示了蛋白质与肿瘤发生发展密切相关。这些已有成果极大促进了质谱技术在肿瘤蛋白质标志物研究中的应用,并取得了标志性进展。例如:美国约翰霍普金斯大学的Chan课题组发现了新型卵巢癌蛋白质标志物,他们使用表面增强激光解析电离质谱技术(surface enhanced laser desorption and ionization time–of–flight mass spectrometry, SELDI–TOF MS)技术对503个妇女的血清进行了蛋白质组学的分析[12],在随后的大量临床验证中最终确定CA125、β2微球蛋白,转铁蛋白,甲状腺运载蛋白和载脂蛋白A1的联合检测可以作为卵巢癌的新型临床诊断指标。2009年9月该试剂盒OVA1(商品名称:http://ova–1.com)获得了美国FDA的认证,进入临床使用,被认为是国际肿瘤蛋白质标志物研究的重要标志性成果。

同时,肿瘤仍然是国际上致死率最高的疾病之一,缺乏早期检测技术和有效治疗方案,临床中还存在着大量问题需要解决,新型标志物的研发迫在眉睫。由于肿瘤蛋白质标志物研究的难度大,风险高,因此近十年来仅有几例试剂盒获得了美国FDA批准,进入临床使用。大量标志物研究还停留在论文研究水平,其中临床问题、研究思路和技术方案的选择直接关系到研究的成功与否。

1.临床问题选择:

在肿瘤蛋白质标志物研究中,临床问题的选择是研究核心。在肿瘤研究中,需要解决的临床问题往往包括肿瘤早期检测、肿瘤分期检测、治疗方案与药物选择、疗效评估等多个方面。研究者需要根据不同肿瘤的临床情况,具体分析并凝练不同肿瘤的主要临床问题。例如,对于病程发展快、五年存活率低、没有有效手术或化疗手段的肿瘤,早期诊断是研究重点,如胰腺癌、卵巢癌、肺癌等;对于病程发展慢、手术效果明显的肿瘤,肿瘤的愈后与复发是需要关注的问题,如前列腺癌、肠癌等;还有一些肿瘤有特殊的检测需求,如乳腺癌虽然有临床有效的雌激素受体(estrogen receptor,ER),孕激素受体(progesterone receptor,PR),HER2等基因标志物,可以进行药物靶点治疗,但是三阴性乳腺癌的检测还缺乏有效的标志物与治疗方案。因此,在肿瘤蛋白质标志物研究实验开展之前,明确临床问题,并以此确定临床样品入组标准,是研究成功的核心基础。

2.研究思路设计:

不同于基础科学实验,临床实验需要在大量样本中进行实验结果的验证,因此肿瘤蛋白质标志物研究往往包括新型标志物发现和验证两部分。标志物发现实验是在疾病组和对照组之间进行蛋白质组学分析,鉴定样本中的未知蛋白质组并进行相对定量比较,分析数据选择出在两组样本中差异最大的一个或几个蛋白质作为新型标志物的候选物。随后,标志物验证实验在大量未知样本中进行蛋白质候选物的定量检测,使用发现实验中建立的区分标准进行判读,计算检测灵敏性(sensitivity)和特异性(specificity)。有效的蛋白质标志物研究往往需要发现与验证的两步设计思路来相互保证。

3.技术方案选择:

根据蛋白质标志物研究的两步设计思路,发现实验中使用基于质谱的蛋白质组学定性技术与相对定量技术对样本中的大量未知蛋白质进行分析,获得标志物候选物名单。验证实验中根据已有名单,进行目标蛋白质(非蛋白质组学)的精确定量检测。这几种质谱技术的配合使用,可以满足不同实验情况和目的,最终实现新型蛋白质标志物的成功研发。

三、展望

质谱技术是现阶段蛋白质组学研究的核心技术,具有灵敏度高、特异性强、分析通量大等优势,特别是其与同位素内标的联合使用,大大提高了质谱定量能力,因此在多种肿瘤标志物研究中取得了突破性进展并被广泛应用。目前,大量肿瘤蛋白质标志物候选物已经通过使用质谱技术被从血液、组织、体液中筛选出来,预计在完成大规模临床验证后可以作为新型标志物在临床使用,促进肿瘤检测水平的发展。

同时值得注意的是,质谱技术还不具备进行蛋白质组的绝对定量能力。相对于免疫等传统蛋白质检测技术,仪器昂贵,操作复杂,自动化程度低,这些因素决定了质谱目前适用于蛋白质的临床研究,但不适用于蛋白质的临床检验,这是质谱技术面临的重要挑战之一。

参考文献
[1]何华勤. 简明蛋白质组学[M]. 北京:中国林业出版社, 2011:1,76,85-95,119,125-138.
[2]RuediA, MatthiasM. Mass spectrometry-based proteomics[J]. Nature, 2003, 422(13):198-207.
[3]甄艳, 施季森. 质谱技术在蛋白质组学研究中的应用[J]. 南京林业大学学报:自然科学版, 2011, 35(1):103-108.
[4]孙瑞祥, 付岩, 李德泉,等. 基于质谱技术的计算蛋白质组学研究[J]. 中国科学E辑信息科学, 2006, 36(2):222-234.
[5]WhiteleggeJ,HalgandF,SoudaP, et al. Top-down mass spectrometry of integral membrane proteins [J]. Expert Review Proteomics, 2006, 3(6):585-596.
[6]ChaitBT. Mass spectrometry:bottom-up or top-down? [J]. Science, 2006, 314(5796):65-66.
[7]TranDT, AdhikariJ, FitzgeraldMC. StableIsotope Labeling with Amino Acids in Cell Culture (SILAC)-based strategy for proteome-wide thermodynamic analysis of protein-ligand binding interactions [J]. Mol Cell Proteomics, 2014,13(7):1800-1813.
[8]DytfeldD, KandarpaM, StrahlerJR, et al. Proteomic Profiling of Multiple Myeloma (MM) Cells Using iTRAQ and Label-Free Quantitative Proteomics for the Prediction of Complete or near Complete Response (CR/nCR) In Frontline Treatment with Lenalidomide, Bortezomib, and Dexamethasone [J]. Blood, 2010, 116(21):271-272.
[9]García-SantamarinaS, BoronatS, DomènechA, et al. Monitoring in vivo reversible cysteine oxidation in proteins using ICAT and mass spectrometry [J]. Nat Protoc,2014,9(5):1131-1145.
[10]MirzaSP, GreeneAS, OlivierM. 18O labeling over a coffee break:a rapid strategy for quantitative proteomics [J]. J Proteome Res, 2008,7(7):3042-3048.
[11]曹冬, 张养军, 钱小红. 基于生物质谱的蛋白质组学绝对定量方法研究进展[J]. 质谱学报, 2008, 29(3):185-190.
[12]ZhangZ, BastRC, YuY,et al. Three biomarkers identified from serum proteomic analysis for the detection of early stage ovarian cancer[J]. Cancer Res,2004,64(16), 5882-5890.