蛋白质组研究技术可以分两大类。第一类是蛋白质组分离技术。传统上有两种技术路线,一种称为Top-down,尝试尽可能地在酶消化前分离完整的蛋白质,如聚丙酰胺凝胶电泳(1D-SDS-PAGE)、双向凝胶电泳(2D-SDS-PAGE,2-DE)、等电聚焦(IEF)和高效液相色谱(HPLC)等技术。分离的蛋白质经酶消化后,进一步分离肽片段或直接进行肽分析。另一种称为Bottom-up,是将样品中的蛋白质首先消化成肽混合物,再进行肽分离,主要技术为HPLC等。细胞分级分离技术及亲和层析技术也都是蛋白质组常用的分离方法。第二类是蛋白质组鉴定技术(图6-1),其核心技术是生物质谱,蛋白质芯片、噬菌体显示和大规模双杂交方法也属于鉴定技术。
图6-1 Top-down和Bottom-up的蛋白质鉴定策略
Top-down和Bottom-up两种方式都依赖于生物质谱技术的发展。两者各有优缺点。Top-down能够了解蛋白质的相对质量和蛋白质结构,但缺乏在Bottom-up中对个体肽段的分析。例如使用2-DE分离蛋白样品时,将会产生同一蛋白质的多个蛋白质点,提供糖基化、磷酸化或其他翻译后修饰的信息,以及点的密度、位置,提供关于丰度、等电点和相对分子质量的信息。而Bottom-up对小肽段比大的蛋白有更高的分辨率,并且对小肽段的序列分析鉴定更能够以高通量的方式进行,但是该方式不能鉴定肽段的母蛋白的分子形式。血浆蛋白质组计划发现,18个实验室使用不同方式检测到了不同的蛋白。以2-DE作为主要分离手段的实验室,在每个样品中只能鉴定少于200个的蛋白质,而使用纯Bottom-up方法的实验室却在每个样品中发现了近1 000个蛋白质。只有一个实验室鉴定的蛋白质超过1 500个,他们使用的是Top-down和Bottom-up结合的分析方法。在该计划中至少通过1个肽段而鉴定的蛋白质有9 504个,其中3 020个蛋白是通过2个或更多肽段来进行鉴定的,这3 020个蛋白质被作为人类血浆蛋白质组计划的核心蛋白数据集群。
一、双向凝胶电泳技术
虽然蛋白质分离技术发展很快,但双向凝胶电泳技术(2-DE)仍然是蛋白质组学研究的主要分离方法。2-DE于1975年由O’Farrell等创立,它是两种不同分离方式的结合。首先在第一向,根据等电点用IEF进行分离;然后在第二向,在SDS-PAGE电泳上根据相对分子质量的不同,进一步分离等电聚焦的蛋白质。它经历了最初的载体两性电解质pH梯度等电聚焦到20世纪80年代的固相pH梯度等电聚焦(immobilizal pH gradient,IPG)的发展过程。载体两性电解质pH梯度不稳定,受电场和时间影响较大,容易出现阴极漂移等现象;而目前应用的IPG胶条具有很容易将蛋白质转移到SDS-PAGE平板上、可重复产生稳定的pH梯度等优点。完整的双向凝胶电泳技术包括样品制备、等电聚焦、平衡转移、SDS-PAGE、斑点染色、图像捕获和图谱分析等步骤;通常的染色技术有银染、考马斯亮蓝、酰胺黑、荧光染料染色以及同位素染色等。但目前银染是分离蛋白质混合物的主要方法。
对于在胶板上形成的密度不同分布不均的染色斑点,二维电泳图谱可通过数码相机或扫描仪将其转换成数字图像,再应用2-DE分析软件对其进行检测、定量、比较、分析和归类。目前所开发的软件界面友好、使用方便、功能强大,如“PDQquest”“Malanie”“Phoretix2D”及“ImageMaster”等。此外还建立了多物种、多组织的2-DE数据库,其中最著名的是“SWISS-2DPAGE”,其中许多蛋白质都已采用多种方法进行了鉴定。
虽然2-DE技术具有高通量、高分辨率、高灵敏度、便于计算机进行图像分析处理、可以与质谱分析等鉴定方法匹配的优点,但它还存在很多问题。一是进行完全重复的2-DE分析是困难的。二是对于PI较大、相对分子质量小于8 000或大于200 000、疏水性强的蛋白质进行分析,效果都不太理想。三是作为检测技术,蛋白质染色的动态范围相对较小。这就意味着2-DE凝胶染色只能看到高含量的蛋白质,而较低含量的蛋白质往往不能检测,而许多生物体内非常重要的蛋白质以较低水平表达并迅速消失,因此引入其他分离方法是十分必要的。
二、其他非凝胶分离技术
近年来,分离科学发展了一些新型的分离模式,高效液相色谱、毛细管电泳、毛细管电色谱等技术在蛋白质组的研究中焕发出新的活力。
经典的液相色谱流动相在常压下输送,所用的固定相效率低,分析周期长。20世纪60年代末以后的液相色谱引入了气相色谱技术,采用高压输液泵、高效固定相和高灵敏度的检测器,克服了经典的液相色谱的缺点,具有分析速度快、分离效率高、检出极限低的特点,因此被称为高效液相色谱(high performance liquid chromatography,HPLC)。HPLC的优点是有多种分离模式,能将蛋白质或肽混合物分离成各种组分。按组分在两相间的分离机制主要可分为:液-固吸附色谱,液-液吸附色谱(正相分配色谱、反相分配色谱),离子交换色谱,凝胶色谱(排阻色谱),亲和色谱和疏水作用色谱。它们分别利用不同蛋白质或肽具有的不同疏水性、净正电荷、净负电荷、相对分子质量和与特定功能集团相互作用等性质和特征,进行蛋白质混合物的分离。HPLC多种分离模式联用是蛋白质组学研究的最有效工具之一,它能使混合物中的蛋白质或肽得到更大程度的分离,这种技术称为“串联HPLC”或“多维色谱技术”,也属于多维蛋白质鉴定技术(multi-dimensional protein identification technology,MudPIT)。它由Yates研究组提出,将不同分离模式的色谱柱以串联的方式合并于同一根色谱柱当中,分离后的多肽直接进入质谱分析,大大增加了所鉴定肽的数量,而且有助于鉴定混合物中低丰度的蛋白质和肽。因此,目前非凝胶分离技术已不能简单被认为是2-DE的补充了,它们为复杂样品的分离提供了更好的选择性能和更高的分辨效率。
三、质谱技术
生物质谱不同于其他无机质谱和有机质谱,是研究生物大分子、蛋白质组学主要支撑技术之一,在蛋白质和肽段的鉴定、定量和结构阐述方面不可或缺。质谱主要鉴别蛋白质或多肽的相对分子质量,其基本原理是样品分子离子化后,根据不同离子间质荷比(m/z)的差异来分离并确定相对分子质量。早期质谱多用于无机物或小分子有机物的鉴定,直到20世纪80年代末随着“软电离”技术的出现,才进入生物大分子(如蛋白质)的鉴定领域。所谓“软电离”是指样品分子电离时,保留整个分子的完整性,不形成碎片离子。
质谱的两个中心部件是离子化源和质量分析器。不同类型的质谱主要是根据这两个部位来命名的。目前的离子化源主要为基质辅助激光解吸离子化(eatrix-assisted laser desorption ionization,MALDI)和电喷雾离子化(electrospray ioinization,ESI)。前者利用基质吸收激光的能量使固相的多肽样品离子化,后者则在喷射过程中利用电场使液相的多肽样品离子化。而质量分析器则有不同的选择:四级杆(Q)、线性离子阱(LIT)、飞行时间(TOF)和傅里叶回旋共振器(FT-ICR)。不同类型的质量分析器各有优点及应用范围(表6-1)。目前的发展趋势是将不同类型的质量分析器串联起来,形成串联质谱(tanden MS,MS/MS),以提高工作性能和适用范围,如Q-Q-TOF、TOF-TOF及FT-ICR等。多个质量分析器相连,通过对前体肽离子的碰撞诱导解离(collision induced dissociation,CID),产生离子谱图,据此可推导出肽序列,从而显示出多级质谱的强大功能。
表6-1 不同类型串联质量分析器的特点
应用质谱鉴定蛋白质主要有两种策略。一是肽质量指纹图谱(peptide mass fingerpriting,PMF)。PMF是指蛋白质被酶切位点专一的蛋白酶(如胰蛋白酶)水解后得到的肽片段质量图谱。由于每种蛋白质的一级结构(氨基酸序列)不同,所以PMF具有特征性,可用于蛋白质的鉴定,即用实验测得的PMF与数据库中已有的理论PMF相匹配。进行这种分析首选MALDI-TOF-MS,该仪器主要形成单电荷,图谱简单,可测的相对分子质量范围可达100 000甚至1 000 000以上,而且对盐离子耐受能力高、易于自动化和通量化。但其容错性低、肽段质量冗余等可导致蛋白质的错误鉴定,因此以往只适用于已完成测序、数据库注释详尽的小基因组的生物。但是由于质谱测定质量的精确度普遍提高,搜索数据库所用的算法也更强大,如今已经发展了用于未完成基因组测序物种的蛋白质鉴定。目前所使用的数据库搜索软件为“MASCOT”“PROFOUND”“MSFIT”及“ALDENTE”等。
另一种策略是经过一定选择的前体离子在碰撞室发生CID,使前体离子肽骨架酰胺键特异性地断裂,并产生一系列可用于确定氨基酸序列的b型和y型等离子。适合这种分析的仪器主要是ESI-MS/MS,它可形成多电荷离子。可测的相对分子质量范围低于70 000,尤以3 000以下较为理想。ESI-MS/MS可与液相色谱联用,形成LC-ESI-MS/MS,获得MS/MS质谱图。所获得的MS/MS质谱图可通过下列方法鉴定蛋白质:一种称为肽序列标签(peptide seqence tags,PST)法,根据MS/MS质谱图解析出部分氨基酸序列,加上前体离子的质量和与肽序列标签相邻的产物离子质量等限制性参数,搜索数据库而鉴定蛋白。另一种方法是所得到的MS/MS数据不经过解析,直接进行数据库搜索,称为串联质谱数据直接搜寻法,这是蛋白质鉴定的最好方法之一。直接搜索法所使用的软件有“SEQEST”及“MASCOT”等,可选用“SWISS-PROT”“OWL”和“NCBInr”等数据库进行相关搜索。查询得到的蛋白质全序列对质谱检测肽段的覆盖率(coverage)越高,表明检索结果越可靠。查询结果还应根据分子质量、等电点、氨基酸组成及在2-DE图谱中的位置进行对比,进一步确定蛋白质的鉴定结果。
近年来,又出现了为蛋白质芯片检测设计的表面增强激光解吸离子化质谱(surface enhanced laser desorption ionization mass spectrometry,SELDI-MS)和可以直接对组织切片中的蛋白质进行检测的图像质谱,两者的优点是都无须进行2-DE的分离处理。
四、定量蛋白质组学
在蛋白质组的研究当中,2-DE和MS技术仍是占主导地位的核心研究方法,被人们称为第一代蛋白质组学研究方法。同位素亲和标签(isotope-coded affinity tag,ICAT)、荧光差异显示双向电泳(fluorescence 2Ddifferential gel eletrophoresis,2DDIGE)等定量蛋白质组技术及蛋白质芯片(protein chip)等技术,则被称为第二代蛋白质组学研究方法。
2DDIGE是在传统2-DE基础上发展起来的定量分析技术,其优点是在一块凝胶上比较两种有差异表达的蛋白质组表达谱,能精确地在较宽的动态范围内对研究者感兴趣的蛋白质进行定量。2DDIGE解决了传统2-DE重复性差的问题,在同一块凝胶上,同时电泳2~3个样品,使变异的概率明显减少;同时由于内标系统的引入,使结果更为精确可靠。使用内标有以下优点:凝胶内的待比较样品对应于内标产生了标准化的数据;其蛋白质点的含量与内标进行比较,检测到的是“比值”(ratio),而不是“量”(volume),从而在不同凝胶之间可以精确定量和进行统计学分析;最重要的是将实验变异从真正的生物学变异中分离出来。该技术一个难以克服的弱点是不能用于不含赖氨酸或半胱氨酸的蛋白质。虽然2DDIGE也有缺点,但其定量功能具有较高的重复性、灵敏性和精确性,必将成为有前景的蛋白质组学研究的工具。
此外,基于质谱技术的定量蛋白质组技术也有较快的发展。①同位素亲和标签(isotope-coded affinity tag,ICAT),使用稳定的重或轻的同位素亲和标签与半胱氨酸残基反应。该技术已被广泛用于蛋白质组的定量分析中。②绝对定量(absolute quantification,AQUA)策略,用来检测蛋白的表达和翻译后修饰的水平。但AQUA技术昂贵而且需要预先了解分析物。③氨基酸标记稳定同位素(stable isotope labeling with amino acids,SILAC),被应用于磷酸化蛋白质组的研究中,这可能是目前科学界最流行的代谢标记方法,已被用于癌细胞进展和死亡的蛋白质组学特性研究之中,同时也被用于磷酸化的蛋白质组等方面。④相对和绝对定量等比重标签(isobaric tags for related and absolute quantitation,iTRAQ),利用试剂对经消化后的蛋白质肽段混合物进行定量分析。该技术已被广泛应用于神经系统发育、功能紊乱以及磷酸化蛋白质组等的研究中。Wu等对DIGE、ICAT和iTRAQ等方法进行了比较研究,发现尽管iTRAQ不精确地选择前体离子是更容易犯的错误,但仍是三者中最灵敏的,而ICAT和DIGE拥有同样的灵敏度。目前还有一种非依赖质谱的定量蛋白质组学方法,使用类似于ELISA的方法,能检测到10pg/L(40mmol/L)浓度的蛋白。
五、蛋白微阵列
蛋白微阵列(protein microarray)技术在高通量筛选蛋白功能方面发展迅速,包括在玻璃表面(glass slide)、多孔凝胶垫上(prorous gel pad slide)及微孔板上(microwell)构建的蛋白微阵列,可分为正相阵列(forward-phase array)和反向阵列(reverse-phase array)。在正相阵列,针对靶蛋白的捕捉分子(例如抗体)以与DNA微阵列探针相似的方式与固体固定。包含靶蛋白的细胞裂解液孵育在抗体上,通过标记了抗体的二抗检测结合蛋白。使用该方法,能够同时检测一个样品中的许多靶蛋白。在反向阵列中,复杂的蛋白质混合物固定于固体上,与抗目标蛋白的抗体发生杂交。该方法允许检测复杂样品的目标蛋白,如组织裂解液或血清。由于抗体结合的特异性和敏感标记方式的放大,检测到的蛋白浓度可低于10个细胞的量。目前,大量商业抗体问世,使得蛋白微阵列的临床研究易于进行。但是该技术仍然依赖抗目标蛋白抗体的可获得性,还须经过免疫印迹方法验证抗体的特异性,同时需要内标对照。新的蛋白微阵列平台如自组合阵列(self assembling array)已被用于检测蛋白质相互作用和功能。虽然蛋白微阵列作为一项正在发展的技术还存在许多问题,但由于其自身特点,已被用于广泛的领域中。尤其在疾病诊断方面,它比传统的检测方法需要更短的时间和更少的样品量,但却能给出更多的诊断信息,因此可以成为医疗诊断的发展方向。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。