蛋白质组

蛋白质组(Proteome)的概念最先由Marc Wilkins提出,指由一个基因组(Genome),或一个细胞、组织表达的所有蛋白质(protein). 蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变。 在转录时,一个基因可以多种mRNA形式剪接,一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目。 蛋白质组学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域。

  主要功能

  蛋白质组学集中于动态描述基因调节,对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制.作为一门科学,蛋白质组研究并非从零开始,它是已有20多年历史的蛋白质(多肽)谱和基因产物图谱技术的一种延伸.多肽图谱依靠双向电泳(Two-dimensionalgelelectrophoresis,2-DE)和进一步的图象分析;而基因产物图谱依靠多种分离后的分析,如质谱技术、氨基酸组分分析等.

  由于可变剪辑及RNA编辑的存在,许多基因可以表达出多种不同的蛋白质。因此,蛋白质组的复杂度要比基因组的复杂度高得多。
如果某物种的基因组全序列已经破译,并不代表该物种的蛋白质组也已破译。具体分析某个基因的蛋白质产物要综合基因组水平、转录水平和翻译水平的修饰及调控来确定。

  研究内容

  主要有两方面,一是结构蛋白质组学,二是功能蛋白质组学。其研究前沿大致分为三个方面:

  ①针对有关基因组或转录组数据库的生物体或组织细胞,建立其蛋白质组或亚蛋白质组及其蛋白质组连锁群,即组成性蛋白质组学。

  ②以重要生命过程或人类重大疾病为对象,进行重要生理病理体系或过程的局部蛋白质组或比较蛋白质组学。

  ③通过多种先进技术研究蛋白质之间的相互作用,绘制某个体系的蛋白,即相互作用蛋白质组学,又称为“细胞图谱”蛋白质组学。

  此外,随着蛋白质组学研究的深入,又出现了一些新的研究方向,如亚细胞蛋白质组学、定量蛋白质组学等。蛋白质组学是系统生物学的重要研究方法。

  技术原理

  双向凝胶电泳技术(2-DE)

       双向凝胶电泳技术与质谱技术是目前应用最为广泛的研究蛋白质组学的方法。双向凝胶电泳技术利用蛋白质的等电点和分子量差别将各种蛋白质区分开来。虽然二维凝胶电泳难以辨别低丰度蛋白,对操作要求也较高,但其通量高、分辨率和重复性好以及可与质谱联用的特点,使其成为目前最流行、可靠的蛋白质组研究手段。双向凝胶电泳技术及质谱基础的蛋白质组学研究程序为样品制备→等电聚焦→聚丙烯酰胺凝胶电泳→凝胶染色→挖取感兴趣的蛋白质点→胶内酶切→质谱分析确定肽指纹图谱或部分氨基酸序列→利用数据库确定蛋白。蛋白质组研究要求有高分辨率的蛋白质分离及准确、灵敏的质谱鉴定技术。凝胶电泳中蛋白质的着色不仅影响蛋白质分离的分辨率,同时也影响后续的质谱鉴定。蛋白质的染色可分为有机试剂染色、银染、荧光染色及同位素显色四类。
Unlu等提出了一种荧光差异显示双向电泳(F-2D-DIGE)的定量蛋白质组学分析方法。差异凝胶电泳(DIGE)是对2-DE在技术上的改进,结合了多重荧光分析的方法,在同一块胶上共同分离多个分别由不同荧光标记的样品,并第一次引入了内标的概念。两种样品中的蛋白质采用不同的荧光标记后混合,进行2-DE,用来检测蛋白质在两种样品中表达情况,极大地提高了结果的准确性、可靠性和可重复性。在DIGE技术中,每个蛋白点都有它自己的内标,并且软件可全自动根据每个蛋白点的内标对其表达量进行校准,保证所检测到的蛋白丰度变化是真实的。DIGE技术已经在各种样品中得到应用。

  高效液相色谱技术(HPLC)

       尽管二维凝胶电泳(2-DE)是常用的对全蛋白组的分析方法,但其存在分离能力有限、存在歧视效应、操作程序复杂等缺陷。对于分析动态范围大、低丰度以及疏水性蛋白质的研究往往很难得到满意的结果。Chong等使用HPLC/质谱比较分析恶性肿瘤前和癌症两种蛋白质差异表达。利用HPLC分离蛋白质,并用MALDI-TOF-MS鉴定收集的组分,从而在两种细胞中的差异表达中对蛋白质进行定量分析。多维液相色谱作为一种新型分离技术,不存在相对分子质量和等电点的限制,通过不同模式的组合,消除了二维凝胶电泳的歧视效应,具有峰容量高、便于自动化等特点。二维离子交换-反相色谱(2D-IEC-RPLC)是蛋白质组学研究中最常用的多维液相色谱分离系统。

  飞行时间质谱技术

       表面增强激光解吸离子化飞行时间质谱技术于2002年由诺贝尔化学奖得主田中发明,刚刚产生便引起学术界的高度重视。SELDI技术是蛋白质组学研究中比较理想的技术平台,其全称是表面增强激光解吸电离飞行时间质谱技术(SELDI-tof)。其方法主要如下:通常情况下将样品经过简单的预处理后直接滴加到表面经过特殊修饰的芯片上,既可比较两个样品之间的差异蛋白,也可获得样品的蛋白质总览。因此,在应用方面具有显著优势。SELDI技术分析的样品不需用液相色谱或气相色谱预先纯化,因此可用于分析复杂的生物样品。SELDI技术可以分析疏水性蛋白质,PI过高或过低的蛋白质以及低分子质量的蛋白质(<25000),还可以发现在未经处理的样品中许多被掩盖的低浓度蛋白质,增加发现生物标志物的机会。SELDI技术只需少量样品,在较短时间内就可以得到结果,且试验重复性好,适合临床诊断及大规模筛选与疾病相关的生物标志物,特别是它可直接检测不经处理的尿液、血液、脑脊液、关节腔滑液、支气管洗出液、细胞裂解液和各种分泌物等,从而可检测到样品中目标蛋白质的分子量、PI、糖基化位点、磷酸化位点等参数。

  同位素标记亲和标签(ICAT)技术

  同位素亲和标签技术是一种用于蛋白质分离分析技术,此技术是蛋白质组研究技术中的核心技术之一。该技术用具有不同质量的同位素亲和标签(ICATs)标记处于不同状态下的细胞中的半胱氨酸,利用串联质谱技术,对混合的样品进行质谱分析。来自两个样品中的同一类蛋白质会形成易于辨识比较的两个不同的峰形,能非常准确的比较出两份样品蛋白质表达水平的不同。ICAT的好处在于它可以对混合样品直接测试;能够快速定性和定量鉴定低丰度蛋白质,尤其是膜蛋白等疏水性蛋白等;还可以快速找出重要功能蛋白质。

  由于采用了一种全新的ICAT试剂,同时结合了液相色谱和串联质谱,因此不但明显弥补了双向电泳技术的不足,同时还使高通量、自动化蛋白质组分析更趋简单、准确和快速,代表着蛋白质组分析技术的主要发展方向。针对磷酸化蛋白分析以及与固相技术相结合ICAT技术本身又取得了许多有意义的进展,已形成ICAT系列技术。

  生物信息学技术

  生物信息学在生命科学研究中起着越来越重要的作用。利用生物信息学对蛋白质组的各种数据进行处理和分析,也是蛋白质组研究的重要内容。生物信息学是蛋白质组学研究中不可缺少的一部分。生物信息学的发展,已不仅是单纯的对基因组、蛋白质组数据的分析,而且可以对已知的或新的基因产物进行全面分析。在蛋白质组数据库中储存了有机体、组织或细胞所表达的全部蛋白质信息,通过用鼠标点击双向凝胶电泳图谱上的蛋白质点就可获得。

  鉴定方法

  如蛋白质鉴定结果、蛋白质的亚细胞定位、蛋白质在不同条件下的表达水平等信息。目前应用最普遍的数据库是NRDB和dbEST数据库。NRDB由SWISS2PROT和GENPETP等几个数据库组成,dbEST是由美国国家生物技术信息中心(NCBI)和欧洲生物信息学研究所(EBI)共同编辑的核酸数据库;计算机分析软件主要有蛋白质双向电泳图谱分析软件、蛋白质鉴定软件、蛋白质结构和功能预测软件等。

  研究进展

  2014年5月28日,英国新一期《自然》杂志公布两组科研人员分别绘制的人类蛋白质组草图。这一成果有助于了解各个组织中存在何种蛋白质,这些蛋白质与哪些基因表达有关等,从而进一步揭开人体的奥秘。

  上世纪90年代,人类基因组计划开始成形时,有科学家提出了破译人类蛋白质组的想法。其目标是将人体所有蛋白质归类并描绘出它们的特性、在细胞中所处的位置以及蛋白质之间的相互作用。但人类蛋白质组的规模和复杂性使此类研究困难重重。

  研究人员借助计算机对这些蛋白质片段与基因组进行了大量比对工作,并据此列出一个“清单”,描绘出哪些组织中的哪些基因表达与蛋白质的形成有关。在另一项研究中,美国约翰斯&middot;霍普金斯大学研究人员与印度等国同行也采用质谱分析法绘制出一张蛋白质组草图。