基因表达序列标签(ExpressedSequenceTag,EST)是从cDNA文库中随机挑取单克隆进行测序,所获得的序列片段,序列长度一般约为60-500bp。为能较快速地发现新基因,早在20世纪80年代,有人曾提出对cDNA序列进行大规模测序,但对此想法一直存在争论...[继续阅读]
海量资源,尽在掌握
基因表达序列标签(ExpressedSequenceTag,EST)是从cDNA文库中随机挑取单克隆进行测序,所获得的序列片段,序列长度一般约为60-500bp。为能较快速地发现新基因,早在20世纪80年代,有人曾提出对cDNA序列进行大规模测序,但对此想法一直存在争论...[继续阅读]
转录图谱是指不同基因的转录产物在基因组上的分布位置。由于EST来源于生物体不同组织或同一组织不同发育时期的cDNA文库,因此,通过对EST数据进行分析整理,可以绘制不同的转录图谱。通过对这些转录图谱的比较,有可能发现组织间...[继续阅读]
由于各数据库中EST的数目远比其他的核苷酸序列多,因而利用EST数据库搜寻新基因已成为基因识别的重要手段。通过在数据库中对EST序列进行比对(详见第5章),可以识别同一物种中基因家族的新成员(paraloggenes),在不同物种间功能相同的...[继续阅读]
获得全长cDNA克隆(full-lengthcDNA)是进行基因表达和功能研究的前提条件。在cDNA文库构建过程中许多基因(尤其是大基因)cDNA都缺少5′端的序列信息。因此,通过随机测序获得全长cDNA十分费时耗力。EST数据库中存在着大量同一基因的EST序...[继续阅读]
当一个物种的全基因组测序完成后,首要的工作就是对其基因组中所包含的全部基因进行预测。由于不同物种在碱基组成、重复序列、基因结构等方面存在较大的差异,迄今的基因预测软件不可能对所有的物种都达到很高的准确度。因...[继续阅读]
单核苷酸多态性(SingleNucleotidePolymorphism,SNP)是基因组变异量最丰富的一种形式,也是对复杂遗传性状进行定位的重要源泉。同一物种不同个体、不同组织、不同发育阶段和生理状况下的EST的数据来源于全世界各实验室。通过对冗余的...[继续阅读]
基因表达谱是反映生物个体在特定器官、组织或某一特定发育、生理阶段细胞中所有基因表达水平的图谱,可用来比较不同组织或生理状况下的基因表达水平差异,发现与其特定生理功能相关的基因,通过表达聚类推测未知基因功能。...[继续阅读]
cDNA文库构建可选择非标准化或标准化。非标准化cDNA文库(unnormalizedcDNAlibrary)是指未对建库所用的组织mRNA进行任何预处理而直接构建的cDNA文库,它反映了组织中所有基因的表达水平,适于基因表达谱的构建;但由于文库中存在高丰度表达...[继续阅读]
根据不同的实验目的,可选择5′端,3′端或两端测序:1.3.2.15′端测序大部分EST计划都是选用5′端进行测序的。cDNA的5′端含有编码区信息,全长cDNA还含有5′非翻译区的调控信息。用5′端测序的EST在寻找新基因或研究基因差异表达时能...[继续阅读]
为了减少EST数据中的低质量和赝象序列(artifactualsequences),以尽可能避免后续分析中的错误。EST序列需作如下前处理:(1)去除测序反应不成功的低质量序列。(2)屏蔽不属于表达基因的赝象序列,如构建文库所使用的载体序列、重复序列和...[继续阅读]