Needleman-Wunsch 算法是一种全局联配算法,它从整体上分析两个序列的关系,即考虑序列总长的整体比较,用类似于使整体相似(global similarity)最大化的方式,对序列进行联配。两个不等长序列的联配分析必须考虑在一个序列中一些碱基的删...[继续阅读]
海量资源,尽在掌握
Needleman-Wunsch 算法是一种全局联配算法,它从整体上分析两个序列的关系,即考虑序列总长的整体比较,用类似于使整体相似(global similarity)最大化的方式,对序列进行联配。两个不等长序列的联配分析必须考虑在一个序列中一些碱基的删...[继续阅读]
Smith-Waterman 算法是在Needleman-Wunsch 算法基础上发展而来的,它是一种局部联配算法。由于亲缘关系较远的蛋白质序列可能只有一些相互独立的保守片段,所以进行局部相似性分析有时可能比整体相似性分析更合理。Smith 和Waterman(1981)提...[继续阅读]
BLAST 算法同样是利用动态规划算法,与Smith-Waterman 算法类似,其不同之处是引入了所谓“字”或“字符串”(word 或K-tuple,K-mer 等)的检索技术。所有序列其实都是由若干字符串组成,例如我们以3个碱基长度的字符串为例,下列DNA 序列包括...[继续阅读]
采用BLAST 的基本算法目前形成了若干不同的工具,分别用于特定序列数据库和特定目的的序列搜索。以NCBI 提供的在线序列数据库搜索工具BLAST(2014年12月)为例(图1-3.4),BLASTN 是对核苷酸递交序列库搜索核苷酸序列数据库,BLASTP 是在蛋白...[继续阅读]
BLAST 搜索返回的结果中,提供了递交序列与数据库中序列比对结果的得分(score)和一个统计测验结果(E-value)。到目前为止,对局部联配的统计学问题已基本搞清楚,特别是那些不含空位的局部联配更是如此。我们不妨首先考虑不含空位的...[继续阅读]
1.目前计分矩阵主要有哪些? 比较它们的异同。2.请利用动态规划Needleman-Wunsch 算法对下列两条蛋白质序列进行全局联配,获得最优联配结果: P1=AGWGAHEA P2=PAWHEAEAG计分系统:计分矩阵BLOSUM50,空位罚8分。表1-3.7 BLOSUM50(部分)3.数据库...[继续阅读]
许多生物学研究都涉及多条序列甚至几十上百条序列的比较,因此多序列联配是生物信息学的一个重要课题。通过多序列联配结果,我们可以确定这些序列的亲缘关系,通过序列保守性判断功能域或功能位点等。多序列联配同样包括全...[继续阅读]
多序列全局联配算法目前主要是以Clustal 算法为代表的渐进式全局联配方法。渐进式全局联配算法是20世纪80年代发展起来的(Waterman 和Perlwitz,1984; Feng 和Doolittle,1987),其中以软件工具Clustal 算法最为成功。下面就重点介绍Clustal 算法。...[继续阅读]
具有相同功能的基因往往在序列上存在局部相似性或保守性,这些保守性与相应功能和选择压等有关(详见下节)。图1-4.3列举了一个多序列局部保守性。生物信息学的一个重要任务是找到这些保守序列。图1-4.3 多序列局部保守性举例...[继续阅读]