功能域和基序通过多序列联配等途径可以获得它们的联配结果(如图1-4.4NBS 功能域)。在分子生物学领域,大量功能基因被克隆,大量功能域被发现;同时,基于序列分析,也可以发现大量基因共同保守的区段,这些为未知功能的候选功能域。...[继续阅读]
海量资源,尽在掌握
功能域和基序通过多序列联配等途径可以获得它们的联配结果(如图1-4.4NBS 功能域)。在分子生物学领域,大量功能基因被克隆,大量功能域被发现;同时,基于序列分析,也可以发现大量基因共同保守的区段,这些为未知功能的候选功能域。...[继续阅读]
信息量或信息熵的概念来自信息论。当我们说一条信息或消息,我们会问其信息量有多大或它可以提供给我们多少明确的信息。一条消息的信息量越大,其不确定性就越小。例如,我们说“今年将在中国召开G20峰会”和“2016年9月将在杭...[继续阅读]
在生物信息学领域,信息熵有两个广泛应用,如计分矩阵信息量的估计和序列保守性的图形描述等。1.计分矩阵我们构建了一个计分矩阵(如PSSM、PAM 和BLOSUM 矩阵)之后,经常会问的一个问题是,该矩阵用于序列搜索或保守区段的搜索效果如...[继续阅读]
1.简述渐进多序列联配算法(ClustalW 算法)。2.什么是功能域和基序(motif)?3.简述几种功能域的描述方式(模型)。4.请构建多序列联配结果(功能域)的马尔可夫模型并简要说明。5.说明PSSM 等矩阵的熵(H)和信息量(IC)的概念。...[继续阅读]
一个生物体的基因组是指一套染色体中完整的DNA 序列。例如,生物个体二倍体体细胞由两套染色体组成,其中一套DNA 序列就是一个基因组。也就是说,对于单倍体细胞,基因组是指编码序列和非编码序列在内的全部DNA 分子。对于有性生...[继续阅读]
在完成基因组序列拼接后,可以获得基因组的主要DNA 序列,甚至可能是整个基因组各条染色体的序列。这些序列中包含许多未知基因,将基因从这些基因组序列中找出来是生物信息学的一个重要任务。基因组DNA 序列上,一个蛋白质编码...[继续阅读]
在进行基因组序列注释过程中,一般会遇到两种情况:一是仅针对少量目标序列(如若干BAC 克隆序列)进行基因注释,目的是了解这些序列上可能的功能基因,二是针对一个新测序基因组进行全基因组水平的基因注释。对于第一种情况,可以...[继续阅读]
马尔可夫模型,也叫马尔可夫过程或马尔可夫链(Markov chain),是俄罗斯数学家Markov 在研究俄罗斯文学家普希金《奥涅金》作品不同音的出现规律时,于1907年提出来的一个数学模型,它是研究随机过程统计特征的一种概率模型。假设存在一...[继续阅读]
隐马尔可夫模型在实际应用中会涉及3个基本问题,即评估问题(evaluation)、解码问题(decoding)和学习问题(learning)。评估问题是已知观察序列O 和模型λ,如何计算由此模型产生此观察序列的概率P(O|λ)? 解码问题是已知观察序列O 和模型λ...[继续阅读]
1.HMM 基因预测模型HMM 是20世纪90年代最早在原核生物上用于基因预测。当时被用于大肠杆菌E.coli的基因预测(Krogh 等,1994),而在这之前,马尔可夫模型已在原核生物上被用于基因预测(Borodovsky 和McIninch,1993)。而后,HMM 被用于人类等真核生...[继续阅读]