基因组结构预测论文-杨海

导读:本文包含了基因组结构预测论文开题报告文献综述及选题提纲参考文献，主要关键词:高通量测序,双序列比对,Indel,结构变异

基因组结构预测论文文献综述

杨海^[1]（2019）在《基因组结构变异预测算法研究》一文中研究指出结构变异(Structural Variation,SV)通常是指规模介于单核苷酸多态性(single nucleotide polymorphism,SNP)和染色体变异之间的基因组变异形式,是生物遗传多样性的重要组成部分,不仅能够导致个体之间的表型差异,而且也与多种疾病的发生存在密切的联系。高通量测序技术的不断发展和广泛应用,为结构变异的预测和研究提供了技术支持。然而,数量规模庞大的短读长测序数据给结构变异预测带来了困难和挑战。基于高通量测序的基因组结构变异预测问题已经成为生物信息学领域的研究热点。由于包括人类在内的大部分动物和一半以上的高等植物,都是属于二倍体基因组。因此,重点围绕二倍体基因组展开研究,设计有效的结构变异预测分析算法,不仅能够提高预测结果的精确度和敏感度,有利于探索结构变异与重大疾病的内在关联,更能为多倍体基因组结构变异预测研究奠定基础。本文重点面向双序列比对问题和不同类型的结构变异预测问题进行研究,提出了一种双序列比对改进算法,以及基因组结构变异预测算法,以提高不同类型结构变异预测结果的精确度和敏感度。本文的主要内容和创新点如下:1.现有的双序列比对算法的回溯过程是严格按照最优解的来源方向执行的,容易造成比对结果中碱基过早匹配而不利于发现更长的空位片段,导致比对结果与InDel变异的实际情况产生偏差。另外,相对固定的空位罚分也不利于比对结果中增加空位和减少碱基错配。本文从动态空位罚分调整策略、算法逆推策略和得分矩阵单元格计算方法叁个方面对Needleman-Wunsch算法进行了优化和改进,提出了一种DNA双序列全局比对改进算法(DNA-NW)。由于改进算法的逆推策略不再严格按照最优解的来源方向执行,因此不再使用名词“回溯”,而称之为逆推策略。该算法分为预处理阶段和比对执行阶段,预处理是通过基于莱温斯坦距离的动态空位罚分策略(DGPS-LD)实现,根据计算出的两条序列的莱温斯坦距离动态调整空位罚分的分值,使得比对结果更加倾向于增加空位;比对执行阶段是利用Needleman-Wunsch改进算法(INW)实现。尤其是Needleman-Wunsch改进算法(INW)不仅执行效率高于原有的Needleman-Wunsch算法,而且采用新的逆推策略能够在保证最优比对得分不变的前提下找到更长的空位片段,减少错配个数,在降低假阳性SNP可能性的同时,能够预测出更长的InDel变异,使得DNA序列比对结果较好的符合了 InDel变异的实际情况,更加有利于InDel变异的预测。2.对InDel及其预测方法现状进行了综述,介绍了高通量测序原始数据的质控与预处理方法。针对长度小于50 bp的InDel预测问题展开研究,提出了一种基于拆分读片段(split read)的InDel预测与分析方法(SRInDel)。该算法首先划定拆分读片段在参考基因组上的比对目标区域,再利用基于k-mer短序列的比对目标区域修正算法进一步缩小参考基因组参与比对的区域长度,使得序列比对结果中更容易出现插入变异。序列比对过程是使用本文第2章提出的DNA双序列全局比对改进算法(DNA-NW)实现的,根据比对结果可以有效预测出InDel变异的类型、长度和断点位置。针对均聚物序列中可能出现的测序错误问题,提出了 InDel预测结果的修正方法,设计了编码区InDel及移码突变的预测方法,还提出了InDel纯合性和杂合性的判别方法。此外,针对短串联重复序列的预测问题,提出了一种基于k-mer短序列的预测方法(kmer-STR)。与常用的短串联重复预测算法SSRIT相比,kmer-STR算法在保证结果正确性的前提下,显着提高了算法的执行效率,并能适用于大规模基因序列中短串联重复的预测过程。3.介绍了结构变异的主要类型及其预测方法的发展;针对50bp以上的结构变异预测问题展开研究,重点研究插入变异、缺失变异、倒位变异、染色体内易位和染色体间易位等类型的结构变异特征,提出了一种基于不一致读片段对和split read的结构变异预测方法SVDS。该预测方法能够预测插入变异、缺失变异、倒位变异、染色体内易位和染色体间易位五种主要的结构变异类型。该结构变异预测算法的一个显着特点是在序列比对时保留每条paired-end read的多个可能的比对结果,从而增加结构变异预测的敏感度。同时,计算每个候选结构变异的发生概率,并利用集合覆盖问题过滤候选结果中的假阳性结构变异,从而使算法在敏感度和精确度两个方面都获得了较大的提升。4.针对长度在lkb以上的拷贝数变异预测问题,本文提出了一种基于隐马尔科夫模型的拷贝数变异预测算法(CNV-HMM)。为了提高预测结果的精确度,本文分别对read深度信号的统计和概率建模问题、测序数据的GC偏好性及其校正、比对率及其对read深度的影响等方面进行了研究,并提出相应的解决方法。为了进一步提高拷贝数变异预测结果的敏感度和精确度,CNV-HMM算法还使用了基于split read的结果优化方法,不仅能够过滤部分假阳性拷贝数变异,还能够通过合并相同的变异从而得到更长的拷贝数变异预测结果。(本文来源于《山东大学》期刊2019-04-20）

李广伟^[2]（2018）在《水稻生殖隔离遗传结构解析、S5位点演化起源与基于全基因组预测的亚种间杂种优势利用研究》一文中研究指出水稻具有丰富的遗传资源,亚洲栽培稻分为籼稻和粳稻两个亚种,籼粳亚种间具有很强的杂种优势,但是亚种间的杂种不育却阻碍着这种杂种优势的利用。已克隆和定位的杂种不育基因尚不能完全解释籼粳杂种不育机制,如何完全克服亚种间杂种不育障碍,利用籼粳亚种间杂种优势,是绿色超级稻新品种培育中亟待解决的问题。生殖隔离是新物种形成的标志,杂种不育是生殖隔离的主要形式之一,如何理解新物种起源演化的分子机制,一直是生物学研究的基础内容。以水稻为模式研究亚种间杂种不育,在理论上和应用上都具有重要意义。围绕这一主题,本研究主要从以下叁个方面展开:1.为了更全面解析籼粳亚种间杂种不育的遗传结构,我们选取了叁个具有代表性的水稻品种材料:日本晴(粳稻)、珍汕97(籼稻)和明恢63(籼稻),构建了叁个相应的F2群体。考察了胚囊、花粉和小穗育性叁种杂种不育性状,通过RADseq(restriction-site associated DNA sequencing)方法进行了简化基因组测序,构建了超高密度遗传连锁图谱和物理图谱。在单位点水平,一共检测到了27个影响育性的QTLs,包括胚囊育性7个、花粉育性7个和小穗育性13个,其中10个为本研究新检测到的QTLs。利用卡方检验,Nip×ZS97、Nip×MH63和ZS97×MH63群体分别鉴定到7个、7个和2个偏分离位点,有一半以上的偏分离位点不会对育性造成显着影响。在两位点水平,叁个群体中一共鉴定到了41对影响叁种育性的互作位点。两位点上遗传因子不亲和性互作会导致其偏离孟德尔自由组合定律,表现为两位点偏分离。使用卡方检验,我们在叁个群体一共鉴定到了192对此类型两位点遗传不亲和互作位点。详细比较发现,通过两位点基因型偏分离鉴定到的遗传不亲和性互作位点大部分并不能直接检测到对叁种育性的互作效应。2.S5位点是第一个克隆的控制籼粳杂种胚囊育性的主效位点,我们以其为模型,详细的研究了杂种不育位点的起源、演化形成机制。通过序列比对,我们在水稻第5染色体鉴定到了叁个相邻的基因为S5的同源基因,命名为Ospara3-5位点。共线性分析发现两个位点所在的染色体区域并不共线,同时两个位点上有多个Helitron转座子元件,侧翼序列也高度同源,由此推定可能是由Helitron转座子介导的转座而不是基因组复制事件,将第5号染色体的Ospara3–5复制到第6号染色体,产生了原始的S5位点。进一步,我们利用635份囊括了多个稻属种群的种质资源,通过PCR测序获得了ORF3-5叁个基因的完整序列,单倍型分析发现ORF3+ORF4+ORF5+是最古老的单倍型,然后逐步突变产生籼稻主要单倍型ORF3+ORF4-ORF5+和粳稻类型的主要单倍型ORF3-ORF4+ORF5-。利用529份亚洲栽培稻全基因组遗传多样性和分子演化分析发现,籼稻单倍型主要受到水稻驯化中选择作用,粳稻单倍型受到的瓶颈效应,造成相应等位基因频率上升,进而建立了S5位点的生殖隔离系统。3.为了更好里的利用籼粳亚种间杂种优势,我们选取了21份具有代表性的水稻品种材料为亲本,构建了包含210个杂交组合的双列杂交群体,考察了相关农艺性状。全基因组高通量测序鉴定到了2621064个SNPs,我们用g BLUP模型,采用5-倍交叉验证策略,对210个杂交组合表型进了预测。粒长、粒宽、千粒重、单株分蘖数、每穗颖花数、株高和单株干重7个性状,平均预测准确性分别为0.946、0.956、0.784、0.819、0.824、0.405。基于此模型,我们用籼籼和粳粳亚种内杂交组合的产量值对籼粳亚种间的组合产量进行了预测。结合其他农艺性状表型,预测产量靠前的杂交组合对应的亲本,可以作为以后广亲和新品种培育中重点关注的基础材料。本研究首先在不同方面、不同层次,系统的剖析了亚种间杂种不育遗传结构,同时鉴定到转座子引起的基因复制事件和随后的自然选择和奠基者效应对生殖隔离基因起源演化的贡献,进一步将全基因组选择育种方法运用到亚种间杂交品种选育工作。这些研究成果可以为促进亚种间杂种优势的利用提供有益信息。(本文来源于《华中农业大学》期刊2018-06-01）

李月月,孙健,谭冠林,马琨玲,李凡^[3]（2018）在《百合斑驳病毒云南分离物全基因组序列分析及CP结构预测》一文中研究指出对云南嵩明百合上发生的百合斑驳病毒(Lily mottle virus,LMo V)进行全基因组序列测定及分析,并对LMo V嵩明分离物(LMo V-SMi1、LMo V-SMi2)和玉溪分离物(LMo V-YXi1、LMo V-YXi2)外壳蛋白(coat protein,CP)基因进行序列比较,发现云南的LMo V分为2个类群,玉溪分离物属于种群I,嵩明分离物属于种群II。2个类群间的核苷酸和氨基酸同源性分别为86.7%～89.5%、90.1%～92.7%,玉溪分离物和嵩明分离物相比,cp基因发生了3个核苷酸的缺失。对国内外LMo V所有分离物的cp基因氨基酸序列进行系统进化分析,结果表明所有LMo V分离物可划分为2个种群,种群I分离物较种群II分离物几乎均存在1个苏氨酸缺失的差异。此外,对LMo V-SMi2的CP相关特性和空间结构进行了初步预测,认为该蛋白为球状,具有较强的表面可能性,不存在跨膜区域,大多数区域能够形成主要的抗原决定簇,主要集中在aa12-22、aa31-42、aa83-99、aa179-191、aa215-223、aa249-259区段,可作为制备抗血清选择抗原的参考。LM o V-SM i2和LM o V-YXi1在二级结构和叁级结构上存在一定的差异,但总体空间结构差异不大。(本文来源于《植物病理学报》期刊2018年02期）

巩校东,王玥,张盼,范永山,谷守芹^[4]（2015）在《玉米大斑病菌MAPK基因St IME2的基因组定位、蛋白质结构预测及表达分析》一文中研究指出【目的】确定玉米大斑病菌(Setosphaeria turcica)MAPK基因St IME2在基因组中的位置;系统解析目的蛋白质St Ime2的结构特征;分析玉米大斑病菌St IME2在不同发育时期及不同胁迫条件下(温度、氧胁迫、高渗胁迫)的表达,为深入研究该基因的功能奠定基础。【方法】通过本地Blast搜索玉米大斑病菌基因组数据库,确定St IME2在基因组的精确位置;利用Prot Param在线分析St Ime2蛋白的理化性质,利用SOMPA在线软件预测St Ime2蛋白的二级结构。通过PHYRE2在线服务器对St Ime2蛋白的叁维结构进行预测。利用半定量RT-PCR方法分析不同发育时期及不同胁迫条件下St IME2的表达。【结果】玉米大斑病菌St IME2为一类与酿酒酵母中Sc IME2具有较高同源性的基因,为在植物病原真菌中鲜有报道的MAPK基因。该基因的ID为98 105,位于scaffold_7正链的1 560 184—1 562 574位置,St Ime2蛋白具有MAPK类蛋白激酶的特征性保守结构域,其二级结构主要以α-螺旋和无规则卷曲为主,β-折迭较少且主要存在于N端,其叁级结构具有1个较小的N端域和1个较大的C端域;该基因在病菌分生孢子时期表达量最高,附着胞发育时期表达量最低。将病菌置于不同温度条件下处理,发现培养温度为28℃时St IME2表达量达到最高。在高渗胁迫条件下,随Na Cl浓度的增加,St IME2的表达量逐渐增加,但在较高胁迫条件下(0.8 mol·L-1 Na Cl),该基因表达几乎被完全抑制。经H2O2胁迫处理后,St IME2的表达量随H2O2的浓度增加而增强,在10 mmol·L-1 H2O2的处理下表达量最高。【结论】玉米大斑病菌St IME2位于scaffold_7正链的1 560 184—1 562 574位置。St Ime2蛋白具有MAPK激酶的所有特征性保守结构域,为一类功能鲜有报道的MAPK蛋白激酶。该基因在玉米大斑病菌分生孢子时期表达量最高,推测可能在调控病菌分生孢子发育过程中起重要作用。该基因的表达水平可随培养温度的变化而变化,28℃表达量最高。该基因可能参与病菌的高渗胁迫及氧胁迫反应。(本文来源于《中国农业科学》期刊2015年13期）

巩校东,范钰,李坡,杨阳,张长志^[5]（2013）在《玉米大斑病菌STK2的基因组定位、蛋白质结构预测及其表达》一文中研究指出【目的】确定玉米大斑病菌STK2在基因组中的位置;解析目的蛋白质Stk2的结构特征;构建STK2真核表达载体,获得真核表达体系中的胞外分泌蛋白。【方法】利用生物信息学方法,确定STK2在玉米大斑病菌基因组中的确切位置,解析Stk2蛋白质的结构特征;根据STK2的ORF序列及真核表达载体pPIC9K的多克隆位点设计引物,构建真核表达载体,采用电击转化法将重组质粒转入宿主菌GS115中进行诱导表达,利用SDS-PAGE检测并鉴定目的蛋白质。【结果】玉米大斑病菌STK2的ID为91433,该基因位于scaffold_3正链的1561986-1563262位置;Stk2蛋白具有MAPK类蛋白激酶的特征性保守结构域,其二级结构主要以α螺旋和无规则卷曲为主,β折叠较少且主要存在于N端,其叁级结构具有1个较小的N端域和1个较大的C端域;成功构建了STK2的真核表达载体pPIC9K-STK2,筛选获得了抗性转化子;在毕赤酵母菌中,经甲醇诱导得到了1个分子量约为41 kD的蛋白质组分且被分泌至胞外,该蛋白质的大小与理论分子量相符,推测Stk2蛋白已在宿主菌中表达并被分泌至胞外。【结论】玉米大斑病菌STK2位于scaffold_3正链的1561986-1563262位置;Stk2具有MAPK激酶的所有特征性保守结构域,属于典型的MAPK蛋白激酶;该基因能在真核细胞中表达,获得了可溶性分泌蛋白质,为Stk2蛋白的多克隆抗体制备及基因的功能研究奠定基础。(本文来源于《中国农业科学》期刊2013年12期）

王双寅^[6]（2012）在《基因组叁维结构的数据处理、结构预测和功能分析》一文中研究指出随着测序技术的快速发展,人们开始大量使用3C及其衍生实验技术来高通量地获取多个物种的全基因组交互信息,以揭示基因组功能与其空间结构间的关系。然而实验技术存在一定的局限性,使得这些技术对生物机理的揭示能力极大地依赖于数据的分析、处理与建模等计算方法。首先,由于生物系统的复杂性和实验技术的固有缺陷,实验数据中存在多方面的噪声。其次,实验技术获得的数据仅仅是染色质中各位点之间的相对交互频率信息,并没有直接提供各位点的空间位置信息。再者,实验测得的空间交互信息仅仅是整个基因组空间结构的部分信息。本工作对当前主流技术所测得的模式物种的全基因组交互数据进行处理和分析,考察评估了实验各环节对实验结果的影响。并在此基础上整合使用其它类型实验数据和生物知识,通过使用引入权重的基于约束数学优化策略的基因组叁维空间结构预测方法,建立了更加符合实验数据的酵母全基因组在叁维空间的结构模型。最后分析了基因的功能、基因的表达与基因组叁维空间结构之间的关系,发现表达水平正相关的基因更容易在叁维空间中发生交互。(本文来源于《华中农业大学》期刊2012-06-01）

徐卓菲,钱平,李祥敏,郭东春,姚清侠^[7]（2009）在《猪瘟弱毒C81株全基因组测序及分子结构预测》一文中研究指出参照已发表的猪瘟病毒弱毒株的序列,设计7对覆盖全长基因组的引物,通过RT-PCR从感染猪瘟病毒弱毒株的PK-15细胞中扩增得到7个cDNA片段,分别克隆到pMD18-T载体并测序,利用DNASIS软件获得猪瘟病毒C81株全基因组序列(GenBank:AY663656)。C81株基因组全长12310nt,只有一个大的开放阅读框,编码;3898个氨基酸的聚蛋白。序列分析表明,C81株开放阅读框与其它各毒株核苷酸和氨基酸序列的同源性变化较大,分别为84.4%～99.6%和91.6%～99.4%。同时,我们绘制了26株CSFVORF的进化树,比较了CSFV5'非翻译区核苷酸序列并推测其二级结构,发现不同毒株之间存在较大的差异,另外对C81株聚蛋白的功能域和叁维结构进行了预测。(本文来源于《畜牧市场》期刊2009年11期）

朱建丽^[8]（2007）在《水稻基因组序列分析与基因结构预测》一文中研究指出基因结构预测对于发现新基因、了解基因结构规律具有重要作用,是生物信息学领域的重要研究内容之一。对于水稻基因结构,虽然已研发了多个基因结构预测软件,但是预测精度仍不能令人满意。本研究首先以常用的水稻基因结构特征为基础,进一步分析发现功能位点的信号特征、编码区域和非编码区域密码子使用、剪接位点上游和下游区域的碱基组成等特征与序列的C+G含量具有很强的依赖关系。然后将水稻基因结构预测问题划分为基因级、元件级(外显子、内含子等)和特征级(翻译起始与终止位点、剪接位点、密码子使用等)等多个层次上的一系列较简单子问题,通过从简单到复杂进行逐级优化的策略建立了不同序列C+G含量的水稻基因结构模型,设计了基因结构寻优的动态规划算法,研制出了水稻基因结构预测软件RiceGenePRE。用广泛采用的测试数据集OsSNG550对该软件进行测试的结果显示,RiceGenePRE在核苷酸、外显子和基因水平上的预测效果均优于国际着名水稻基因结构预测系统FGENESH。RiceGenePRE现已提供网上服务(http://bioinfo.hust.edu.cn )。(本文来源于《华中科技大学》期刊2007-02-01）

涂白^[9]（2007）在《基于基因组序列比对信息挖掘的基因结构预测》一文中研究指出已完成及正在进行的不同物种的基因组测序工作,一方面促进了比较基因组方法在基因组研究中的广泛应用,另一方面使得预测基因组中蛋白质编码基因的研究愈加重要,目前已有不少研究通过采用比较基因组方法以获得高精度的基因预测系统。但是由于基因组序列的复杂性,基因组比较产生的相似性信息中具有大量的假阳性信息,因此,需要对蛋白质编码基因的相似性信息进行特征分析与挖掘,这对于正确利用基因组相似性、进一步提高基因结构预测系统的精度具有重要作用。为此开展了如下工作:首先,在观察基因组序列比对信息的基础上,深入分析了编码区相似性匹配区别于非编码区相似性匹配的特征,分析角度包括:匹配的相似性程度、在进化选择作用影响下匹配间的关系、基因编码区与相似性匹配区域的边界差异等。并以减少假阳性相似性信息为目标,设计了相应的相似性信息挖掘措施。其次,基于本实验室研制的基因结构从头预测系统GeneKey,提出了将相似性信息挖掘措施集成于该系统的总体方案,构建了用于处理序列相似性信息的模型,通过整合相似性特征重建了外显子模型,实现了融合序列相似性特征与统计性特征的基因结构预测系统。最后,采用广泛使用的数据集对系统的预测性能进行了测试,结果表明,通过整合相似性信息挖掘措施,GeneKey系统的预测性能得到了明显改善,同时该系统在核苷酸水平及外显子水平综合精度均优于国际同类预测软件TWINSCAN,表明了所提出的相似性信息挖掘措施及其与从头预测系统的融合方法的有效性。(本文来源于《华中科技大学》期刊2007-02-01）

徐卓菲,钱平,李祥敏,郭东春,姚清侠^[10]（2005）在《猪瘟弱毒C81株全基因组测序及分子结构预测》一文中研究指出参照已发表的猪瘟病毒弱毒株的序列,设计7对覆盖全长基因组的引物,通过RT-PCR从感染猪瘟病毒弱毒株的PK-15细胞中扩增得到7个cDNA片段,分别克隆到pMD18-T载体并测序,利用DNASIS软件获得猪瘟病毒C81株全基因组序列(GenBank:AY663656)。C81株基因组全长12310nt,只有一个大的开放阅读框,编码3898个氨基酸的聚蛋白。序列分析表明,C81株开放阅读框与其它各毒株核苷酸和氨基酸序列的同源性变化较大,分别为84.4%~99.6%和91.6%~99.4%。同时,我们绘制了26株CSFVORF的进化树,比较了CSFV5'非翻译区核苷酸序列并推测其二级结构,发现不同毒株之间存在较大的差异,另外对C81株聚蛋白的功能域和叁维结构进行了预测。(本文来源于《中国病毒学》期刊2005年04期）

基因组结构预测论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

水稻具有丰富的遗传资源,亚洲栽培稻分为籼稻和粳稻两个亚种,籼粳亚种间具有很强的杂种优势,但是亚种间的杂种不育却阻碍着这种杂种优势的利用。已克隆和定位的杂种不育基因尚不能完全解释籼粳杂种不育机制,如何完全克服亚种间杂种不育障碍,利用籼粳亚种间杂种优势,是绿色超级稻新品种培育中亟待解决的问题。生殖隔离是新物种形成的标志,杂种不育是生殖隔离的主要形式之一,如何理解新物种起源演化的分子机制,一直是生物学研究的基础内容。以水稻为模式研究亚种间杂种不育,在理论上和应用上都具有重要意义。围绕这一主题,本研究主要从以下叁个方面展开:1.为了更全面解析籼粳亚种间杂种不育的遗传结构,我们选取了叁个具有代表性的水稻品种材料:日本晴(粳稻)、珍汕97(籼稻)和明恢63(籼稻),构建了叁个相应的F2群体。考察了胚囊、花粉和小穗育性叁种杂种不育性状,通过RADseq(restriction-site associated DNA sequencing)方法进行了简化基因组测序,构建了超高密度遗传连锁图谱和物理图谱。在单位点水平,一共检测到了27个影响育性的QTLs,包括胚囊育性7个、花粉育性7个和小穗育性13个,其中10个为本研究新检测到的QTLs。利用卡方检验,Nip×ZS97、Nip×MH63和ZS97×MH63群体分别鉴定到7个、7个和2个偏分离位点,有一半以上的偏分离位点不会对育性造成显着影响。在两位点水平,叁个群体中一共鉴定到了41对影响叁种育性的互作位点。两位点上遗传因子不亲和性互作会导致其偏离孟德尔自由组合定律,表现为两位点偏分离。使用卡方检验,我们在叁个群体一共鉴定到了192对此类型两位点遗传不亲和互作位点。详细比较发现,通过两位点基因型偏分离鉴定到的遗传不亲和性互作位点大部分并不能直接检测到对叁种育性的互作效应。2.S5位点是第一个克隆的控制籼粳杂种胚囊育性的主效位点,我们以其为模型,详细的研究了杂种不育位点的起源、演化形成机制。通过序列比对,我们在水稻第5染色体鉴定到了叁个相邻的基因为S5的同源基因,命名为Ospara3-5位点。共线性分析发现两个位点所在的染色体区域并不共线,同时两个位点上有多个Helitron转座子元件,侧翼序列也高度同源,由此推定可能是由Helitron转座子介导的转座而不是基因组复制事件,将第5号染色体的Ospara3–5复制到第6号染色体,产生了原始的S5位点。进一步,我们利用635份囊括了多个稻属种群的种质资源,通过PCR测序获得了ORF3-5叁个基因的完整序列,单倍型分析发现ORF3+ORF4+ORF5+是最古老的单倍型,然后逐步突变产生籼稻主要单倍型ORF3+ORF4-ORF5+和粳稻类型的主要单倍型ORF3-ORF4+ORF5-。利用529份亚洲栽培稻全基因组遗传多样性和分子演化分析发现,籼稻单倍型主要受到水稻驯化中选择作用,粳稻单倍型受到的瓶颈效应,造成相应等位基因频率上升,进而建立了S5位点的生殖隔离系统。3.为了更好里的利用籼粳亚种间杂种优势,我们选取了21份具有代表性的水稻品种材料为亲本,构建了包含210个杂交组合的双列杂交群体,考察了相关农艺性状。全基因组高通量测序鉴定到了2621064个SNPs,我们用g BLUP模型,采用5-倍交叉验证策略,对210个杂交组合表型进了预测。粒长、粒宽、千粒重、单株分蘖数、每穗颖花数、株高和单株干重7个性状,平均预测准确性分别为0.946、0.956、0.784、0.819、0.824、0.405。基于此模型,我们用籼籼和粳粳亚种内杂交组合的产量值对籼粳亚种间的组合产量进行了预测。结合其他农艺性状表型,预测产量靠前的杂交组合对应的亲本,可以作为以后广亲和新品种培育中重点关注的基础材料。本研究首先在不同方面、不同层次,系统的剖析了亚种间杂种不育遗传结构,同时鉴定到转座子引起的基因复制事件和随后的自然选择和奠基者效应对生殖隔离基因起源演化的贡献,进一步将全基因组选择育种方法运用到亚种间杂交品种选育工作。这些研究成果可以为促进亚种间杂种优势的利用提供有益信息。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

基因组结构预测论文参考文献

[1].杨海.基因组结构变异预测算法研究[D].山东大学.2019

[2].李广伟.水稻生殖隔离遗传结构解析、S5位点演化起源与基于全基因组预测的亚种间杂种优势利用研究[D].华中农业大学.2018

[3].李月月,孙健,谭冠林,马琨玲,李凡.百合斑驳病毒云南分离物全基因组序列分析及CP结构预测[J].植物病理学报.2018

[4].巩校东,王玥,张盼,范永山,谷守芹.玉米大斑病菌MAPK基因StIME2的基因组定位、蛋白质结构预测及表达分析[J].中国农业科学.2015

[5].巩校东,范钰,李坡,杨阳,张长志.玉米大斑病菌STK2的基因组定位、蛋白质结构预测及其表达[J].中国农业科学.2013

[6].王双寅.基因组叁维结构的数据处理、结构预测和功能分析[D].华中农业大学.2012

[7].徐卓菲,钱平,李祥敏,郭东春,姚清侠.猪瘟弱毒C81株全基因组测序及分子结构预测[J].畜牧市场.2009

[8].朱建丽.水稻基因组序列分析与基因结构预测[D].华中科技大学.2007

[9].涂白.基于基因组序列比对信息挖掘的基因结构预测[D].华中科技大学.2007

[10].徐卓菲,钱平,李祥敏,郭东春,姚清侠.猪瘟弱毒C81株全基因组测序及分子结构预测[J].中国病毒学.2005

标签：高通量测序; 双序列比对; InDel; 结构变异;

基因组结构预测论文-杨海

基因组结构预测论文文献综述

基因组结构预测论文开题报告

基因组结构预测论文参考文献

猜你喜欢