导读:本文包含了细胞器基因组论文开题报告文献综述及选题提纲参考文献,主要关键词:细胞器基因组,数据库,网络爬虫,信息分析
细胞器基因组论文文献综述
陈琦,吉嘉铭,徐逸卿[1](2019)在《利用爬虫构建生物细胞器基因组数据库》一文中研究指出为了更加便捷地分析基因数据和序列,抓取NCBI的细胞器基因组相关数据做进一步研究。本文采用基于Python的网络爬虫,实现了细胞器基因组数据的信息抓取和相关基因信息的数据分析,提供了分类提取,封装导入数据库的功能。(本文来源于《电子技术与软件工程》期刊2019年07期)
南芳茹,冯佳,吕俊平,刘琪,方鹍鹏[2](2018)在《基于细胞器基因组的淡水红藻不同谱系的起源和进化历史研究》一文中研究指出采集淡水红藻不同谱系的代表类群,利用高通量测序方法,测得叁株淡水红藻包括深紫美芒藻(弯枝藻)Compsopogon caeruleus、弧形串珠藻Batrachospermum arcuatum和棘刺红索藻Thorea hispida的完整叶绿体和线粒体基因组。结合数据库中已发表的细胞器基因组数据,对不同谱系的淡水红藻细胞器基因组特征进行了比较分析,同时基于各基因组中的同源序列对红藻系统发育关系进行重建。结果显示在所有已发表的多细胞红藻基因组中,淡水深紫美芒藻(弯枝藻)C.caeruleus拥有最大的叶绿体基因组,其中内含子分布广泛。除过该种外,随着谱系进化的发生,红藻细胞器基因组的大小和GC含量均显示先扩大后缩小的变化过程。基于细胞器基因组大小、GC含量、系统发育分析和分歧时间的估算结果,淡水红藻不同谱系具有不同的起源,其中淡水种类深紫美芒藻(弯枝藻)C.caeruleus和河生胭脂藻Hildenbrandia rivularis均起源于内陆水体并在其中独立演化,而其它淡水种暗紫红毛菜Bangia atropurpurea、弧形串珠藻Batrachospermum arcuatum和棘刺红索藻Thorea hispida是从海洋近缘种入侵内陆水体演化而来。淡水红藻典型代表种类串珠藻目Batrachospermales和红索藻目Thoreales约在415-484百万年前从海洋近缘种掌状红藻Palmaria palmata发展而来,后期经过独立演化在叶绿体结构上发生了部分区域的重排,而线粒体基因组结构则相对保守。随着更广泛的样本采集和更多的细胞器基因组测序得以完成,淡水红藻的起源和系统演化历史会更加明确。(本文来源于《中国植物学会八十五周年学术年会论文摘要汇编(1993-2018)》期刊2018-10-10)
朱强龙[3](2018)在《西瓜与甜瓜细胞器比较基因组学研究》一文中研究指出西瓜(Citrullus lanatus L.)和甜瓜(Cucumis melo L.)均是世界性的园艺作物,具有重要的经济价值。细胞器基因组是一个物种全基因组的重要组成部分,研究西瓜、甜瓜细胞器(叶绿体和线粒体)基因组是继核基因组计划之后,解析西瓜、甜瓜全部遗传信息,进而实现西瓜、甜瓜分子设计育种的必经之路。目前有关西瓜、甜瓜细胞器基因组的研究较少,在一定程度上阻碍了西瓜、甜瓜基于细胞器基因组相关研究的开展。因此,对西瓜、甜瓜细胞器基因组研究具有重要的意义。本研究首先测序、拼接、组装并发表了栽培西瓜叶绿体基因组全序列,以及甜瓜线粒体基因组全序列,然后结合GenBank数据库中已经公布的基因组数据,对西瓜、甜瓜的细胞器基因组进行了全面的比较基因组学分析,主要研究内容和结果如下:1.完成并公布了首个栽培西瓜叶绿体基因组。栽培西瓜的叶绿体基因组由一个单环双链DNA分子构成,全长为156,906bp,呈典型的四段式结构,其中大单拷贝区(LSC)长86,844bp,小单拷贝区(SSC)长17,896bp,两个反向重复区(IRa和IRb)长均为26,083bp。整个基因组编码131个基因,其中包括86个蛋白编码基因、37个tRNA基因、8个rRNA基因;其基因组的结构、GC含量、基因排列顺序和密码子偏好性与其它高等植物的叶绿体基因组相似。此外,在西瓜的叶绿体基因组中存在19条串联重复序列(TR)、26对散在重复序列(DR)和53条简单重复序列(SSR),其中SSR类型多为多聚A和多聚T,主要分布于非编码区。2.提出了全新的基于高通量测序数据高效叶绿体基因组拼接策略。本研究提出了一套基于Illumina Hiseq全基因组测序数据从头组装叶绿体基因组的全新策略,无须单独分离纯化叶绿体基因组DNA,即可高效经济地获取植物叶绿体基因组完整序列,用该方法成功完成并首次公布了栽培西瓜叶绿体基因组,随后用该方法率先成功组装完成了药西瓜(Citrullus colocynthis)、热迷西瓜(Citrullus rehmii)、阿玛鲁西瓜(Citrullus amarus)等3个野生种西瓜,以及中国南瓜(Cucurbita moschata)、印度南瓜(Cucurbita maxima)、苦瓜(Momordica charantia)和葫芦(Lagenaria siceraria)等4个葫芦科植物的叶绿体参考基因组,再次验证该方法的良好通用性和实用性。基于15个葫芦科植物的叶绿体全基因组序列的比较基因组学分析发现,葫芦科植物的叶绿体基因组均为单环双链DNA分子,GC含量与西瓜相似,均在36.7~37.2%,全基因组长度约为155~159kb,平均长度约为157kb,编码基因数量为130~133个,平均有131个基因;叶绿体基因组之间整体的共线性比较好,没有发生重排现象。此外,我们基于15个葫芦科植物的叶绿体基因组序列的比对结果,开发了适用于葫芦科内物种鉴定、系统进化和群体遗传等相关研究的7个DNA barcoding和38个SSR标记,用叶绿体全基因组序列进行系统进化关系分析,可以得到与核基因组分析相似的结果。3.完成并公布了首个甜瓜线粒体全基因组完整序列。本研究利用具有读长优势的叁代测序技术PacBio Sequel测序数据用于甜瓜线粒体基因组研究,成功完成并公布了葫芦科植物中序列最长的甜瓜线粒体基因组完整序列,该基因组由3个环状的DNA分子组成,主环长度为2,709,526bp,其余两个小环,长度分别为149,555bp和47,592bp,基因组总长约为2.9Mb(2,906,673bp),GC含量为44.77%,高于甜瓜细胞核基因组和叶绿体基因组的GC的含量。该基因组编码了88个基因,包含40个蛋白编码基因,8个rRNA基因和40个tRNA基因,其中所有蛋白编码基因全部分布于主环上,仅有5个tRNA基因分布于第二个小环上,第叁个小环上没有任何编码基因。非编码基因序列占甜瓜线粒体基因组的绝大部分,其百分比值为98.32%。甜瓜线粒体基因组序列与叶绿体和细胞核基因组同源序列分别为2.73%和46.47%。此外,甜瓜线粒体基因组中共有4,861对同向重复序列,439对反向重复序列,653条串联重复序列,以及218条SSR序列,重复序列的总长度约占全基因组的44.2%。对甜瓜、西瓜、黄瓜和西葫芦的线粒体基因结构特征进行深入比较分析后发现,大量的重复序列和核基因组源序列是甜瓜线粒体基因组规模不断增大和变异的主要原因,此发现为葫芦科植物线粒体基因组的遗传变异提供依据。4.将叶绿体全基因组首次应用于西瓜、甜瓜的群体结构及遗传多样性的研究。本研究分别在314份西瓜材料的西瓜自然群体和348份甜瓜材料的甜瓜自然群体内鉴别了的82个和192个叶绿体基因组SNP位点,主要分布在叶绿体基因组的LSC区和SSC区内,互为反向重复的IRa和IRb中几乎不含有SNP位点。然后用这些SNP位点分析了西瓜、甜瓜自然群体的群体结构,并对每个群体的果实相关性状和群体遗传多样性进行深入分析,结果表明82个SNP能有效地将西瓜自然群体分为4个群体:野生毛西瓜群、半野生黏籽西瓜群、美洲生态型栽培西瓜群和亚洲生态型栽培西瓜群,其遗传多样性(π值)依次下降,分别为6.6×10~(-5),2.4×10~(-5),9.8×10~(-6)和5.41×10~(-6),野生毛西瓜群的单果重、可溶性固形物、果肉颜色和种子千粒重与其它叁个群有显着的差异。192个SNP能有效地将甜瓜自然群体分为3个群体:野生小甜瓜群、厚皮型栽培甜瓜群和薄皮型栽培甜瓜群,其遗传多样性也依次下降,分别为1.12×10~(-3)、4.71×10~(-4)和2.85×10~(-4),叁个群体之间的果肉厚度有显着差异。这些研究结果表明叶绿体全基因组可用于西瓜和甜瓜的群体遗传学研究,有助于种内亚群之间的分类和核心种质资源鉴定等研究。本研究发表的首个栽培西瓜叶绿体参考基因组及首个甜瓜线粒体参考基因组,所构建的叶绿体基因组从头拼接全新策略及开发的适用于葫芦科植物研究的DNA barcoding和SSR分子标记,将为今后西瓜、甜瓜系统进化、物种鉴定、群体遗传、核质互作、RNA编辑、基因工程等基于叶绿体和线粒体基因组的相关研究提供理论依据。(本文来源于《东北农业大学》期刊2018-06-01)
张学峰[4](2018)在《非洲栽培稻细胞器基因组组装及其系统进化分析》一文中研究指出作为植物体遗传信息的重要组成部分,叶绿体基因组和线粒体基因组在系统进化、物种鉴定、核质互作、基因工程等研究中均发挥重要作用。非洲栽培稻(Oryza glaberrima Steud)是水稻种质资源利用的重要材料,对其细胞器基因组进行组装和分析,对拓宽水稻种质资源的遗传背景,开创水稻育种新途径具有重要意义。迄今,已经完成测序的水稻品种包括普通栽培稻和部分野生稻种,但尚无关于非洲栽培稻RAM3线粒体基因组序列的报道。本研究以非洲栽培稻RAM3构建的多个基因组文库为数据基础,拟分别完成其线粒体基因组和叶绿体基因组的组装,并对其进行初步分析,主要研究结果如下:1.叶绿体基因组的组装及分析:利用Miseq PE2500双末端测序数据,以NCBI收录的27条叶绿体基因组序列为参考,通过BWA比对提取水稻叶绿体基因组序列,并用Discovar Denovo软件进行初步组装并分别获得其LSC、SSC和IR序列片段,进一步连接完成后得到完整的RAM3叶绿体基因组。非洲栽培稻RAM3的叶绿体基因组全长134582bp,呈典型的四段式结构,编码117个基因,包含83个蛋白编码基因、4个r RNA和30个t RNA;其基因组结构、基因顺序、含量和密码子使用情况与其它已发表水稻的叶绿体基因组相似。在非洲栽培稻RAM3的叶绿体基因组中共检测到32个散在重复序列和32个串联重复序列。对非洲栽培稻RAM3叶绿体基因组的16个简单重复序列(SSR)分析发现:SSR都是多聚A或多聚T,在叶绿体基因组内呈不均一分布。2.比较基因组研究:非洲栽培稻与稻属其他五个AA物种(Japocin、Indica、Nivara、Rufipogon、Barthii)的叶绿体基因组整体相似性较好,但基因间区的变异较大;非洲栽培稻RAM3与五个AA稻属叶绿体基因组的IR边界基因都是一样,只有距离远近稍有偏差;基于31种植物7种不同的叶绿体基因数据集构建了系统进化树,进行了系统发育研究,发现叶绿体基因组的LSC、CDS、全序列、IGS数据集在进化分析中的支持率较高,结果更为可靠。并筛选出5个非洲栽培稻叶绿体特异标记,验证了本实验室自主选育的非洲栽培稻基因渗入系均具有非洲栽培稻细胞质。3.线粒体基因组的组装及分析:同时利用叁个软件对非洲栽培稻RAM3线粒体基因组进行拼接组装,组装结果序列全长为495258 bp,共编码84个基因,其中包含64个蛋白编码基因、3个r RNA和28个t RNA,整条线粒体含有16个内含子,分布在9个蛋白编码基因中。在非洲栽培稻RAM3的线粒体基因组中共检测到94个散在重复序列和29个串联重复序列。对非洲栽培稻RAM3线粒体基因组的37个简单重复序列(SSR)分析发现:SSR都是多聚A或多聚T,与叶绿体基因组相似,它们在线粒体基因组内呈不均一分布。对密码子使用偏性分析发现:亮氨酸的使用概率最高,色氨酸和蛋氨酸最少。4.非洲栽培稻RAM3线粒体基因组间序列分析,共发现75个AT富集区,A+T最大差异可以达到35.19%;预测RAM3线粒体基因组中28个t RNA的二级结构,共发现58个错配和1个缺失;对基因的选择压力分析,发现:受正向选择的基因nad6选择压力最大,基因nad2受到的选择压力最小,受中性选择的是基因cob。5.非洲栽培稻RAM3细胞器基因组间序列迁移分析:由叶绿体往线粒体的序列迁移,片段总长22311bp,约为非洲栽培稻RAM3线粒体基因组总长的4.5%。共有21个迁移片段长度大于或等于100bp,其中最长的片段长度为6752bp。(本文来源于《华中农业大学》期刊2018-06-01)
王硕[5](2016)在《植物细胞器基因组变异与进化机制研究》一文中研究指出植物的叶绿体和线粒体分别是植物细胞中光合作用和呼吸作用的执行中心,它们是生物依赖环境生存的基础,也是地球碳-氧循环的重要媒介。自内共生作用以来,叶绿体和线粒体基因组伴随着植物由单细胞藻类到被子植物的进化历程而发生了各种复杂的基因组变异。高通量基因组测序技术的迅猛发展,使得大量植物细胞核及细胞器基因组得以测序,为我们提供了更多机会去深入了解在植物的进化过程中细胞器基因组的变异规律,也为今后在全基因组的水平上了解细胞器在植物执行光合和呼吸的作用过程中所发挥的生理功能提供了基础。在本论文中,我们首先对蔷薇科一种重要的木本油料作物青刺果(Prinsepia utilisRoyle)的叶绿体全基因组进行了测序和组装分析。其序列总长度为156 328 bp,编码131个基因。将该序列与蔷薇科其他植物的叶绿体全基因组序列一起进行的比较基因组学分析结果显示,这些基因组在结构、基因排列顺序、必需基因含量及相应的基因功能等方面都非常相似。我们还分析了叶绿体基因组不同区域、不同功能的基因的序列特征,这些变异规律不同的序列能够作为分子标记,在不同分类水平上的进化研究中发挥重要的作用。通过对被子植物部分代表物种叶绿体基因组的比较分析,我们发现叶绿体基因组中大部分序列的变异度都与该序列的碱基组成之间存在明确的相关性,即cpDNA序列的GC含量越高,该序列越趋于保守(如IR区、rRNA基因、matK基因等);反之GC含量越低,该序列越趋于变异(如cp-SSRs和InDels多数以PolyA和PolyT为主)。这种相关性普遍存在于单子叶植物和双子叶植物中,可以在很大程度上解释植物叶绿体基因组的变异进化规律,并且可以用于适度指导叶绿体分子标记的选择和开发。为了研究植物线粒体基因组的变异规律,我们对禾本科亚洲栽培香稻(Oryza aativa ssp.aromatic)的线粒体基因组和细胞核基因组进行了组装和分析。其线粒体基因组大小为498 676 bp,编码64个基因;细胞核基因组为336 Mbp,编码39 860个基因。基因组水平的比较分析发现,植物线粒体基因组内存在着大量的序列重排和重复序列的变异,表现为较差的基因组共线性,而其蛋白编码基因却是相对保守的。此外,我们还发现水稻线粒体基因组也通过水平基因转移整合了来自叶绿体等基因组的基因,同时,它还转移了大量的基因组序列到细胞核染色体上。在此基础上,结合前人有关线粒体基因组的其它发现,我们提出了新的植物线粒体基因组功能和变异模型,即植物线粒体基因组在被子植物进化过程中,充当了水平基因组转移的核心载体。它首先通过重复序列介导的基因组融合的方式,捕获自身或者其它物种的基因甚至是完整的基因组,再将多余的基因组片段转移到细胞核染色体中,从而增加了被子植物核基因组的多样性和复杂性,为被子植物适应环境变化所需的多样性进化提供了基础。该模型也解释了被子植物线粒体基因组在形态、大小、拷贝数以及结构上的复杂变异产生的原因。高通量测序技术的不断进步使越来越多的环境基因组学大数据被释放,然而随着测序成本的降低,如何深入挖掘、充分利用这些原始数据成为阻碍其发展的新瓶颈。在以上植物叶绿体和线粒体基因组学分析方法的基础上,我们继续摸索改进数据分析流程,形成了一套完整的细胞器基因组解决方案——即从动植物总DNA或总RNA测序数据中,直接获取完整的植物叶绿体和动植物线粒体基因组序列。我们利用来自水稻(Oryza sativa)3000基因组测序项目的部分原始数据,完整拼接出92个叶绿体全基因组;并对其它一些重要植物如谷子(Setaria italicaa)、青狗尾草(Setaria viridis)、梅花(Prunum mume)、拟南芥(Arabidopsisthaliana)等的叶绿体基因组,19个不同品种西瓜(Citrullus lanatus)的线粒体基因组,以及动物如黑狐蝠(Pteropusalecto蝠的线粒体基因组进行了组装分析。这些结果证实了对基因组大数据进行挖掘利用的重要性和技术可行性,为将来更多环境生物学大数据的分析做了铺垫。最后,我们对一种形成于大约一亿年前的琥珀所包含的内含物进行了 DNA提取的初步尝试。尽管利用传统的CTAB提取方法暂时难以检测到目标DNA,但通过新的微量基因组测序技术,将有希望对古老琥珀中的DNA进行基因组序列的测定和分析,为我们进一步分析物种的起源和进化提供新的思路。(本文来源于《昆明理工大学》期刊2016-05-01)
武成艳[6](2016)在《基于拓扑二级结构和阅读框识别不同细胞器基因组的非编码RNA》一文中研究指出随着功能基因组学的飞速发展,对非编码转录产物功能的研究引起越来越多人的关注。人类基因组中超过98%的序列为非蛋白质编码DNA,这些非编码DNA序列大部分会转录成RNA,并且直接以RNA的形式发挥功能,参与基因的转录调控、蛋白质的翻译等重要的生物学功能。而且近年来人们发现非编码RNA往往与疾病、DNA损伤修复、植物的应激反应有关。随着RNA数据的积累,细胞核基因组编码的短链或长链非编码RNA(Non-coding RNA,ncRNA)被确认对线粒体的功能以及线粒体动力学有一定的调节作用。许多ncRNAs一方面调控与细胞器功能相关的核基因,同时也与线粒体的形态、新陈代谢,线粒体白噬以及与线粒体有关的凋亡有关。然而,人们对遗传信息在不同细胞器间以ncRNAs形式传递的了解长期以来仍然有限。因此,理解细胞器之间的ncRNAs信息传递显得非常重要。随着ncRNA研究在细胞器基因组水平的日益深入,发现对不同细胞器基因组转录的ncRNA的识别有助于进一步了解不同细胞器基因组ncRNA的功能。本研究在细胞器基因组水平对不同细胞器基因组转录的ncRNAs的注释问题进行了系统的研究,包括构建细胞器基因组水平不同定位信息的非编码RNAs数据集、结合ncRNA序列和结构特征提取有效的特征参数并对参数进行优化、预测算法的建立以及算法的推广等。积累的组学数据所呈现的基因水平的复杂性很难从蛋白质编码基因数量的角度加以解释,为此,有人认为长期以来被认为是垃圾的、缺乏蛋白质编码能力的ncRNA的调节作用可以解释这种现象。其中,微小RNAs (microRNAs, miRNAs)和小干涉RNAs (siRNAs)一致被认为在生物的调控功能中扮演重要角色。本论文最后,以microRNA为例,研究非编码RNA与靶基因对乳腺癌的发生、发展的调控作用。考虑到多个microRNA对靶基因存在协同调控作用,我们选取在乳腺癌中起抑癌作用的miR-17-92基因簇及其2个旁系同源基因簇转录的1 5种microRNA序列及其共调控靶基因作为研究对象,对基因簇转录的microRNA序列特征及其共调控靶基因在乳腺正常组织和乳腺癌组织中的调控作用进行研究。论文主要的研究内容如下:一、我们首次从NONCOGING v3.0数据库中收集并整理出有细胞器基因组注释的ncRNA序列,并对序列长度分布进行分析。考虑到序列相似性对预测的影响,进一步采用Cd-hit软件构建了序列相似性在80%以下的数据集ncRNA_361 dataset。从最简单的碱基物理化学特性出发,讨论不同细胞器基因组转录的ncRNA序列的理化特性。在此基础上进一步考虑阅读框下的n-mer组分偏好,结构-序列模式下叁联体组分,以及简并密码子偏好。通过深入探讨无阅读框与阅读框对识别不同细胞器基因组转录的ncRNA序列的影响,发现最优阅读框为第一阅读框。二、考虑到ncRNA的结构信息更能反映ncRNA执行功能时的空间构象,而保守模体反映了序列在长期进化过程中的压力。我们首次提取ncRNA序列的拓扑二级结构特征和保守模体作为在细胞器基因组水平识别ncRNA的特征参量。特征的融合不可避免会带来维数的增加,我们结合前人的经验,提出两种不同的降维方法:一是特征的降维映射,二是基于mRMR的增加特征选择(IFS)的方法,即选取最优特征子集。结合目前较为流行的离散增量算法(increment of diversity classifier, ID)、K紧邻算法(K-nearest neighbor classifier, KNN)以及支持向量机算法(support vector machine, SVM)提出多算法的融合:改进的离散量结合K紧邻算法(the improved K-minimum increment of diversity classifier, iK-MID)、高效的平均K紧邻算法(the improved K-nearest neighbor classifier, iKNN)以及离散增量结合支持向量机算法(the increment of diversity combining support vector machine,ID-SVM)。最后,通过不同算法之间的相互比较,探索更加有效的细胞器基因组ncRNA识别的理论模型。叁、应用生物信息学手段,对特定miRNA基因簇(hsa-miR-17-92基因簇)及其旁系同源基因簇转录的miRNA序列特征及其共调控靶基因在乳腺不同组织的表达水平进行了研究,并利用反馈机制简单解释该miRNA对下游基因的调控机制,为生物学实验提供了有一定研究意义和价值的线索。(本文来源于《内蒙古大学》期刊2016-03-25)
武成艳,李前忠,陈颖丽[7](2015)在《不同细胞器基因组转录的ncRNA的序列特征分析和识别》一文中研究指出统计分析了不同细胞器基因组转录的非编码RNAs(non-coding RNAs,ncRNAs)的kmer频数、约化后的碱基组分、结构-序列模式中叁联体偏好.并以上述叁种特征提取方法分别构成特征向量表示ncRNA序列,利用支持向量机,对四类细胞器基因组转录的ncRNAs的序列进行识别.分析两种不同的碱基约化方式发现,嘌呤/嘧啶约化(MN约化)更能反应不同细胞器基因组转录的ncRNAs的序列信息;考虑结构和碱基种类的结构-序列模式(stru-seq mode)中的叁联体短片段(k=3),揭示出ncRNA与编码蛋白质的mRNA或蛋白质相互作用可能存在局域结构叁联体偏好.在Jackknife检验下,预测总精度最高达到83.10%.采用不同参数的预测结果表明,结构-序列模式(stru-seq mode)中的短片段(k=3)结构有助于不同细胞器基因组转录的ncRNAs区别.(本文来源于《内蒙古大学学报(自然科学版)》期刊2015年05期)
毕桂萁[8](2015)在《海水红毛菜(Bangia fuscopurpurea OUCPT-01)与暗紫红毛菜(Bangia atropurpurea)细胞器基因组测序及系统发育分析》一文中研究指出海水红毛菜(Bangia fuscopurpurea)与暗紫红毛菜(Bangia atropurpurea)同属于红藻门(Rhodophyta)、红藻纲(Rhodophyteae)、红毛菜亚纲(Bangiaphycidae)、红毛菜目(Bangiles)、红毛菜科(Bangiaceae)。红毛菜科的系统分类与起源进化一直备受关注,而淡水与海水红毛菜的起源问题则是其中的焦点问题。迄今为止,对携带重要进化信息的红毛菜的细胞器基因组信息仍是一片空白。为了深入了解海水种与淡水种红毛菜细胞器基因组的结构与内容,探究淡水与海水红毛菜的进化与起源关系,本文利用二代高通量测序技术,结合多种拼接方法,首次测定了福建莆田海水红毛菜与山西娘子关暗紫红毛菜的细胞器基因组,并对其进行了比较基因组学与基因组系统进化分析,推断了红毛菜科藻类的物种分歧时间。主要成果和结论如下:(1)构建了红毛菜科细胞器基因组拼接流程。(2) 福建莆田海水红毛菜与山西娘子关暗紫红毛菜分别属于典型的海水红毛菜类群('Bangia'2属)与淡水红毛菜类群(Bangia属)。(3)福建莆田海水红毛菜(Bangia fuscopurpurea OUCPT-01)叶绿体与线粒体基因组大小分别为196,913 bp(GC含量:33.9%),43,517 bp(GC含量:32.4%)。山西娘子关暗紫红毛菜叶绿体,与线粒体基因组大小分别为189,505 bp(GC含量:32.4%),35,679 bp (GC含量:30.9%)。两株红毛菜叶绿体基因组在rRNA操纵子数量(海水红毛菜有两个,淡水红毛菜则为一个)与基因间隔区存在长度差异。在基因内容方面,除orf个数与长度不同,其他编码基因内容一致。两叶绿体基因组呈高度共线性,相似性为86%。两株红毛菜线粒体基因组编码核心基因一致,但在内含子个数、位置、长度存在较大差异。其基因排列顺序也呈共线性。红毛菜科细胞器基因组中存在外源片段,可能是残存基因片段,也可能是外源DNA侵染;红毛菜科叶绿体基因组结构保守,呈高度共线性;红毛菜科线粒体基因组内含子多样化。(4)建立了细胞器基因组序列比对文件构建的快速流程。(5)发现红毛菜科叶绿体基因组tmRNA有较好的属间分辨能力,可以用来对红毛菜科进行系统分类学研究。对已测序红藻细胞器基因组进行了系统发育研究。结果显示,淡水红毛菜与Pophyra属有更近的亲缘关系。海水红毛菜与淡水红毛菜和Pophyra聚为一枝,而非与Pyropia聚为一枝,与Sutherland等研究结果有出入。(6)推断红毛菜科物种分歧时间,发现红毛菜科物种分歧时间集中在泥盆纪至白垩纪,淡水红毛菜与Porphyra属的物种分歧时间处于二迭纪范围(期间发生古中国经海西运动,海陆交替)。结合基因组系统发生关系,推断山西娘子关暗紫红毛菜起源于海水红毛菜。(本文来源于《中国海洋大学》期刊2015-05-25)
张同武[9](2012)在《植物细胞器基因组测序,组装及比较基因组学研究》一文中研究指出植物的细胞器(叶绿体和线粒体)基因组序列为研究植物分子生态及进化提供了重要的资源和信息。随着DNA高通量测序技术的发展,越来越多的植物全基因组被测序。然而,由于植物的细胞器基因组DNA难于和核基因组DNA分离,这使植物中单独分离纯化细胞器DNA测序变的非常麻烦、困难及耗时长。因此,能从植物全基因组测序数据中组装叶绿体及线粒体基因组变的非常重要。本论文报道了我们基于罗氏454测序平台开发的一种新的快速的叶绿体及线粒体基因组测序及组装流程。其原理是根据植物细胞中通常含有多个拷贝的细胞器基因组,并且其拷贝数与全基因组测序数据组装成的一致性序列(contig)覆盖度成正相关。通过分离不同覆盖度的contig并结合罗氏454测序数据组装特点,能快速的组装成完整的植物叶绿体和线粒体基因组序列。这种流程不需要分离任何的细胞器DNA,并且测序得到的数据绝大部分能用于后续植物的全基因组测序计划。此外,该流程基因组组装方法能解决用传统方法组装线粒体面临的复杂多环结构的问题。利用该流程,我们测序得到了复苏植物牛耳草(Boea hygrometrica)和沙特阿拉伯水稻(Hassawi rice)及其杂交稻中叶绿体及线粒体全基因组序列,从而证明了该方法的有效性。本论文对复苏植物牛耳草的叶绿体及线粒体进行了基因组学分析,并与其它不同进化地位的植物进行了比较基因组学分析。牛耳草叶绿体及线粒体基因组大小分别为153,493bp和510,519bp。牛耳草叶绿体基因组编码了147个基因,其编码区占整个基因组72%,而牛耳草线粒体基因组只有12%的编码区编码65个已知基因。与其它被子植物相似,牛耳草叶绿体基因组具有典型的四部分结构,并且每部分含有基因都比较保守。牛耳草线粒体基因组具有叁个重组的重复序列,其长度分别为222bp、843bp和1474bp。这叁个重复序列导致其基因组分为一个主环(MC)及4个异构分子。与其它被子植物比较,牛耳草线粒体基因组最大特点在于存在更为频繁的叶绿体基因组片段转移进线粒体事件。另外,我们比较分析了不同植物叶绿体及线粒体基因组的特征和基因的组织结构及分布,为理解植物细胞器基因组进化提供更多线索。同时,被子植物线粒体基因组中发现的叶绿体来源的片段(cp-derived sequences)包括tRNAs等分析,进一步支持了植物细胞器中频繁基因转移事件可能起源于早期陆地植物系。最后,本论文对测序组装得到的野生型沙特阿拉伯水稻(Hassawi-1)及其杂交稻(Hassawi-2)的叶绿体及其线粒体全基因组进行了比较分析。分析发现,沙特阿拉伯水稻的叶绿体和粳稻日本晴及籼稻93-11很相近。其基因结构,顺序及大小都很保守。然而沙特阿拉伯水稻的线粒体基因组和其它品种却相差很大。比较野生型沙特阿拉伯水稻及其杂交稻,叶绿体基因组存在16个InDel(Insertion和Deletion),而其线粒体基因组存在48个InDel、26个SNP及一种新的变异成为反向互补序列变异(RCV)。Hassawi-1与籼稻93-11线粒体基因组之间存在2个RCV变异,而Hassawi-1与粳稻日本晴线粒体基因组之间存在4个RCV变异。微卫星序列(SSR)特征比较分析显示与其它水稻品种相比,Hassawi水稻叶绿体及线粒体基因组存在更多的SSR序列在基因区域。Hassawi水稻的线粒体基因组中存在较多的重复序列,并导致线粒体基因组的重排。在Hassawi-1及Hassawi-2水稻线粒体基因组中发现最长的重复序列分别为96,168bp及96,165bp。我们推测这种基因组重排的机制可能与沙特环境压力下维持Hassawi水稻的稳定性有关。通过野生型沙特阿拉伯水稻及其杂交稻细胞器基因组的变异分析,并且结合该水稻的遗传育种等信息,我们推测Hassawi水稻可能来源于印度尼西亚的Peta品种。这些分析对将来Hassawi水稻的分子遗传及育种研究提供了重要的遗传背景。(本文来源于《浙江大学》期刊2012-03-01)
崔翠菊[10](2010)在《叶绿体基因工程与植物细胞器基因组进化研究》一文中研究指出植物细胞中,除了细胞核中具有遗传物质DNA之外,叶绿体和线粒体也拥有半自主性的能自我复制和遗传的基因组。随着基因组测序技术的发展,越来越多的植物核基因组、叶绿体基因组和线粒体基因组相继完成了测序。研究发现叶绿体基因组和线粒体基因组结构和序列信息在揭示物种起源、进化演变及其不同物种之间的亲缘关系等方面具有重要价值;与此同时,比核转化具有明显优势的叶绿体转化技术在遗传改良、生物制剂的生产等方面显示出巨大潜力,使得叶绿体基因工程成为植物基因工程中发展的新领域。叶绿体基因组结构和序列分析则是叶绿体基因工程的基础,而叶绿体基因工程研究又为细胞器与核基因组之间的基因转移、基因表达的协调作用机制等研究提供实践证明,对研究植物的进化起源有重要的意义。叶绿体基因工程技术也随着叶绿体测序的完成逐渐成为转基因定点整合、多拷贝高效表达外源基因,培育优良性状农作物品种和作为生物反应器合成目的蛋白的热门选择。本研究以小麦叶绿体基因组中的atpB和rbcL作为同源重组片段,用nptII和gfp分别作为筛选基因和标记基因,构建小麦叶绿体定点整合表达载体,用基因枪轰击法分别转化小麦的幼胚盾片和幼穗段。对T0代再生植株进行分子生物学验证,PCR和Southern blot结果证实标记基因gfp已经成功整合到叶绿体基因组中,并得到了同质化的再生植株。用T1代植株的叶片检测到GFP绿色荧光在叶绿体中表达,证明已经成功建立了小麦叶绿体稳定遗传转化体系。应用植物细胞作为生物反应器生产药用蛋白或疫苗等也成为现今研究的热点,本研究用农杆菌浸染烟草叶片的方法将人干扰素α-2b基因转入烟草核基因组,在再生烟草植株的叶片蛋白中检测到具有活性的人干扰素α-2b蛋白;构建了烟草叶绿体定点整合载体,为以烟草叶绿体表达人干扰素α-2b蛋白做好了前期准备。本文全面统计分析研究了已完成测序的藻类,苔藓,蕨类,裸子,被子植物的各物种的核基因组和细胞器基因组的相关信息。分别比较了不同物种的基因组大小,基因编码区和非编码区的大小变化趋势。在174种叶绿体基因组已测序的物种中,有26种核基因组也完成了测序,分别比对各物种的叶绿体基因组和它的核基因组,结果发现随着物种越来越高等,其叶绿体基因在核基因组中的同源性也越来越高,有5种被子植物的同源性高达100%。对15种线粒体基因组和核基因组都已测序的物种进行同样的全序列比对,也发现了随物种进化逐渐增高的趋势,但与叶绿体相比,不是太明显,最高的同源比例仅为82.6%。本文还对藻类、双子叶植物和单子叶植物的叶绿体的保守基因进行了统计。将单子叶植物保守基因中没有的藻类的保守基因分别与拟南芥和水稻的核基因组比对分析,其中绝大多数遗传系统基因都成功转移,而光合系统和生物合成系统则都丢失了相当一部分基因。还对拟南芥和水稻的叶绿体基因和线粒体基因在核基因组中的同源比例和拷贝数进行了统计。综合分析这些序列的信息后,我们提出以下假设,在植物进化过程中,细胞器基因到核基因组的转移,大致经过了先以拷贝的形式转移到核基因组的非编码区,而后获得表达功能,细胞器中相应基因的消失进而使细胞中的遗传物质逐步转移到核基因组中,最终实现核基因组对植物遗传物质表达的总体调控功能。(本文来源于《华中科技大学》期刊2010-08-01)
细胞器基因组论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
采集淡水红藻不同谱系的代表类群,利用高通量测序方法,测得叁株淡水红藻包括深紫美芒藻(弯枝藻)Compsopogon caeruleus、弧形串珠藻Batrachospermum arcuatum和棘刺红索藻Thorea hispida的完整叶绿体和线粒体基因组。结合数据库中已发表的细胞器基因组数据,对不同谱系的淡水红藻细胞器基因组特征进行了比较分析,同时基于各基因组中的同源序列对红藻系统发育关系进行重建。结果显示在所有已发表的多细胞红藻基因组中,淡水深紫美芒藻(弯枝藻)C.caeruleus拥有最大的叶绿体基因组,其中内含子分布广泛。除过该种外,随着谱系进化的发生,红藻细胞器基因组的大小和GC含量均显示先扩大后缩小的变化过程。基于细胞器基因组大小、GC含量、系统发育分析和分歧时间的估算结果,淡水红藻不同谱系具有不同的起源,其中淡水种类深紫美芒藻(弯枝藻)C.caeruleus和河生胭脂藻Hildenbrandia rivularis均起源于内陆水体并在其中独立演化,而其它淡水种暗紫红毛菜Bangia atropurpurea、弧形串珠藻Batrachospermum arcuatum和棘刺红索藻Thorea hispida是从海洋近缘种入侵内陆水体演化而来。淡水红藻典型代表种类串珠藻目Batrachospermales和红索藻目Thoreales约在415-484百万年前从海洋近缘种掌状红藻Palmaria palmata发展而来,后期经过独立演化在叶绿体结构上发生了部分区域的重排,而线粒体基因组结构则相对保守。随着更广泛的样本采集和更多的细胞器基因组测序得以完成,淡水红藻的起源和系统演化历史会更加明确。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
细胞器基因组论文参考文献
[1].陈琦,吉嘉铭,徐逸卿.利用爬虫构建生物细胞器基因组数据库[J].电子技术与软件工程.2019
[2].南芳茹,冯佳,吕俊平,刘琪,方鹍鹏.基于细胞器基因组的淡水红藻不同谱系的起源和进化历史研究[C].中国植物学会八十五周年学术年会论文摘要汇编(1993-2018).2018
[3].朱强龙.西瓜与甜瓜细胞器比较基因组学研究[D].东北农业大学.2018
[4].张学峰.非洲栽培稻细胞器基因组组装及其系统进化分析[D].华中农业大学.2018
[5].王硕.植物细胞器基因组变异与进化机制研究[D].昆明理工大学.2016
[6].武成艳.基于拓扑二级结构和阅读框识别不同细胞器基因组的非编码RNA[D].内蒙古大学.2016
[7].武成艳,李前忠,陈颖丽.不同细胞器基因组转录的ncRNA的序列特征分析和识别[J].内蒙古大学学报(自然科学版).2015
[8].毕桂萁.海水红毛菜(BangiafuscopurpureaOUCPT-01)与暗紫红毛菜(Bangiaatropurpurea)细胞器基因组测序及系统发育分析[D].中国海洋大学.2015
[9].张同武.植物细胞器基因组测序,组装及比较基因组学研究[D].浙江大学.2012
[10].崔翠菊.叶绿体基因工程与植物细胞器基因组进化研究[D].华中科技大学.2010