湖北省武汉市第十四中学高三(4)班430060
【摘要】生物信息学是由生物、数学、物理、化学、计算机科学等多学科融合交叉产生的新学科和新技术。它是未来生物技术的核心和关键,在生物学的发展中至关重要。本文主要介绍生物信息学的定义、生物信息学产生的背景、生物信息学的研究内容、生物信息学相关联的交叉学科、生物信息学的经济效益、生物信息学的发展现状及未来趋势等,全面来了解生物信息学。生物信息学已渗透到了人们的生产和生活中,其作用和功能将日益凸显和重要。
【关键词】生物信息学;基因组计划;系列分析;药物设计;数据挖掘;计算机科学
一、生物信息学的定义
生物信息学是当今自然科学和生命科学发展的前沿学科之一,它是一门交叉学科。生物信息学是以计算机为工具对生物的相关信息进行检索、储存、分析的一门科学。
生物信息学的发展离不开生物学、物理学、数学、计算机科学等学科的发展,同时它又为这些学科提供相关的信息,反过来又促进这些学科的发展。可以说生物信息学是利用数学、计算机科学、信息科学的一些观点、理论和方法来研究生命现象的一门学科。
生物信息学有三个重要的组成部分:基因组信息学、蛋白质空间结构模拟、药物设计等。作为一门新的研究学科,生物信息学把DNA序列信息分析作为源头,在获得蛋白质编码区的信息后,再进行蛋白质空间结构的模拟和预测,最后再依据特定蛋白质的功能进行药物设计。
二、生物信息学的产生背景
1956年,在美国田纳西州召开的“生物学中的信息理论讨论会”上美国学者HwaA.Lim第一次提出了“生物信息学”这个名词,并阐述了生物信息学的观点。这是生物信息学的诞生元年。
直到上世纪80年代,随着人类基因组计划的兴起,生物信息学才渐渐被学界和业界关注。人类基因组计划是美国政府于1990年10月开始启动的一项计划。这项计划,美国政府准备耗资30亿美元利用15年时间,来研究人类基因组大约30亿个碱基的全序列。这是一项耗资巨大、历时久远、影响深远的计划。
人类基因组计划的实施和生物信息学的发展息息相关。这项计划需要通过蛋白质序列测定、基因预测、结构分析实验等方法来获取大量数据,再通过计算机来对这些数据进行收集、储存和分析处理。
在实施基因组计划之初,美国就成立了一个由四十余位专家组成的生物信息研究小组。生物信息学也正是在这一时期得到了长足的发展,渐渐使生物信息学逐渐发展成为一门独立的学科。
三、生物信息学的研究内容
生物信息学既是一门独立的学科,又是一门交叉学科。那么,它到底研究什么呢?从生物信息学研究的具体内容上看,它的主要研究内容是:序列比对、序列分析、系统发育分析、蛋白质结构预测、药物设计等方面。
1.序列比对
生物学中的序列是指核酸或氨基酸序列,序列比对就是指比较两个或两个以上符号序列的相似性。
序列比对分双序列比对和多系列比对。双序列比对是将待研究的序列与DNA或蛋白质序列库进行比对,从而找出与此系列相似的序列,以便做进一步的研究。多序列比对是将待研究序列加入到一组系列之中,与其他不同物种的序列进行多系列比对,来找出该系列与其他系列的同源性。多系列比对,目前是生物信息学研究的一个热点和重点,受关注的程度较高。
2.序列分析
序列分析也是生物信息学研究的一大课题。随着生物技术的发展,越来越多的生物体的DNA序列被我们人类所测定,序列分析的作用就在于获知该生物对应的基因和基因调控序列。基因识别是基因分析中的关键技术。由于基因组中,并非所有的核酸都构成基因,所以序列分析的另一个研究内容是对基因组中的基因和基因调控序列进行自动识别。
目前,基因识别的方法很多,主要可分为:基于同源性的方法、基于统计的方法、基于机器学习的方法。
3.系统发育分析
生物信息学研究的一个重要分支就是系统发育分析。什么是系统发育分析?它是指对不同的基因进行比较分析,找出它们之间的进化速率的差异性,再反过来利用这些差异性来研究物种的形成或进化历史。最后再通过系统发育分析后,利用分支图表来反映同一谱系的进化关系。
4.蛋白质结构预测
研究基因的主要目的是了解我们人类生命活动的规律,而蛋白质正是我们人类的生命活动的主要物质。对蛋白质结构预测也是生物信息学研究的主要内容。
随着生物学的发展,大量基因的破译,造成了组成基因编码的蛋白质已渐渐成为人们研究的热点。在对蛋白质的研究中,蛋白质的结构被越来越多的学者和专家所关注。对蛋白质结构的预测正是在这样的环境和背景下应运而生。
5.药物设计
医药健康关乎国计民生,药物设计是生物信息学研究的一个重要领域。生物信息学的技术可以用于药物靶标基因的发现和验证。
利用计算机的数据挖掘技术,来获得一些不同组织在正常状态抑或疾病状态下基因所表现出来的差异性,再通过计算机技术搜索这些数据库,从而可以得到这些候选基因作为药物靶标,有针对性地来研究和治疗这一疾病。
四、生物信息学相关联的交叉学科
生物信息学是一门由多学科交叉衍生而成,并逐渐成为今天自然科学的核心领域。与它交叉相关的学科有数学、生物学、计算机科学、物理学、化学等等学科。生物信息学正是通过这些学科的作用来对人类基因组计划及相关领域所产生的海量数据,进行分析和研究。从而,提高了研究效率,缩短了研究时间,发挥着至关重要的作用。这些交叉学科中,与生物信息学关系密切的主要是数学、生物学、计算机科学等学科。
1.数学
数学是研究生物信息学的重要方法。
数学主要是研究数量、变化、结构、空间、信息等概念的一门学科,它是一门抽象的学科,对整个过程的要求十分严谨。数学是一门基础学科,是许多学科研究的基本工具。
生物信息学的研究中,数学占了很大的比重。其中,利用数学中的统计学是生物信息学的数学基础之一。数学中的概率论与随机过程理论在生物信息学中也有重要的应用。此外,数学中的运筹学、最优化理论、拓扑学等等理论,在生物信息学中都有广泛的应用。
2.生物学
生物学是生物信息学的重要基础。
生物学是自然科学的一部分,主要研究动植物、微生物的功能、结构、发生、发展规律的一门科学。生物学的研究目的在于揭开生命活动规律,改造自然,为工农业和医学等行业服务。
生物信息学的研究包括生物学数据的挖掘、储存、显示、处理和模拟,以及有关基因遗传和物理图谱的处理,还包括核苷酸和氨基酸序列分析、新基因的发现和蛋白质结构的预测等。生物学是生物信息学研究的重要基础,生物信息学的研究和发展离不开生物学。
3.计算机科学
计算机科学是研究生物信息学的重要手段。
计算机科学是一门与计算和信息处理相关的系统学科。计算机科学十分复杂,包含较广,从形式化语法、算法分析,到具体的程序设计、编程语言、软硬件等。它是当今应用较广实用较强的一门学科,主要分理论计算机科学和实验计算机科学两个部分。
生物信息学是一门运用计算机科学技术来采集、储存、检索、分析帮助了解分子生物学,尤其是分子遗传学和蛋白质结构功能的科学。通过计算机科学技术的处理,从众多分散复杂的数据中,通过数据处理的方法来获取对生命运行机制的详细和系统的理解和认识。
五、生物信息学的经济效益
生物信息学的应用前景非常广,作为一门学科和技术,它不仅具有重大的科学意义,而且还蕴藏着巨大的经济效益。
生物信息学的许多研究成果都可以实现产业化,成为服务我们人类的产品和商品。生物信息学的技术可以直接应用到我们人类的生产和生活中去。比如,与生物信息学技术相关的分析与应用算法、软件和数据库等都具有重要的经济价值和市场价值,形成商品都会产生经济效益和社会效益。
据统计,全球生物信息学产业在1998年大约有10亿美元,而到了2000年之后迅速增长到了2000亿美元以上。今天的生物信息学产业更是在突飞猛进地增长。
近年来,美国成立了大批的基于生物信息学的公司,其生产领域主要与基因工程药物、药物设计、代谢工程、生物芯片等密切相关。法国也开始大力发展生物信息学相关的产业,并将生物信息学、基因工程、组合化学等领域产业确定为未来产业的发展方向。
生物信息学的发展对我们传统的医疗卫生、农业食品等会带来巨大的影响,甚至会引发新的产业革命。
在医药领域,生物信息学借助计算机科学技术辅助药物设计技术,有利于医药企业降低药物成本。在欧美一些发达国家主要的医药企业,计算机辅助药物设计已经成为其必备的研究手段和设备。
近年来,我国也在大力发展生物信息学产业。我国政府和有关部门对生物信息学产业的发展从规划、政策、资金等方面给予了极大的支持,对有关高校和科研单位投入了大量人力、物力进行研究开发。
我国的生物信息学产业虽然起步不及欧美国家,但是其发展十分迅猛。出现了一大批这方面研究的高等院校和科研单位,将生物信息学的研究与产业相结合,取得了较好的经济效益。
六、生物信息学的发展现状及未来趋势
1.生物信息学的发展现状
可以说,生物信息学是一门借助计算机科学技术来研究生物学数据的学科。从上世纪80年代基因组计划开始,大量的生物序列被测定。这些被测定出来的数据非常庞大,看似简单的数据,却蕴含着科学意义,而且发掘数据背后的意义,就必须要借助计算机数据库和计算机算法分析预测的技术来实现。
生物信息学发展的基础是数据库的建立。目前,这方面的数据库,国际上主要有三个:欧洲生物信息学研究所、美国国立生物技术信息中心、日本信息生物学中心。这三个数据库是核苷酸和蛋白质的公共数据库,三个数据库每天都会进行数据的交换和共享,为生物信息学的发展提供数据平台。
生物信息学的概念虽然很早就被提出来,但是在国内外的发展还处于起步阶段,有待发展的空间和潜力巨大。
2.生物信息学的未来发展趋势
1)研究方向的多元化
后基因组时代的到来,生物信息学的研究的重点已逐渐转向了功能基因组的研究。它所研究的内容更深更广更加多元化,不再仅仅是简单的数据的查询和比对,而渐渐延伸到了生命现象的核心。研究的范围从基因、蛋白质研究生命的本质,,再到挖掘结构与功能、发育与疾病的关系。
2)大数据与数据挖掘技术的应用
生物信息学的发展离不开计算机科学的进步。计算机科学技术中的云计算、大数据、数据挖掘、人工智能技术将对生物信息学带来深远的影响和发展。此外,IT技术的发展使生物分析软件应运而生和不断更替,为生物信息学的发展提供了新技术的支持。生物信息学不同于其他学科,它依赖于计算机信息技术的发展。今天,大数据与数据挖掘技术如何更紧密有效地与生物信息学的研究相结合,仍然处于不断的探索之中。
21世纪是生命科学的时代,也是信息科学的时代。生物信息学是一门多学科交叉和融合的新学科,也是一门热点前沿科学。生物信息学的发展离不开其他学科的发展,同时又为其他学科的发展提供信息、材料及研究方法。它们彼此推动,共同发展。
生物信息学的研究时机已经成熟,生物信息学产业发展也已拉开帷幕,生物信息学的发展前景将更加宽广、更加深远、更加美好。
参考文献:
[1][澳]Alexander,Isaev.生物信息学中的数学方法引论.科学出版社.2011
[2]武妍,胡德华.生物信息学跨学科研究.现代生物医学进展.2012,5
[3]梁艳春.生物信息学中的数据挖掘方法及应用.科学出版社.2017
[4]沈百荣.深度测序数据的生物信息学分析及实例.科学出版社.2018
[5]华琳,李林.医学生物信息学案例与实践.清华大学出版社.2018
[6]曹志伟.生物信息学:序列与基因组分析(第二版).科学出版社.2018