导读:本文包含了双聚类算法论文开题报告文献综述及选题提纲参考文献,主要关键词:基因表达数据,多目标遗传算法,双聚类算法
双聚类算法论文文献综述
孔舟帆[1](2019)在《基于改进多目标遗传算法的双聚类算法在基因表达数据中的研究》一文中研究指出基因表达数据反映了成千上万个基因在不同实验条件下的表达水平,当我们对这些基因表达数据进行分析时,挖掘隐藏在海量基因表达数据中的相似表达模式能够为我们提供有价值的生物信息。考虑到基因表达数据具有数据量大且高噪声的特点,如何从基因表达数据中有效的挖掘有价值的生物信息成为了一个值得研究的问题。通过生物信息学的研究发现,很多隐藏在基因表达数据中的遗传模式仅仅在特定的实验条件下对一组基因是可见的,这与基因调控的现象也是相符的,协同基因一般仅仅在某些特定条件下才会呈现出共同调控表达的特点。因此,我们将双聚类算法应用到了基因表达数据的挖掘中,双聚类算法能够同时对基因表达矩阵的行和列进行聚类,从而找到局部的相似表达模式。在双聚类的搜索过程中,我们希望能够找到体积较大且质量较高的双聚类,而这两个优化目标是一对互相冲突的优化目标,针对这一问题,本文将多目标遗传算法应用到了基因表达数据的双聚类挖掘中。本文提出了一种改进的多目标遗传算法,分别从种群初始化策略和选择算子设计两个方面对传统多目标遗传算法进行了改进,通过在若干个经典测试函数上与传统多目标遗传算法进行了多样性和收敛性对比,验证了改进多目标遗传算法的有效性。另一方面,本文基于改进的多目标遗传算法,提出了一种创新的双聚类算法。首先,在传统的双聚类种群之外,引入了行列种群来参与遗传进化的过程。行列群体能够帮助我们评估双聚类中每一行或每一列对双聚类的贡献,沿着优良行列个体定义的搜索方向来搜索双聚类,能够帮助我们在较小的搜索空间中有效的检测双聚类。其次,在行列种群和双聚类种群的学习阶段中,对行列群体采用了布谷鸟搜索算法来进行最优解搜索;对双聚类种群采用了改进的多目标遗传算法来进行双聚类种群的初步优化。最后,将进化后的行列种群和初步进化的双聚类中进行交配,使得双聚类群体能够得到进一步的进化,与此同时,行列群体的适应度值也得到更新。通过与多个经典双聚类算法在人工数据集和真实数据集上进行对比实验,本文提出的算法有着更好的表现,验证了本文提出的双聚类算法的有效性。(本文来源于《华南理工大学》期刊2019-04-10)
杨烩婷[2](2019)在《双聚类算法及其在基因表达数据分析中应用研究》一文中研究指出传统的单聚类方法得到的是在所有实验条件下相似度高的基因集,而针对真实的基因表达数据来说,提取部分基因集在部分条件下高度相似的子矩阵更有意义。因为当考虑了所有的实验条件,有些本来相似的基因会因为相似度达不到阈值而不能处于同一个集合中,而且在真实的生物活动中,基因可以参与多个生物活动,但并非在所有的条件下处于调控状态,所以将注意力集中在局部信息更有利于得到符合真实情况的信息。面对传统单聚类的缺点产生了双聚类分析方法。本文的主要研究工作是对双聚类算法进行改进,然后将算法运用于基因表达数据去得到变化相关的双聚类,最后从双聚类中获得信息和知识来帮助生物学研究。本文提出了一种新的双聚类算法YUNIBIC。YUNIBIC的步骤主要分为以下几步:首先根据原始矩阵构建对应的索引矩阵,并应用最长公共子序列算法在索引矩阵行对之间来选择满足条件的基因构成双聚类种子;随后添加相关行列来扩展种子。最后,使用斯皮尔曼双聚类评估方法(SBM)作为双聚类质量的评价函数来筛选最后的双聚类作为输出。本文提出构建行为矩阵来进行双聚类相关行的添加,通过这种方法还可以添加与双聚类具有负相关表达模式的行。此外,在面对基因表达数据这样的大规模矩阵数据时,算法运行前需要进行预处理操作。本文的数据预处理阶段分为数据分离和数据重赋值。在数据重赋值方法中本文提出了一种新的分组方式,它将同时考虑数据元素值和序之间的相似性来对数据进行重新分组,在同一组中的元素赋予同一组号值来完成数据重赋值。在本文中,将YUNIBIC与两种算法:UNIBIC和QUBIC在模拟数据和真实数据上面进行比较实验。YUNIBIC在种子筛选的过程中保留全部显着长度的种子,这一策略使得YUNIBIC能有效地改善UNIBIC在识别趋势一致双聚类上忽略列数较少的窄形双聚类的问题。从模拟实验的测试结果中可以看出,YUNIBIC得到的双聚类的恢复值和相关值明显高于其它两种算法,这说明YUNIBIC能够准确识别嵌入的趋势一致双聚类。在真实数据的实验结果中,YUNIBIC的GO富集度也达到了最高,这说明YUNIBIC不仅能有效地将原始数据的基因划分到不同的生物活动中,并且这些基因在生物活动中的GO项出现了富集。在文章的最后设计实现了一个YUNIBIC算法系统,该系统使用GTK+实现,配合Glade工具进行界面设计。通过这个系统能够设定算法参数,运行算法并对算法结果进行展示和简单分析。本文主要对双聚类算法进行分析研究,在阅读了大量文献后对双聚类算法UNIBIC进行改进并将其应用到基因表达数据上。本文主要的创新点有:(1)在预处理方法中提出一种新的分组方法,这种方法不仅考虑了元素排序的位置,还考虑了元素之间的距离,距离指的是不同条件下基因表达值差值的绝对值。(2)构建这样的行为矩阵来扩展双聚类,行为矩阵的列只考虑存在于双聚类中的列,不考虑原始矩阵所有列。(3)利用斯皮尔曼双聚类评估方法(SBM)从大量候选双聚类中识别出与双聚类有正负相关表达模式的较优双聚类。(本文来源于《吉林大学》期刊2019-04-01)
徐鹏雅[3](2018)在《基于一种双聚类算法的成分数据缺失值填补》一文中研究指出“数据的缺失问题”是科学实验和调查研究中普遍存在的问题。数据的缺失会影响统计数据的质量,增加数据分析过程的复杂性,因此,对缺失值进行填补具有重要的理论价值和现实意义。成分数据是一类满足特殊性质的复杂多维数据,广泛存在于社会、经济、技术等诸多领域,用来反映例如产业结构、居民消费结构、岩石矿物组成等。由于成分数据受到“非负性”和“定和性”条件的约束,所张成的空间是单形空间,从而针对欧氏空间普通数据的传统统计分析方法不能直接应用于成分数据。双聚类算法实现在行和列两个维度上对数据矩阵中的对象和属性进行同时聚类,通过利用对象和属性来提取其联合信息,有效地挖掘出数据矩阵中隐藏的局部特征信息。本文基于双聚类算法,利用使得双聚类簇内均方残差越低的成分数据在簇内属性上具有较高的一致性特点来填补成分数据的缺失值,根据等距对数比变换的度量不变性特点,提出经过等距对数比变换后基于双聚类算法的成分数据缺失值填补法(ICDBIA)。通过模拟和实例分析,并与Hron等(2010)提出基于Aitchison距离的k-近邻填补法(KNN)和迭代回归填补法(LISR)进行比较,得出ICDBIA填补法在成分数据缺失值填补的有效性,为成分数据缺失值的填补提供新的思路。考虑到实际中往往忽视成分数据的数据特性,视成分数据为欧氏空间的普通数据的情况,因而本文也相应提出原始的不加变换的CDBIA填补法作为比较方法,研究得到ICDBIA填补法一致优于CDBIA填补法的填补效果。因而在成分数据的分析中应注意成分数据的数据特性。本文主要内容包括五章:第一章:绪论。对成分数据的研究背景、意义及国内外研究现状进行概述,同时对本论文的主要内容及创新点进行阐述。第二章:理论基础。对成分数据统计理论、双聚类算法的一些理论知识进行一定的阐述,主要介绍成分数据的基础包括成分数据的相关定义、Aitchison几何和成分数据的对数比变换、KNN填补法和LISR填补法简介以及双聚类算法相关定义、双聚类算法的基本类型。第叁章:成分数据缺失值填补方法。提出本文的等距对数比变换,给出基于双聚类算法的缺失值填补定理,结合该定理提出CDBIA方法和ICDBIA方法,并结合实例来进行实现。第四章:模拟与实证分析。通过模拟和实证分析,将本文提出的ICDBIA算法分别和KNN、LISR以及CDBIA进行比较缺失值的填补效果。第五章:总结与展望。总结本文的研究,并对后续研究进行展望。(本文来源于《浙江财经大学》期刊2018-12-01)
王国政,傅迎华,张生[4](2018)在《双聚类算法SMR在图像聚类中的应用》一文中研究指出大数据时代,从大量数据中寻找出数据潜在的关联受到广泛关注。双聚类是指对行和列同时聚类,对矩阵局部进行搜索,旨在对高维数据中的有效信息进行发掘,主要应用于基因表达序列。通过对双聚类算法SMR进行深入研究,对其进行改进,加入稀疏性和非负性,使得在原有基础上的"硬"聚类转变为"软"聚类。应用到图像领域,对图像中的局部信息能很好地聚类。实验结果表明,改进后的算法收敛速度很快,效果很好。(本文来源于《软件导刊》期刊2018年07期)
黄仙海[5](2018)在《基于遗传算法的双聚类算法在基因表达数据中的研究》一文中研究指出基因表达数据分析能够为基因调控机制的研究以及肿瘤疾病的药物治疗提供宝贵的信息参考,有着十分重要的意义。随着基因芯片技术的不断发展,基因表达数据的数据量也在呈指数型增长。因此,如何更加有效的从海量的基因表达数据中挖掘出有用的生物学信息是一个值得挑战的问题。双聚类算法的提出为基因表达数据的分析提供了新的有效的方法。双聚类算法可以找到在特定的条件集下具有相似表达模式的基因集,突破了传统聚类分析方法的局限性,是目前基因表达数据分析中研究的热点。在众多的双聚类算法中,遗传算法由于其突出的全局搜索能力,被广泛应用于双聚类挖掘问题中。大多数传统的基于遗传算法的双聚类算法在评估双聚类的质量时,是把双聚类看成一个整体去评估,而没有单独考虑每一个行和列对于相应的双聚类的贡献程度。也因为如此,大多数遗传双聚类算法只简单考虑了以双聚类为个体的单一种群的遗传进化。随着基因表达数据矩阵的增大,遗传算法的搜索空间也急剧增长。在庞大的搜索空间下,单一种群的遗传进化搜索更倾向于收敛到局部最优解而无法有效的找到全局最优解。出于这样的考虑,本文在传统的以双聚类为个体的种群的基础之上,创新性的提出了以行和列为个体的新的行列种群,并设计了新的编码方案和适应度评价函数。另一方面,传统的以双聚类为个体的双聚类种群和本文所提出的以行和列为个体的行列种群是两种不同类型的种群,应对应着两个不同的遗传进化学习的阶段。因此,针对这两个不同的种群,本文创新性的设计了一个双阶进化算法框架,让两个不同的种群分别在两个不同的阶段进行遗传进化学习,并且通过两个种群之间的交配过程进行种群间的信息交流,从而进一步促进两个种群的进化学习,最终得到更好的双聚类结果。本文在新的双阶进化算法框架的基础之上,分别基于单目标遗传算法和多目标遗传算法,提出了两种双阶进化双聚类算法应用于基因表达数据的双聚类问题上。为了验证本文所提出的两种双阶进化双聚类算法的合理性和有效性,本文从人工模拟数据集和真实基因表达数据集两个方面,设计了多个对比实验,并与多个经典的双聚类算法的实验结果进行了对比分析。实验结果表明,本文所提出的两种算法在人工模拟数据集和真实数据集上相比其他算法都有更好的表现。(本文来源于《华南理工大学》期刊2018-04-10)
于兴文,龚庆悦,胡孔法,毛文静,张卫明[6](2018)在《基于改进双聚类算法的方剂剂量分析》一文中研究指出目的:实现方剂疗效最大化,而药物对患者的不良影响最小化。方法:对传统CC双聚类算法进行优化,并使用优化算法对中医方剂剂量数据进行分析。结果:该研究在筛选的149首与中医治疗抑郁症相关的方剂及其剂量的基础上,形成63个方剂剂量子矩阵,每个子矩阵表示不同药物在不同方剂中所含剂量的参考值。结论:优化的CC算法可以有效地排除中医剂量原始矩阵中0值的干扰,避免输出没有价值的0值子矩阵,可以有效分析出不同药物在抑郁症相关的不同方剂中的使用剂量参考值,为医生临床合理用药提供有价值的参考。(本文来源于《辽宁中医杂志》期刊2018年03期)
贾延昆[7](2018)在《面向高维数据的双聚类算法研究》一文中研究指出近年来,随着生物信息学、电子商务等领域的迅速发展,积累了大量的高维数据,如何利用数据挖掘技术从这些高维数据中获得有价值的信息具有重要的研究意义。其中在聚类分析方面,由于传统的聚类方法只能在数据矩阵的行或列单个维度上进行聚类,只能够挖掘数据中的全局信息。由于高维数据中普遍存在着大量的局部信息,为了能够更好的挖掘高维数据中的局部信息,双聚类算法应用而生。双聚类算法能够同时数据矩阵的行和列两个维度上进行聚类,能够更加有效的挖掘高维数据中存在的大量局部信息。双聚类算法的提出能够有效地解决传统聚类算法在高维数据中遭遇的维度灾难问题以及稀疏性问题,然而双聚类算法的研究仍处于起步阶段,目前的各种双聚类算法还存在着诸多不足之处,因此对于双聚类算法的研究变得尤为重要。针对于目前双聚类算法应用最广泛的生物数据领域以及电子商务领域,本文根据不同数据的特点分别进行研究分析,设计出两种应用于不同领域的双聚类算法。针对于高维的基因表达数据,本文设计出一种基于加权互信息的双聚类算法。由于基因数据之间存在着复杂的非线性关系,本文因此提出了一种加权互信息的相似性方法来度量基因数据间的相关关系,通过考虑到条件集合的重要性对于双聚类的影响,本文提出了一个新的目标函数通过权重完成双聚类条件集合的优化更新。最后进行了实验对比验证,实验结果表明本文提出了基于加权互信息的双聚类算法取得了优秀的聚类效果。针对于高维的图像推荐数据中的高度稀疏性以及冷启动问题,本文结合推荐系统中通用的协同过滤算法,提出了一种异步双聚类的协同过滤算法。考虑到图像维度聚类时常遭遇的冷启动问题,本文通过多视图聚类算法将图像点击特征与图像视觉特征结合来获得准确地图像聚类,考虑到用户维度聚类时遭遇的维度灾难问题,本文利用词袋模型结合图像聚类信息对用户进行降维聚类,然后利用协同过滤算法将用户聚类和图像聚类信息进行融合推荐得到高质量的图像推荐结果。最后通过实验与现有方法进行对比分析,实验结果表明本文提出的异步双聚类的协同过滤算法明显优于现有的其它方法。(本文来源于《北京交通大学》期刊2018-03-01)
周俏飞[8](2017)在《基于进化多目标的基因表达双聚类算法研究》一文中研究指出微阵列技术能够同时测量数千个基因的表达水平值,可以同时平行检测大量基因的表达水平,产生大量的微阵列数据集,这些基因表达数据反映了不同实验条件下的基因组水平。基因表达数据中包含了大量的基因活跃性信息和细胞生理状态信息。如何利用有效的计算方法对大量微阵列数据进行分析成为了生物信息学中新的挑战。因此需要研究更加有效的分析算法来发现基因表达之间存在的一些关联关系,在此基础上更进一步的发掘基因间的一些调控模式、共同功能和交互关系等。对于微阵列数据分析,双聚类是一个常用的数据挖掘方法,并且在许多应用中展现出其优势。随着双聚类算法在基因表达数据中的分析应用,出现了大量不同类型的BI聚类算法,对基因表达数据中的分析发挥了重要作用。在基因表达数据中,趋势一致性双聚类是一类最具生物学意义的双聚类类型,目前许多算法都是以解决该类型的BI聚类而进行设计的。然而,由于该问题本身具有的难度和复杂性,如何高效地发现基因表达数据中一致性数据的趋势依然具有非常大的挑战。对于基因表达数据分析,双聚类方法被证明是一种高效的实用方法,在设计双聚类算法时必须同时考虑优化几个相互冲突的目标,比如较高行方差和最低均方残差等目标的最大双聚类,因此能够转换成多目标优化问题。最近几十年,根据自然现象启发而设计的算法例如进化、粒子群和蚁群等成为数据挖掘领域普遍的方法,通过采用进化算法能发现微阵列基因表达数据中的全局最优解,为同时优化几个相互冲突的目标例如聚类的大小和同源性提出了多目标进化优化算法来发现微阵列数据中的全局最优双聚类。本文通过对NSGAII算法和MOEA/D算法的详细分析研究,研究它们各自的优点和不足。在此研究上提出一种NSGAII算法和MOEA/D算法相结合的算法,该算法利用NSGAII和MOEA/D两个着名的算法在不同的进化阶段通过对其进化效率的测量,进而对其分配不同的计算资源,使得在整个进化过程中计算资源的合理分配从而提升算法的性能。这个算法可以同时避免这NSGAII多样性不足和MOEA/D的收敛性不平衡问题,同时还可以利用各自的优点。最后通过在酵母菌啤酒细胞基因表达数据集和人类细胞数据集上对提出的算法进行了实验验证,并与利用NSGAII多目标算法解决双聚类问题的NSGA2B双聚类算法进行的实验对比。通过大量的实验得到了比较好的结果,该结果表明本文所提出的算法能够较好的处理基因表达数据中的双聚类问题。(本文来源于《湖南大学》期刊2017-11-01)
张智慧,奉国和,李媚婵[9](2017)在《基于双聚类算法探测档案学研究领域知识基础及学科前沿》一文中研究指出利用gCLUTO对CSSCI中收录的近五年档案学研究领域文献的高被引及其来源文献进行双向聚类,某一热点知识基础为高被引论文,基于聚类得到高被引论文簇关系密切的来源文献作为研究前沿。得出档案学领域的基础理论研究、电子文件管理、数字档案馆、档案事业史、口述历史档案、档案记忆理论、档案保护和档案学专业教育改革8类研究热点的知识基础及研究前沿。(本文来源于《广州广播电视大学学报》期刊2017年03期)
张渊[10](2017)在《双聚类算法研究及其在我国药品不良反应监测中的应用》一文中研究指出研究背景和目的:作为药品上市后安全性监测的重要组成部分,药品不良反应自发呈报系统可以广泛收集不良反应报告,实现对药品不良反应的及时监测。我国自发呈报系统数据库中数据量庞大。2009年至2016年,年报告数量已从60余万份激增到140余万份。利用不相称测定方法,研究者可以从自发呈报系统数据中检测出大量不良反应信号,为药品安全性评价提供基本依据。在检测出不良反应信号之后,仍需要对信号进行评价才可以确定其是否为真实的药品不良反应,但是大量的信号给评价工作带来十分艰巨的挑战。目前不良反应信号评价方法主要包括将检测出的不良反应信号与药品说明书数据对比、进行专家评价等,评价效率低下。如何提高信号评价工作的效率是药品不良反应监测领域中研究者亟需解决的问题之一。有研究指出:分析包含同一种不良反应的多个相似信号或包含同一种药品的多个相似信号可能可以提高信号评价效率。这为提高我国信号评价过程的效率提供了新的思路。本研究期望引入一种新的方法——双聚类分析方法,以期识别出我国不良反应信号数据中相似信号组合。利用组合中已确认信号的信息对待评价信号进行快速评价,提高信号评价工作的效率,并探索在分析我国不良反应信号数据过程中最优参数设置。研究方法:将Bimax双聚类算法引入到我国不良反应信号数据分析中。将检测出的不良反应信号数据构建出原始定量数据矩阵。依据不同的区分强弱信号的IC值阈值将定量矩阵转化成不同的0-1数据矩阵,并结合不同的Bimax算法参数,对不同的0-1数据矩阵进行双聚类分析,从中识别出对应信号值均超过阈值的多个药品-不良反应组合,获取相似性信号组合信息。然后,利用秩和比综合评价法结合平均符合比例、涉及比例两个指标对分析双聚类结果进行评价,确定最优区分强弱信号的IC值阈值及最优Bimax算法参数。最后对最优参数设置组合下双聚类分析结果进行深入分析,明确双聚类算法在我国不良反应信号数据分析中的运用效果。研究结果:通过秩和比综合评价法比较不同参数设置组合下双聚类方法的分析结果,确定最优区分强弱信号的阈值为IC=0.80,最优的Bimax算法参数为最小双簇行数3、最小双簇列数3。在上述参数设置组合下,利用Bimax双聚类方法可以从不良反应信号数据中识别出4293个双簇。双簇平均包含23.41个信号,双簇内组合的平均IC值为2.38。通过分类学评价可以发现所包含的药品具有相似性或所包含的不良反应具有相似性的双簇共有1836个,占双簇总数的42.8%,涉及72.3%的IC值不小于0.80的待评价信号;至少包含有一个已得到药品说明书确认信号的双簇有4272个,占总数的99.5%;包含的所有信号均已得到药品说明书确认的双簇有193个,占总数的4.5%。在所有双簇中出现频次最多的药品为“利培酮”,共在708个双簇中出现,占总数的16.5%;出现频次最多的不良反应为“肝功能异常”,共在720个双簇中出现,占总数的16.8%。研究结论:利用双聚类算法分析我国不良反应信号数据所得到的双簇可以为潜在药品不良反应确认、筛选需重点关注不良反应信号等多个方面提供十分有价值的信息,可以促进我国药品不良反应监测中信号评价工作效率的提高。(本文来源于《第二军医大学》期刊2017-05-01)
双聚类算法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
传统的单聚类方法得到的是在所有实验条件下相似度高的基因集,而针对真实的基因表达数据来说,提取部分基因集在部分条件下高度相似的子矩阵更有意义。因为当考虑了所有的实验条件,有些本来相似的基因会因为相似度达不到阈值而不能处于同一个集合中,而且在真实的生物活动中,基因可以参与多个生物活动,但并非在所有的条件下处于调控状态,所以将注意力集中在局部信息更有利于得到符合真实情况的信息。面对传统单聚类的缺点产生了双聚类分析方法。本文的主要研究工作是对双聚类算法进行改进,然后将算法运用于基因表达数据去得到变化相关的双聚类,最后从双聚类中获得信息和知识来帮助生物学研究。本文提出了一种新的双聚类算法YUNIBIC。YUNIBIC的步骤主要分为以下几步:首先根据原始矩阵构建对应的索引矩阵,并应用最长公共子序列算法在索引矩阵行对之间来选择满足条件的基因构成双聚类种子;随后添加相关行列来扩展种子。最后,使用斯皮尔曼双聚类评估方法(SBM)作为双聚类质量的评价函数来筛选最后的双聚类作为输出。本文提出构建行为矩阵来进行双聚类相关行的添加,通过这种方法还可以添加与双聚类具有负相关表达模式的行。此外,在面对基因表达数据这样的大规模矩阵数据时,算法运行前需要进行预处理操作。本文的数据预处理阶段分为数据分离和数据重赋值。在数据重赋值方法中本文提出了一种新的分组方式,它将同时考虑数据元素值和序之间的相似性来对数据进行重新分组,在同一组中的元素赋予同一组号值来完成数据重赋值。在本文中,将YUNIBIC与两种算法:UNIBIC和QUBIC在模拟数据和真实数据上面进行比较实验。YUNIBIC在种子筛选的过程中保留全部显着长度的种子,这一策略使得YUNIBIC能有效地改善UNIBIC在识别趋势一致双聚类上忽略列数较少的窄形双聚类的问题。从模拟实验的测试结果中可以看出,YUNIBIC得到的双聚类的恢复值和相关值明显高于其它两种算法,这说明YUNIBIC能够准确识别嵌入的趋势一致双聚类。在真实数据的实验结果中,YUNIBIC的GO富集度也达到了最高,这说明YUNIBIC不仅能有效地将原始数据的基因划分到不同的生物活动中,并且这些基因在生物活动中的GO项出现了富集。在文章的最后设计实现了一个YUNIBIC算法系统,该系统使用GTK+实现,配合Glade工具进行界面设计。通过这个系统能够设定算法参数,运行算法并对算法结果进行展示和简单分析。本文主要对双聚类算法进行分析研究,在阅读了大量文献后对双聚类算法UNIBIC进行改进并将其应用到基因表达数据上。本文主要的创新点有:(1)在预处理方法中提出一种新的分组方法,这种方法不仅考虑了元素排序的位置,还考虑了元素之间的距离,距离指的是不同条件下基因表达值差值的绝对值。(2)构建这样的行为矩阵来扩展双聚类,行为矩阵的列只考虑存在于双聚类中的列,不考虑原始矩阵所有列。(3)利用斯皮尔曼双聚类评估方法(SBM)从大量候选双聚类中识别出与双聚类有正负相关表达模式的较优双聚类。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
双聚类算法论文参考文献
[1].孔舟帆.基于改进多目标遗传算法的双聚类算法在基因表达数据中的研究[D].华南理工大学.2019
[2].杨烩婷.双聚类算法及其在基因表达数据分析中应用研究[D].吉林大学.2019
[3].徐鹏雅.基于一种双聚类算法的成分数据缺失值填补[D].浙江财经大学.2018
[4].王国政,傅迎华,张生.双聚类算法SMR在图像聚类中的应用[J].软件导刊.2018
[5].黄仙海.基于遗传算法的双聚类算法在基因表达数据中的研究[D].华南理工大学.2018
[6].于兴文,龚庆悦,胡孔法,毛文静,张卫明.基于改进双聚类算法的方剂剂量分析[J].辽宁中医杂志.2018
[7].贾延昆.面向高维数据的双聚类算法研究[D].北京交通大学.2018
[8].周俏飞.基于进化多目标的基因表达双聚类算法研究[D].湖南大学.2017
[9].张智慧,奉国和,李媚婵.基于双聚类算法探测档案学研究领域知识基础及学科前沿[J].广州广播电视大学学报.2017
[10].张渊.双聚类算法研究及其在我国药品不良反应监测中的应用[D].第二军医大学.2017