导读:本文包含了极大熵聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:近红外光谱,茶叶,主成分分析,线性判别分析
极大熵聚类论文文献综述
傅海军,周树斌,武小红,武斌,孙俊[1](2019)在《茶叶傅里叶近红外光谱的混合模糊极大熵聚类分析》一文中研究指出茶作为世界最受欢迎的叁大饮料之一,不仅能够提神醒脑,而且还有帮助消化和降低血压等作用。随着人们对茶叶品质要求的日益提高,需要对不同品种的茶叶实现准确的鉴别分析以防止茶叶市场里茶叶品牌名不副实和以次充好等现象的发生。为实现对茶叶快速精准的鉴别分析,设计了一种综合采用傅里叶近红外光谱和新的模糊极大熵聚类(FEC)分析算法的茶叶品种鉴别系统。传统模糊极大熵聚类分析在聚类含噪声数据时,聚类结果往往容易出现错误,即FEC对噪声数据敏感。为解决这个问题,在FEC分析算法的基础上引入可能C均值聚类分析(PCM),提出了一种混合模糊极大熵聚类(MFEC)分析算法。MFEC可通过迭代计算得到模糊隶属度值,能实现对含噪声的茶叶傅里叶近红外光谱数据的准确聚类分析。首先,使用傅里叶近红外光谱仪(AntarisⅡ型)采集岳西翠兰、六安瓜片、施集毛峰叁种安徽茶叶的傅里叶近红外光谱数据,光谱波数范围为10 000~4 000 cm~(-1)。其次,对采集到的光谱数据使用多元散射校正(MSC)进行预处理,预处理后先用主成分分析(PCA)将光谱数据维数降至10维,然后再用线性判别分析(LDA)对降维后的近红外光谱数据进行特征提取。最后,通过混合模糊极大熵聚类分析和传统的模糊极大熵聚类分析对叁种茶叶的光谱数据进行聚类分析,并对两种聚类分析算法得到的聚类准确率、收敛速度等进行对比分析。实验结果表明:混合模糊极大熵聚类(MFEC)分析算法与传统的模糊极大熵聚类(FEC)分析算法相比较,在相同的权重指数m下MFEC具有更高的聚类准确率。在m=2条件下, MFEC的聚类准确率达到了100%,而传统的模糊极大熵聚类在相同条件下聚类准确率仅为37.98%。MFEC收敛过程中仅需迭代10次即可达到收敛,而FEC需要迭代100次,因此MFEC可以更高效的进行模糊聚类分析, MFEC相比于FEC聚类性能具有明显的优越性。通过傅里叶近红外光谱技术,混合模糊极大熵聚类分析结合PCA与LDA算法构建的茶叶品种鉴别系统能够高效快速的完成对岳西翠兰、六安瓜片、施集毛峰叁种茶叶的准确分类,为茶叶检测领域提供了一种创新的方法与设计思路,具有一定的理论价值和良好的市场应用前景。(本文来源于《光谱学与光谱分析》期刊2019年11期)
张丹丹,邓赵红,蒋亦樟,王士同[2](2016)在《基于划分融合与视角加权的极大熵聚类算法》一文中研究指出针对极大熵聚类算法在处理多视角聚类任务时存在的局限性,引入划分融合和视角加权技术,提出一种改进的极大熵聚类算法。通过对视角分配权重体现其重要程度,在此基础上对每个视角进行单独划分,利用融合权重矩阵实现视角划分的融合,并采用新的集成策略得到全局聚类结果。在人工数据集和UCI数据集上的实验结果表明,与极大熵聚类算法、基于多任务的组合K-means算法等相比,该算法具有更好的多视角聚类性能。(本文来源于《计算机工程》期刊2016年04期)
张丹丹,邓赵红,王士同[3](2016)在《面向多视角数据的极大熵聚类算法》一文中研究指出当前,极大熵聚类(maximum entropy clustering,MEC)在面对多视角聚类任务时,是将多视角样本合并成为一个整体样本再进行处理,然而这样会破坏各视角的独立性特征,进而影响最终的划分结果。针对该问题,首先提出多视角协同划分极大熵聚类算法(multi-view collaborative partition MEC,Co MEC),该算法加入一个协调各视角空间划分的约束项,使得每一视角在单独聚类过程中考虑到其他视角的影响;然后通过区分每个视角的重要性将Co MEC算法扩展为视角加权版本,即视角加权协同划分极大熵聚类算法(view weighted collaborative partition MEC,W-Co MEC);最后利用几何均值的集成策略得到全局性的划分结果。在人工数据集以及UCI数据集上的实验结果均显示所提算法较之已有的聚类技术在应对多视角聚类任务时具有更好的聚类性能。(本文来源于《计算机科学与探索》期刊2016年04期)
钱鹏江,孙寿伟,蒋亦樟,王士同,邓赵红[4](2015)在《知识迁移极大熵聚类算法》一文中研究指出为解决数据不足或失真等环境下传统聚类技术效果不佳的问题,基于历史类中心和历史隶属度提出两种知识迁移机制,并与极大熵聚类方法融合提出知识迁移极大熵聚类算法KT-MEC.KT-MEC的优点是:利用历史知识,KT-MEC聚类有效性和实用性明显增强;内嵌迁移机制均不暴露源域数据,从而拥有源域隐私保护能力;KT-MEC基于的"参数寻优+聚类有效性度量"机制理论上保证其性能不差于经典极大熵算法,避免了负迁移问题.(本文来源于《控制与决策》期刊2015年06期)
江森林[5](2014)在《协同极大熵聚类算法》一文中研究指出极大熵聚类算法(MEC)是基于信息论的新型聚类算法。以不同子集之间的协同关系为出发点,与信息理论中的极大熵原理相结合,通过构造新的极大熵目标函数来改变传统聚类算法中对整个数据集直接聚类的机制。提出一种基于协同的极大熵聚类算法CMEC,它不仅具有较MEC算法更高的聚类精度和更好的泛化性等特点,较之协同模糊聚类算法还具有更好的物理意义。实验结果表明所提出的CMEC算法具有上述优点,其聚类效果比传统的聚类算法有了很大的提高。(本文来源于《计算机应用与软件》期刊2014年05期)
陈爱国,蒋亦樟,钱鹏江[6](2013)在《基于最大中心间隔的缩放型η-极大熵聚类算法》一文中研究指出为了调控数据之间的差异性,一般化的处理方式是对数据简单地进行按比例缩放,而此类做法本身对于数据的信息是不存在任何破坏的。但在进行聚类分析时,大部分算法对于按比缩放的数据都是很敏感的,其中较典型的算法有极大熵聚类(MEC)算法。大量的实验表明,当缩放尺度位于10-3数量级以下时,极大熵聚类算法已经失效,通过该算法得到的聚类中心趋于一致。为了解决上述问题,在MEC算法的基础上引入最大中心间隔项与缩放因子η,构造出了全新的目标函数,称为η型最大中心间隔极大熵聚类(η-MCS-MEC)算法。该算法通过调控中心点间的距离使之达到最大,并有效利用缩放因子η对各类划分进行调控,从而避免了聚类中心趋于一致。通过在模拟数据集以及UCI仿真数据集上的实验,结果均显示出算法对变化的数据不再敏感而具有鲁棒性。(本文来源于《计算机应用研究》期刊2013年01期)
何任高[7](2010)在《基于极大熵聚类算法的蛋白质互作分析》一文中研究指出细胞中的各种生命活动与蛋白质间的相互作用紧密相关,同时,蛋白质相互作用过程的不和谐也导致了人类疾病的产生,因此深入理解蛋白质相互作用,不仅是揭示生命活动奥秘的前提,而且对疾病发生机制的了解及有效药物的开发均起到推动性的作用。在蛋白质相互作用的早期研究中,由于数据的贫乏,人们主要是采用实验的方法来研究蛋白质之间的相互作用。这些实验方法成本昂贵、枯燥,因此,随着实验数据的不断积累,人们开始从已有的数据出发,通过寻找互作蛋白质对和不互作蛋白质对各自的特征然后采用计算的方法来达到预测蛋白质对相互作用的目的。在此基础上,人们研究出了各种算法,比如基于决策森林的方法,基于支持向量机的方法,基于贝叶斯的方法等。结构域是蛋白质的结构和功能单位,它是蛋白质中具有进化保守性的一段氨基酸序列,同时也是分子相互作用过程中发挥重要作用的结构和功能区域。蛋白质之间通过特异性的结合才能够发生相互作用,而这些结合部位就是结构域,因此,现在,一种比较流行的思想是认为蛋白质间的相互作用是因为蛋白质结构域之间的相互作用导致的。本文从蛋白质域信息出发,分析互作蛋白质对和不互作蛋白质对各自的特征模式,提出了基于极大熵聚类算法分析并预测蛋白质相互作用的方法,并采用von Mering数据集和DIP数据库中的数据测试了该方法,其预测的敏感性和特异性分别为92%和94%。基于上述方法,本文开发了网站(http://219.217.238.183:7001/prepi/index.jsp)用于预测蛋白质对的相互作用。(本文来源于《哈尔滨工业大学》期刊2010-06-01)
任世军,王亚东[8](2010)在《极大熵聚类算法的收敛性定理证明》一文中研究指出有关极大熵聚类算法收敛性的研究是理论研究的一个热点问题,有的学者认为迭代序列的极限点有可能不是目标函数的严格局部极值点.针对这个问题,文中用科学计算软件对相关文献中给出的例子进行了实验,说明该例子并不能否定极大熵聚类算法收敛性定理.最后,从理论上给出了极大熵聚类算法收敛性定理的一个证明.(本文来源于《中国科学:信息科学》期刊2010年04期)
江秀勤[9](2009)在《半监督极大熵聚类的研究》一文中研究指出聚类是一门非常重要的技术。所谓聚类就是按照某种度量(相似性度量、不相似性度量或距离),根据一定的准则将个体集合分成若干类,使得同类个体之间的相似程度大于不同类个体之间的相似程度即做到"物以类聚"。半监督聚类算法研究无监督学习中如何利用少量的监督信息来提高聚类性能,目前正得到不断应用。针对前人提出的半监督模糊聚类,本文为了验证该种半监督学习方法是否可以用于其它聚类算法,对极大熵算法进行了改进,将半监督距离学习引入极大熵聚类,生成半监督极大熵聚类算法,并通过实验证明极大熵聚类算法通过半监督方法改进之后确实有效。(本文来源于《微计算机信息》期刊2009年15期)
唐葆君,刘小龙,邱菀华[10](2008)在《基于极大熵聚类的工程项目风险预警模型》一文中研究指出该方法针对当前大部分工程风险预警模型只能报警,不能预测的现状,提出了基于熵最优化的工程项目风险预警方法.利用判别熵最小化选取项目风险预警指标值,通过特征选取找出那些最有效的特征,研究出一种新的聚类算法——极大熵聚类算法,极大熵聚类算法是以概率为比例将任一指标向量分配给所有码向量,而不是仅仅只分配给与之最近的码向量,该算法是C-均值算法的一种推广.最后用实例验证该模型,用此算法对预测结果进行分类,判断项目的风险状态.结果表明这种方法估计工程项目风险快捷有效,与实际情况基本一致,可以应用于工程分析.(本文来源于《北京航空航天大学学报》期刊2008年07期)
极大熵聚类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对极大熵聚类算法在处理多视角聚类任务时存在的局限性,引入划分融合和视角加权技术,提出一种改进的极大熵聚类算法。通过对视角分配权重体现其重要程度,在此基础上对每个视角进行单独划分,利用融合权重矩阵实现视角划分的融合,并采用新的集成策略得到全局聚类结果。在人工数据集和UCI数据集上的实验结果表明,与极大熵聚类算法、基于多任务的组合K-means算法等相比,该算法具有更好的多视角聚类性能。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
极大熵聚类论文参考文献
[1].傅海军,周树斌,武小红,武斌,孙俊.茶叶傅里叶近红外光谱的混合模糊极大熵聚类分析[J].光谱学与光谱分析.2019
[2].张丹丹,邓赵红,蒋亦樟,王士同.基于划分融合与视角加权的极大熵聚类算法[J].计算机工程.2016
[3].张丹丹,邓赵红,王士同.面向多视角数据的极大熵聚类算法[J].计算机科学与探索.2016
[4].钱鹏江,孙寿伟,蒋亦樟,王士同,邓赵红.知识迁移极大熵聚类算法[J].控制与决策.2015
[5].江森林.协同极大熵聚类算法[J].计算机应用与软件.2014
[6].陈爱国,蒋亦樟,钱鹏江.基于最大中心间隔的缩放型η-极大熵聚类算法[J].计算机应用研究.2013
[7].何任高.基于极大熵聚类算法的蛋白质互作分析[D].哈尔滨工业大学.2010
[8].任世军,王亚东.极大熵聚类算法的收敛性定理证明[J].中国科学:信息科学.2010
[9].江秀勤.半监督极大熵聚类的研究[J].微计算机信息.2009
[10].唐葆君,刘小龙,邱菀华.基于极大熵聚类的工程项目风险预警模型[J].北京航空航天大学学报.2008