最大熵分类器论文-寇振宇,杨绪兵,张福全,杨红鑫,许等平

最大熵分类器论文-寇振宇,杨绪兵,张福全,杨红鑫,许等平

导读:本文包含了最大熵分类器论文开题报告文献综述及选题提纲参考文献,主要关键词:L1范数,支持向量机,间隔,线性规划

最大熵分类器论文文献综述

寇振宇,杨绪兵,张福全,杨红鑫,许等平[1](2018)在《L1范数最大间隔分类器设计》一文中研究指出以L1范数为例,设计了一个L1范数的大间隔分类器L1MMC(L1-norm Maximum Margin Classifier),主要特点如下:(1)间隔由L1范数的点到平面距离解析表示;(2)该分类器与SVM一样,通过最大化L1间隔,达到同时最小化经验风险和结构风险的目的;(3)只需要通过线性规划进行求解,避免了SVM的二次规划问题;(4)分类精度达到甚至超过SVM.最后,在人工数据和国际标准UCI数据集上,验证了该方法的有效性.(本文来源于《南京师大学报(自然科学版)》期刊2018年04期)

Ke,GUO,Xia-bi,LIU,Lun-hao,GUO,Zong-jie,LI,Zeng-min,GENG[2](2018)在《基于带约束最大间隔的贝叶斯分类器判别学习方法(英文)》一文中研究指出提出一种新的面向贝叶斯模式分类的判别学习方法,称作"带约束的最大间隔(CMM)方法"。通过计算正样本最小决策值和负样本最大决策值的差异,定义类别之间的类别间隔。基于该类别间隔和正确分类的约束,将间隔函数学习问题转化为最大化类别间隔问题。利用序列无约束最小化技术解决该非线性规划问题。运用CMM方法得到基于高斯混合模型的贝叶斯分类器,并在10个UCI数据集上进行实验。结果表明,利用CMM方法得到的分类器分类性能,明显优于代表性的生成式学习方法期望最大化(EM)和判别式学习方法支持向量机(SVM),并且在多个数据集上取得了相比之前最优结果更好的效果。分类实验和分类器对比实验证明,CMM方法有效,具有一定应用前景。(本文来源于《Frontiers of Information Technology & Electronic Engineering》期刊2018年05期)

陈江鹏[3](2017)在《基于最大相关最小冗余朴素贝叶斯分类器的肿瘤分类方法研究》一文中研究指出目的利用基因表达谱数据研究肿瘤的发生发展机理,有助于肿瘤的诊断与个性化治疗。然而,基因芯片检测的基因数量巨大,检测费用也较高加之样本收集的困难,造成了基因表达谱数据高维小样本的特点。此外,基因表达数据还存在高噪声、高冗余及样本分布不均衡等特点,传统分类方法已不再适用,高维数据的分类问题正面临前所未有的挑战。特征选择与分类器相结合是解决这类问题的一种思路,本文以最大相关最小冗余朴素贝叶斯分类器(Na?ve Bayes classifier based on the Maximum Relevance Minimum Redundancy feature selection method,m RMR-NBC)为例,将其应用于模拟数据、公开的基因表达谱数据以及实际临床肿瘤样本的基因表达谱数据,并与常用分类方法进行对比研究,证明该思路的优越性,以期为实际临床肿瘤样本分类提供理论依据。方法(1)进行高维数据模拟研究,将m RMR-NBC应用于高维数据分类问题中,并将其与支持向量机、极限学习机与随机森林进行比较,探讨样本量、基因数以及信噪比对分类准确率的影响;(2)应用公开的结肠癌与肺癌基因表达谱数据,分别采用m RMR-NBC、支持向量机、极限学习机与随机森林进行比较研究,验证模拟研究结果;(3)从GEO数据库下载人类非小细胞肺癌基因表达数据集(GSE10245),共获得40例肺腺癌和18例肺鳞癌组织的基因表达谱数据。进行预处理后,采用m RMR-NBC进行分析,选取特征基因;利用迪杰斯特拉算法进行最短路径分析,筛选候选基因;利用DAVID软件进行GO与KEGG富集分析。采用文献回顾法分析对分类有贡献的基因在肿瘤发生发展中的作用。结果(1)在模拟数据中,m RMR-NBC的综合分类准确率达到96.71%,与支持向量机分类准确率相当,依次高于随机森林与极限向量机。上述几种方法的分类准确率与样本量的相关系数,均具有统计学意义(P<0.05)。其中,m RMR-NBC、支持向量机与极限学习机的分类准确率与样本量为负相关,而随机森林的分类准确率则与样本量呈正相关。随机森林的分类准确率还与基因数呈负相关(P<0.05),而暂未发现m RMR-NBC的分类准确率与基因数间的相关性。对m RMR-NBC的分类准确率进行析因设计的方差分析结果显示,仅样本量对分类准确率有影响(P<0.05)。(2)应用m RMR-NBC分析结肠癌与肺癌基因表达谱数据显示,当纳入基因数分别为15与12时分类准确率最高分别达到95.16%与97.26%,m RMR-NBC仅使用极少的属性参与分类就能得到非常好的分类效果,且随着纳入分析的基因增多分类效果逐渐趋于稳定。支持向量机在结肠癌与肺癌数据集上分类准确率分别达到90.32%与94.52%;极限学习机则分别为82.26%与69.86%;随机森林分别为81.98%与77.62%。(3)运用m RMR-NBC筛选特征基因8个;最短路径分析筛选候选基因21个,其中AURKA、SLC7A2基因分别在最短路径中出现3、2次。富集分析后发现,上述基因主要涉及卵母细胞减数分裂、细胞周期调控、癌症通路等信号通路。结论m RMR-NBC适用于处理高维小样本数据的分类问题;能在仅有极少属性参与分类时,得到较高的分类准确率,优于随机森林、极限学习机等方法;能较为准确地筛选肿瘤相关基因,这将有助于了解基因在肿瘤发生发展中的作用,推动精准医学与个性化治疗的发展。(本文来源于《重庆医科大学》期刊2017-05-01)

Tao-cheng,HU,Jin-hui,YU[4](2016)在《基于最大间隔的贝叶斯分类器(英文)》一文中研究指出多分类学习中经常需要考虑在泛化性能和计算开销间进行权衡。本文提出一个生成式概率多分类器,综合考虑了泛化性和学习/预测速率。我们首先证明了我们的分类器具有最大间隔性质,这意味着对于未来数据的预测精度几乎和训练阶段一样高。此外,我们消除了目标函数中的大量的局部变元,极大地简化了优化问题。通过凸分析和概率语义分析,我们设计了高效的在线算法,与经典情形的最大不同在于这个算法使用聚集而非平均化处理梯度。实验证明了我们的算法具有很好的泛化性能和收敛速度。(本文来源于《Frontiers of Information Technology & Electronic Engineering》期刊2016年10期)

刘忠宝,裴松年,杨秋翔[5](2016)在《具有N-S磁极效应的最大间隔模糊分类器》一文中研究指出该文提出一种具有N-S磁极效应的最大间隔模糊分类器(MPMMFC)。该方法寻求一个具有N-S磁极效应的最优超平面,使得一类样本受磁极吸引离超平面尽可能近,另一类样本受磁极排斥离超平面尽可能远。针对传统支持向量机面临的对噪声和野点敏感问题,引入模糊技术来降低噪声和野点对分类的影响,从而进一步提高泛化性能和分类效率。通过人工数据集和实际数据集上的实验,证明了MPMMFC的有效性。(本文来源于《电子科技大学学报》期刊2016年02期)

陈江鹏,彭斌,文雯,曾庆,唐小静[6](2015)在《基于最大相关最小冗余朴素贝叶斯分类器的应用》一文中研究指出目的将基于最大相关最小冗余(maximum relevance minimum redundancy,MRMR)的朴素贝叶斯分类器(naive bayesian classifier,NBC)应用于基因表达数据并与经典NBC、随机森林(random forests,RF)进行比较。方法采用Matlab与R软件编程,应用结肠癌与肺癌基因表达数据集,分别采用上述叁种方法进行比较研究,使用10-折交叉验证方法估计经典NBC与RF的分类准确率。结果应用MRMR-NBC分析结肠癌基因表达数据集显示,采用信息熵(mutual information quotient,M IQ)法,当特征m=11时分类准确率达93.55%;而采用信息差(mutual information difference,M ID)法时,当m=15时分类准确率达到95.16%。应用MRMR-NBC分析肺癌基因表达数据集显示,采用MIQ法,当m=14时分类准确率最高达98.63%,而采用MID法时当m=12时分类准确率达到97.26%。而采用经典NBC分析结肠癌与肺癌基因表达数据时,分类准确率分别为66.67%、80.00%;RF在分析结肠癌与肺癌基因表达数据时,分类准确率分别为81.89%、77.62%。结论 M RM R-NBC能在仅有极少属性参与分类时,得到较高的分类准确率,优于经典NBC与RF。(本文来源于《中国卫生统计》期刊2015年06期)

许欢[7](2015)在《基于最大条件概率的单依赖分类器聚合算法研究》一文中研究指出尽管朴素贝叶斯分类算法足够简单,它仍表现出了极好的分类性能。然而作为其核心思想的条件独立性假设,在真实应用中却很少能够被满足。基于单依赖分类器的聚合算法作为对朴素贝叶斯模型的一类改进模型,很好地削弱了特征间的独立性假设,并在分类准确度和模型方差等评价指标上表现突出。然而现有的聚合模型都过分强调单个子模型的分类性能对整个聚合模型的影响,而忽略了全局优化的重要性。基于全局优化的假设,本文提出了基于最大条件概率(Conditional Log Likelihood)的单依赖聚合(Ensemble super parent One Dependence Estimator)模型(EODE-CLL)。首先采用最大条件概率作为全局优化的目标,它在机器学习中常被用来作为目标函数而进行参数计算,核心思想是最合理的参数应该使得从模型空间中抽取出样本数据的概率最大,相比以拟合样本数据为核心的最小二乘法等,能够避免模型的过拟合。其次提出两层权重结构:除了作为线性组合的第一层权重外,在每个子模型内部还提出了区分不同特征重要性的第二层权重,引入第二层权重结构在子模型进行局部优化,过滤低相关特征,突出高相关特征,从而使各个子模型充分最优。最后采用随机梯度下降法求解最优解,它是机器学习中常被用来求解参数的迭代方法,计算简单高效,求解过程中只需计算目标函数对参数的偏导,还衍生出了批量随机梯度下降法和分布式随机梯度下降法,具有很好的扩展性。此外,本文提出的EODE-CLL模型是一个有监督的聚合模型,具有较强的表达能力,通过设置不同参数,能够拟合现有的多数聚合模型。论文在36个UCI(加利福尼亚大学机器学习知识库提供的基准数据集)的公开数据集上进行对比实验和结果分析。实验结果表明EODE-CLL在分类准确性,F值,偏差和方差等性能方面均优于现有的选择和加权聚合模型。(本文来源于《浙江大学》期刊2015-01-01)

栾亚群,崔军辉[8](2014)在《基于改进最小最大准则的分类器设计研究(英文)》一文中研究指出主要探讨先验概率未知情况下的分类器设计问题。为了解决传统的最小最大分类器性能有限的不足,提出了基于分段线性化的分类器设计方法。方法不仅是最小最大准则的改进,而且也是最优贝叶斯分类器的更好近似。通过说话人识别的应用,验证了所提出算法的有效性。(本文来源于《科学技术与工程》期刊2014年27期)

冯月进,张凤斌[9](2014)在《最大相关最小冗余限定性贝叶斯网络分类器学习算法》一文中研究指出朴素贝叶斯分类器(nave bayes)是一种简单而有效的基于贝叶斯思想的分类方法,但它的属性条件独立性假设并不符合实际,影响了它的分类性能。BAN(bayesian network augmented nave bayes)分类器扩展了朴素贝叶斯分类器,使其表示属性之间依赖关系的能力增强,但是其学习算法需要大量的高维计算,在小采样数据集上,影响BAN分类器的分类性能。基于改进的最大相关最小冗余特征选择技术,提出限定性贝叶斯网络分类器学习算法(k-BAN)。本算法使用改进的最大相关最小冗余特征选择技术,通过选择属性结点的连接关系集合建立属性之间的依赖性关系。将该分类方法与NB,TAN和BAN分类器进行实验比较。实验结果表明,在小采样数据集上,本算法获得的限定性贝叶斯网络分类器具有更高的分类准确性。(本文来源于《重庆大学学报》期刊2014年06期)

张伟,柳先辉[10](2012)在《自适应上界的相对最大分离比单球面分类器》一文中研究指出单球面分类器(RSS)以最大分离比为目标,对负类样本的分布情况缺乏考虑。根据Fisher判别准则,将相对间隔的思想引入到单球面分类器中,对特征空间中负类样本的分布上界进行约束来增强其内聚度,以提高分类器判别的准确性。由于分布上界的不可预测,为避免问题不可解,建立了自适应上界的最大相对分离比单球面分类器模型(ARRSS),并对模型参数进行了分析。实验证明,与单球面分类器相比,该方法表现出更好的泛化能力。(本文来源于《计算机科学》期刊2012年09期)

最大熵分类器论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

提出一种新的面向贝叶斯模式分类的判别学习方法,称作"带约束的最大间隔(CMM)方法"。通过计算正样本最小决策值和负样本最大决策值的差异,定义类别之间的类别间隔。基于该类别间隔和正确分类的约束,将间隔函数学习问题转化为最大化类别间隔问题。利用序列无约束最小化技术解决该非线性规划问题。运用CMM方法得到基于高斯混合模型的贝叶斯分类器,并在10个UCI数据集上进行实验。结果表明,利用CMM方法得到的分类器分类性能,明显优于代表性的生成式学习方法期望最大化(EM)和判别式学习方法支持向量机(SVM),并且在多个数据集上取得了相比之前最优结果更好的效果。分类实验和分类器对比实验证明,CMM方法有效,具有一定应用前景。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

最大熵分类器论文参考文献

[1].寇振宇,杨绪兵,张福全,杨红鑫,许等平.L1范数最大间隔分类器设计[J].南京师大学报(自然科学版).2018

[2].Ke,GUO,Xia-bi,LIU,Lun-hao,GUO,Zong-jie,LI,Zeng-min,GENG.基于带约束最大间隔的贝叶斯分类器判别学习方法(英文)[J].FrontiersofInformationTechnology&ElectronicEngineering.2018

[3].陈江鹏.基于最大相关最小冗余朴素贝叶斯分类器的肿瘤分类方法研究[D].重庆医科大学.2017

[4].Tao-cheng,HU,Jin-hui,YU.基于最大间隔的贝叶斯分类器(英文)[J].FrontiersofInformationTechnology&ElectronicEngineering.2016

[5].刘忠宝,裴松年,杨秋翔.具有N-S磁极效应的最大间隔模糊分类器[J].电子科技大学学报.2016

[6].陈江鹏,彭斌,文雯,曾庆,唐小静.基于最大相关最小冗余朴素贝叶斯分类器的应用[J].中国卫生统计.2015

[7].许欢.基于最大条件概率的单依赖分类器聚合算法研究[D].浙江大学.2015

[8].栾亚群,崔军辉.基于改进最小最大准则的分类器设计研究(英文)[J].科学技术与工程.2014

[9].冯月进,张凤斌.最大相关最小冗余限定性贝叶斯网络分类器学习算法[J].重庆大学学报.2014

[10].张伟,柳先辉.自适应上界的相对最大分离比单球面分类器[J].计算机科学.2012

标签:;  ;  ;  ;  

最大熵分类器论文-寇振宇,杨绪兵,张福全,杨红鑫,许等平
下载Doc文档

猜你喜欢