朴素贝叶斯学习论文-陈曦,张坤

朴素贝叶斯学习论文-陈曦,张坤

导读:本文包含了朴素贝叶斯学习论文开题报告文献综述及选题提纲参考文献,主要关键词:贝叶斯分类器,树增强朴素贝叶斯,评分函数

朴素贝叶斯学习论文文献综述

陈曦,张坤[1](2019)在《一种基于树增强朴素贝叶斯的分类器学习方法》一文中研究指出树增强朴素贝叶斯(TAN)结构强制每个属性结点必须拥有类别父结点和一个属性父结点,也没有考虑到各个属性与类别之间的相关性差异,导致分类准确率较差。为了改进TAN的分类准确率,该文首先扩展TAN结构,允许属性结点没有父结点或只有一个属性父结点;提出一种利用可分解的评分函数构建树形贝叶斯分类模型的学习方法,采用低阶条件独立性(CI)测试初步剔除无效属性,再结合改进的贝叶斯信息标准(BIC)评分函数利用贪婪搜索获得每个属性结点的父结点,从而建立分类模型。对比朴素贝叶斯(NB)和TAN,构建的分类器在多个分类指标上表现更好,说明该方法具有一定的优越性。(本文来源于《电子与信息学报》期刊2019年08期)

姚家麟,谭召,于松楠,鞠茵茵,刘素娟[2](2019)在《基于K均值聚类算法及朴素贝叶斯分类器的学习行为分析研究》一文中研究指出随着互联网技术在教育领域应用得越来越成熟,各类型的网络教学平台与测试系统层出不穷。无论是各个高校的网络授课系统,还是包含各类行业实际案例课程的网课平台,都为当代学习者与授课方提供了极大的便利。在各类教学平台中,均有大量的数据产出,对这些在线学习过程中产生的大量数据进行挖掘,可以有效地对学习者的学习行为模式提出建议与优化,同时,可以给授课方精准的授课效果分析,帮助授课方改进授课方针。在由大量用户组成的学习社区生态下,通过多维度数据挖掘,可以对不同用户给出精准的课业投放,大大提高用户的学习体验。(本文来源于《电脑知识与技术》期刊2019年11期)

马彬[3](2019)在《基于规则学习和朴素贝叶斯算法的软件缺陷预测模型研究》一文中研究指出软件缺陷是计算机系统、程序、代码段中存在的偏差,以静态的形式存在于软件内部,在运行时可能被激活的影响软件正常运行能力的隐藏问题和错误。软件缺陷伴随着软件开发的整个生命周期,随着软件规模不断增长,软件缺陷的数量呈上升趋势,软件缺陷的检测难度不断加大。软件缺陷将对各个领域造成严重的影响,所带来的损失难以估量。而人工代码审查在速度上和效率上,已经不能满足软件发展的需要,因此,更加高效的软件缺陷预测变得尤为重要。软件缺陷预测技术分析已有的软件历史数据,从中提取出程序模块并统计该模块的软件复杂度数据、开发过程数据和缺陷数据等作为软件度量元,选取与软件缺陷存在具有强相关性的软件度量元作为特征,使用某种机器学习算法基于上述特征构建软件缺陷预测模型。软件缺陷预测的目的在于利用某种方法对软件潜在缺陷进行预测,提前发现可能存在软件缺陷的代码段,预防软件缺陷的产生。软件缺陷预测一般分为静态预测和动态预测,静态预测主要是针对软件缺陷是否存在、缺陷的数量和分布等进行预测,动态预测主要是针对软件缺陷产生的周期、软件缺陷出现的时间分布等进行预测。本文从静态预测方面进行研究,应用机器学习算法预测软件模块是否存在缺陷。在这个研究领域中,应用的算法主要有随机森林、向量机、贝叶斯、字典学习等。朴素贝叶斯算法基于先验概率估算后验概率,计算复杂性低于决策树、向量机、神经网络等典型算法。数据集对模型预测效果的影响远远大于分类算法的选择。针对数据搜集过程中普遍存在数据缺失的问题,本文提出使用K-近邻算法对数据集中的缺失值进行填充。首先基于数据集中非缺失数据进行聚类;接着根据缺失数据样本与各类簇的欧氏距离,找到缺失数据样本属于的类簇;最后用该类簇的平均值填充缺失数据样本的缺失项,从而得到无缺失值的完整数据集。传统软件静态度量元并不都适于作为基于机器学习的软件缺陷预测模型的特征,且度量元的选择是软件缺陷预测中的重要环节。本文提出使用信息增益法对软件度量元进行选择,根据软件度量元所含有的信息量,选取对软件缺陷预测有较大信息贡献的度量元作为训练软件缺陷预测模型的特征。朴素贝叶斯模型的条件独立性假设会损失特征之间的相关性,针对软件缺陷预测的实际和朴素贝叶斯算法的不足,本文提出采用集成学习加权平均法的结合策略,基于规则学习对朴素贝叶斯模型改进。规则学习考虑了特征之间的组合性对预测结果的影响,有效弥补了朴素贝叶斯模型的不足。并从数据集缺失值处理、特征选择、类不平衡等方面进行了优化,有效提升了模型的预测效果。本文使用被广泛应用于缺陷预测技术中的NASA MDP数据集作为实验数据,进行了多次十折交叉验证。实验结果表明,基于规则学习和朴素贝叶斯算法的软件缺陷预测模型比朴素贝叶斯缺陷预测模型在查准率、查全率、f-measure、AUC值等评价指标上都有提升。与其他研究者的改进算法相比,本文提出的模型在软件缺陷预测中效果更好。(本文来源于《吉林大学》期刊2019-04-01)

罗瑶,宋衍琳,尚瑾玲,王领[4](2019)在《基于朴素贝叶斯机器学习的PI3K抑制剂预测研究》一文中研究指出目的:构建基于朴素贝叶斯的磷脂酰肌醇3-激酶(phosphatidylinositol 3-kinase,PI3K)家族抑制剂预测模型,进行PI3K抑制剂的活性预测和药物虚拟筛选。方法:首次收集结构多样性的PI3K家族4个亚型靶标(PI3Kα,PI3Kβ,PI3Kγ,PI3Kδ)的抑制剂和非抑制剂共6 175个,以分子指纹为描述符,采用朴素贝叶斯机器学习方法,建立112个分类预测模型。结果:对建立模型的预测结果进行系统比较,找出最优模型。针对PI3Kα,PI3Kβ,PI3Kγ,PI3Kδ的4个靶标,最优模型对测试集的预测准确度(Q)分别为0. 774,0. 804,0. 816,0. 673,最优模型对应测试集的AUC值均> 0. 82。结论:这些最优模型可用于PI3K抑制剂的活性预测、虚拟筛选及靶向富集库的构建,可供他人进行先导化合物的优化或设计更好的PI3K抑制剂。(本文来源于《中国新药杂志》期刊2019年01期)

韩杰,倪志伟,巨东东,倪丽萍[5](2017)在《基于朴素贝叶斯和无监督学习的数据流分类算法》一文中研究指出为了有效解决数据流分类中的噪音和概念漂移问题,提出了一种基于朴素贝叶斯和无监督学习的数据流分类算法。该算法采用集成学习的思想,以朴素贝叶斯作为基分类器进行集成分类,使用谱聚类算法对数据进行聚类,通过对比分类和聚类的结果过滤噪音,同时采用假设检验μ方法检测漂移,动态更新集成分类模型,以适应概念变化。实验结果表明,该算法在时间花销和预测准确率上能够取得较好的效果。(本文来源于《第十二届(2017)中国管理学年会论文集》期刊2017-10-28)

满毅[6](2016)在《基于增量学习朴素贝叶斯算法的ROLAP缓存机制的设计与实现》一文中研究指出随着大数据时代的来临,信息系统中的数据量不断攀升,导致系统负荷急剧增加、响应时间延长,从而影响用户体验。如何从海量数据中快速有效地提取有价值的信息成为当今一个研究热点,由此商业智能、数据仓库等技术的研究越来越受到重视。为了提高数据仓库中OLAP查询的性能和响应速度,本文设计了一种应用在ROLAP客户端的缓存机制,其基本思想是:有选择地将用户的查询结果保存在缓存区内,同时记录查询语句中的维度表达式和度量表达式;在处理后续查询语句时,通过筛减查询语句,避免从数据仓库中重复提取已缓存的数据,从而缩短查询时间;为了进一步提高缓存数据的命中率,从而进一步提高整体查询性能,在决定是否缓存查询语句的结果时,利用增量学习朴素贝叶斯算法分析查询语句中的维度表达式和度量表达式去决定是否需要缓存本次查询;同样的思想也用于缓存的替换算法。另外,为了方便快速地管理缓存的数据,本文采用内存数据库作为其缓存区。为了验证这个缓存机制的有效性,本文基于星型基准SSB测试模型进行了实验,从平均查询时间、缓存命中率以及向数据仓库查询的数据量叁个方面进行考察和对比。实验结果表明,该缓存机制能有效地提高ROLAP的平均查询效率。(本文来源于《华东师范大学》期刊2016-09-01)

董立岩,隋鹏,孙鹏,李永丽[7](2016)在《基于半监督学习的朴素贝叶斯分类新算法》一文中研究指出为了在有标签的训练集中保留高质量的样本,首先利用无标签训练集得出置信度高的k个样本,再结合有标签训练样本,不断迭代直至训练完成。实验结果表明:随着无标记样本比例的不断增加,本文算法预测准确性明显高于朴素贝叶斯分类算法,而且其性能比传统半监督学习方法有所改善。(本文来源于《吉林大学学报(工学版)》期刊2016年03期)

葛顺,夏学知[8](2016)在《基于聚类的朴素贝叶斯分类无监督学习方法》一文中研究指出为实现朴素贝叶斯分类模型的无监督学习,提出一种基于数据挖掘理论中聚类算法思想的学习方法。该方法首先定义不同类型单维状态分量的差异度量方法和混合型多维向量的联合差异度量方法,通过分析样本数据中向量之间的差异性进行聚类统计,得到研究对象的分类类别,然后对各单维状态分量分别聚类得到特征核值,进而确定不同类别各分量对应单维特征核值空间的概率隶属度。仿真实验结果表明,该方法能有效进行朴素贝叶斯分类学习。(本文来源于《舰船科学技术》期刊2016年01期)

李宏林[9](2015)在《应用朴素贝叶斯算法预测学生学习指标的改进研究》一文中研究指出以综合因子分值作为学生学习指标,应用SVM、KNN、决策树、迭代森林、朴素贝叶斯、神经网络六种数据挖掘算法对其进行预测,从合并样本随机拆分及人工指定划分两个角度,根据学生科目成绩预测学生学习指标发展趋势,发现朴素贝叶斯算法预测准确率最高。为提高预测准确率,提出朴素贝叶斯算法的3种改进途径,即主成分分析、先验概率修正、多重过滤预判;利用JAVA软件建立一个基于PMML的素质预测系统,采用主成分分析、贝叶斯过滤、贝叶斯先验概率修正3个模块来提高对综合学习素质的预测准确率。(本文来源于《情报探索》期刊2015年06期)

欧阳泽华,郭华平,范明[10](2012)在《在逐渐缩小的空间上渐进学习朴素贝叶斯参数》一文中研究指出局部加权朴素贝叶斯(LWNB)是朴素贝叶斯(NB)的一种较好的改进,判别频率估计(DFE)可以极大地提高NB的泛化正确率。受LWNB和DFE启发,提出逐渐缩小空间(GCS)算法用来学习NB参数:对于一个测试实例,寻找包含全体训练实例的全局空间的一系列逐渐缩小的子空间。这些子空间具有两种性质:1)它们都包含测试实例;2)一个空间一定包含在任何一个比它大的空间中。在逐渐缩小的空间上使用修改的DFE(MDFE)算法渐进地学习NB的参数,然后使用NB分类测试实例。与LWNB的根本不同是:GCS使用全体训练实例学习NB并且GCS可以实现为非懒惰版本。实现了GCS的决策树版本(GCS-T)实验结果显示,与C4.5以及贝叶斯分类算法(如NaiveBayes、BaysianNet、NBTree、LWNB、隐朴素贝叶斯)相比,GCS-T具有较高的泛化正确率,并且GCS-T的分类速度明显快于LWNB。(本文来源于《计算机应用》期刊2012年01期)

朴素贝叶斯学习论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着互联网技术在教育领域应用得越来越成熟,各类型的网络教学平台与测试系统层出不穷。无论是各个高校的网络授课系统,还是包含各类行业实际案例课程的网课平台,都为当代学习者与授课方提供了极大的便利。在各类教学平台中,均有大量的数据产出,对这些在线学习过程中产生的大量数据进行挖掘,可以有效地对学习者的学习行为模式提出建议与优化,同时,可以给授课方精准的授课效果分析,帮助授课方改进授课方针。在由大量用户组成的学习社区生态下,通过多维度数据挖掘,可以对不同用户给出精准的课业投放,大大提高用户的学习体验。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

朴素贝叶斯学习论文参考文献

[1].陈曦,张坤.一种基于树增强朴素贝叶斯的分类器学习方法[J].电子与信息学报.2019

[2].姚家麟,谭召,于松楠,鞠茵茵,刘素娟.基于K均值聚类算法及朴素贝叶斯分类器的学习行为分析研究[J].电脑知识与技术.2019

[3].马彬.基于规则学习和朴素贝叶斯算法的软件缺陷预测模型研究[D].吉林大学.2019

[4].罗瑶,宋衍琳,尚瑾玲,王领.基于朴素贝叶斯机器学习的PI3K抑制剂预测研究[J].中国新药杂志.2019

[5].韩杰,倪志伟,巨东东,倪丽萍.基于朴素贝叶斯和无监督学习的数据流分类算法[C].第十二届(2017)中国管理学年会论文集.2017

[6].满毅.基于增量学习朴素贝叶斯算法的ROLAP缓存机制的设计与实现[D].华东师范大学.2016

[7].董立岩,隋鹏,孙鹏,李永丽.基于半监督学习的朴素贝叶斯分类新算法[J].吉林大学学报(工学版).2016

[8].葛顺,夏学知.基于聚类的朴素贝叶斯分类无监督学习方法[J].舰船科学技术.2016

[9].李宏林.应用朴素贝叶斯算法预测学生学习指标的改进研究[J].情报探索.2015

[10].欧阳泽华,郭华平,范明.在逐渐缩小的空间上渐进学习朴素贝叶斯参数[J].计算机应用.2012

标签:;  ;  ;  

朴素贝叶斯学习论文-陈曦,张坤
下载Doc文档

猜你喜欢