不确定性属性约简论文-姚坤

不确定性属性约简论文-姚坤

导读:本文包含了不确定性属性约简论文开题报告文献综述及选题提纲参考文献,主要关键词:全粒度粗糙集,属性约简,不确定性,可区分度

不确定性属性约简论文文献综述

姚坤[1](2019)在《全粒度粗糙集不确定性度量及属性约简的研究》一文中研究指出大数据时代的到来,数据量急剧增长,各行各业都面临着海量数据信息,越来越多的公司正“淹没”在海量数据中,如何从中挖掘有效信息已成为研究热点。粗糙集理论能够有效地处理复杂系统中的数据信息,已成为处理不精确、不确定性问题的数学工具。其最大优势在于不需要任何先验知识就可以对数据进行处理,寻找最优信息,既保持了知识分类能力不变,又能对数据进行冗余处理(属性约简),最终获取有效信息。全粒度粗糙集作为一种新型粗糙集模型,既继承了传统粗糙集的静态性,又具有一定的动态性,且具有一定的量子计算思想,能够模拟人类认知的复杂性和多样性。相比其他传统粗糙集模型,全粒度粗糙集具有一定的动态性,可以从一个粒度跳转到另一粒度,跳转自然,毫无困难;相比多粒度粗糙集,全粒度粗糙集是多粒度粗糙集的超集,其研究比多粒度粗糙集更全面。不确定性处理及属性约简是粗糙集理论两大核心内容,而全粒度粗糙集由于其动态变化性,对于不确定性问题的处理更加灵活多样,全粒度属性约简研究也随之丰富。随着全粒度粗糙集理论的逐渐发展,其不确定性研究及属性约简问题已成为当前主要工作。对此,本文对全粒度粗糙集不确定性度量及属性约简进行系统研究,主要工作如下:1.定义新的全粒度不确定性指标。本文结合传统粗糙集理论以及全粒度粗糙集模型特点,定义全粒度不确定性指标,易于探索全粒度粗糙集理论中的不确定性问题,丰富了全粒度粗糙集理论内涵,为全粒度属性约简奠定理论基础。2.重新定义相关全粒度属性约简。本文运用全粒度不确定性指标分别对概念的全粒度属性约简和全粒度Pawlak约简进行重新定义,不仅简化原本定义的计算复杂性,更进一步为全粒度属性约简启发式算法的设计提供理论依据。3.提出两种属性约简准则。本文从知识划分角度出发,给出可区分度和正区域可区分度的定义,提出了两种属性约简准则:基于可区分度属性约简、基于正区域可区分度属性约简,探究它们与全粒度各种属性约简的联系。理论分析表明基于正区域可区分度属性约简和全粒度Pawlak约简完全相等,则全粒度Pawlak约简可通过基于正区域可区分度属性约简间接获取,进而设计基于正区域可区分度属性约简启发式算法。4.实验分析基于正区域可区分度属性约简算法的高效性及可行性。该实验采用对比分析和交叉验证的方法,将该算法和其他方法作比较,分别在六组数据集中进行属性约简,最终比较其约简时间、约简率、分类准确率。(本文来源于《浙江师范大学》期刊2019-05-20)

姚晟,汪杰,徐风,陈菊[2](2018)在《不一致邻域粗糙集的不确定性度量和属性约简》一文中研究指出不确定性度量和属性约简是邻域粗糙集模型中重要的研究内容.针对目前已有的粗糙集不确定性度量方法难以应用于邻域粗糙集中,同时考虑到现有属性约简算法中很少考虑条件属性之间的关系也会影响约简结果和分类精度.首先分析了不一致邻域粗糙集的相关性质,然后提出了邻域条件熵的不确定性度量方法用来评价约简属性的质量,分析证明了相关的性质定理,接着引入统计学中秩相关系数的概念,通过计算条件属性之间的相关系数来剔除冗余属性,构造了基于相关系数的不一致邻域粗糙集属性约简算法(RNRS).最后在UCI数据集上与现有算法进行了比较分析,实验结果表明,本文的算法可以获取较少的属性特征和较高的分类精度.(本文来源于《小型微型计算机系统》期刊2018年04期)

姚晟,汪杰,徐风,陈菊[3](2018)在《不完备邻域粗糙集的不确定性度量和属性约简》一文中研究指出针对现有的属性约简算法不适合处理数值型属性和符号型属性共同存在的不完备数据,提出了一种拓展不完备邻域粗糙集模型。首先,通过考虑属性值的概率分布来定义缺失属性值之间的距离,可以度量具有混合属性的不完备数据;其次,定义了邻域混合熵来评价属性约简的质量,分析证明了相关的性质定理,并构造了一种基于邻域混合熵的不完备邻域粗糙集属性约简算法;最后从UCI数据集中选取了7组数据进行实验,并分别与基于依赖度的属性约简(ARD)、基于邻域条件熵的属性约简(ARCE)、基于邻域组合测度的属性约简(ARNCM)算法进行了比较。理论分析和实验结果表明,所提算法约简属性比ARD、ARCE、ARNCM分别减少了约1,7,0个,所提算法的分类精度比ARD、ARCE、ARNCM分别提高了约2.5,2.1,0.8个百分点。所提算法不仅能够获得较少的约简属性,同时具有较高的分类精度。(本文来源于《计算机应用》期刊2018年01期)

刘洪伟[4](2015)在《区间直觉模糊信息系统的不确定性度量与属性约简》一文中研究指出随着数据获取技术的发展和数据库管理系统的广泛应用,人们处理和分析数据的能力面临巨大挑战。那么如何从杂乱无章且具强干扰性的海量数据中挖掘出潜在、新颖、正确、有利用价值的知识,以改变“数据丰富,知识贫乏”的局面,也就成为了智能数据处理领域研究的重要研究课题。面对各种纷繁复杂的信息系统,在利用粗糙集理论处理这些系统时,由于系统本身和需要近似表达的集合都具有不确定性,因此对信息系统不确定性的研究成为粗糙集理论研究的主要课题之一。目前,经典信息系统和模糊信息系统的不确定性问题已经得到了很好的解决,基于经典信息系统和模糊信息系统的属性约简理论和方法也得到了迅速的发展和完善。但是随着粗糙集理论的不断推广,同时也是适应实际应用的需要,决策信息系统也被进一步推广,区间直觉模糊信息系统就是其中之一。然而,区间直觉模糊信息系统的不确定性度量,以及基于不确定度量的区间直觉模糊信息系统的属性约简,在现有的文献中还少有涉及。因此,本文对区间直觉模糊近似空间的不确定性度量,以及基于度量的属性约简两方面进行了系统的研究,主要工作如下:(1)在区间直觉模糊近似空间中,首先定义具有对称性的区间直觉模糊上、下近似算子。其次,在Pawlak近似空间和区间直觉模糊近似空间中,分别给出了区间直觉模糊粗糙隶属函数的定义,并讨论了相关性质。然后利用区间直觉模糊粗糙隶属函数的不同形式,给出了两种度量粗糙区间直觉模糊集不确定性的方法。最后利用区间直觉模糊粗糙隶属函数的区间直觉模糊熵,定义了区间直觉模糊粗糙集的模糊熵,并讨论了区间直觉模糊粗糙集的模糊熵为零的充要条件,以及证明了在区间直觉模糊近似空间中经典集合和它的余集的粗糙度量是相等的,以此来说明定义的合理性。(2)针对区间直觉模糊近似空间的信息度量进行研究,并利用信息度量给出决策信息系统的属性约简。首先,在直觉模糊集贴近度与熵之间关系的基础上,定义了区间直觉模糊集的贴近度与模糊熵间的关系,在新定义的区间直觉模糊集的贴近度的基础上,利用模糊近似空间的信息度量方法,给出区间直觉模糊近似空间的信息度量。其次,将区间直觉模糊关系下的信息系统划分成区间直觉模糊信息粒子,在此基础上获得基于区间直觉模糊关系的不确定性度量与属性约简方法。然后,结合粒子划分定义一种考虑了信息量函数具有补的性质的新的信息熵,并对其性质进行了研究。在不确定性度量讨论的同时,给出了系统的属性约简算法。再次,给出了通过属性集划分出的粒子来考虑知识的不确定性的相对模糊熵,并提出了区间直觉模糊近似空间的约简算法。最后,给出了区间直觉模糊近似空间中一种同时考虑集合和知识的不确定性的集成的不确定性度量方法。(本文来源于《辽宁工业大学》期刊2015-03-01)

滕书华[5](2010)在《基于粗糙集理论的不确定性度量和属性约简方法研究》一文中研究指出随着数据获取手段的快速发展,数据库数量和规模的增长速度远远超出了人类分析和应用的能力。如何从杂乱无章的、强干扰的海量数据中挖掘出潜在的、新颖的、正确的、有利用价值的知识,来改变“数据丰富,知识贫乏”这种局面,已成为智能信息处理领域研究的一个重要课题。粗糙集理论作为一种新的知识发现方法,在很多领域获得了广泛的应用,其中属性约简是其最重要的应用之一。经过近30年的发展,基于粗糙集的属性约简理论和方法得到了迅速的发展和完善,但也存在着一些问题。如,不确定性度量在属性约简中有着重要的应用,而现有度量方法并不能精确描述集合的不确定性,故探讨更加合理的度量方法是一个基础性问题;此外,缺乏普遍适用的高效约简算法,这是制约粗糙集理论实用化的重要方面。据此,本文对粗糙集理论的不确定性度量和属性约简两方面进行了系统研究,主要工作及创新如下:(1)从知识区分能力角度在一般二元关系下提出了多种知识不确定性度量,通过直观的文氏图表示给出了新的不确定性度量明确的粗糙集理论含义,从而使得粗糙集理论中的不确定性度量的本质易于理解,丰富了粗糙集理论的内涵,并为后续的属性约简算法打下了理论基础。(2)考虑到数据对象具有不同重要性的情况,基于一般二元关系提出了新的知识加权不确定性度量—α熵、α条件熵和α互信息。通过调整参数α分析了现有多种不确定性度量的异同,进而将现有的多种不确定性度量统一在一般二元关系的粗糙集模型中。新的加权不确定性度量方便地融入了主观偏好、先验知识等因素,从而更加符合实际。(3)在一般二元关系下提出了一种适用性更广、更加有效的加权集成不确定性度量。理论分析和实例表明新的集成不确定性度量弥补了现有不确定性度量的缺陷,更符合人类的认知规律,更精确的反映了粗糙集的两种不确定性。(4)为了提高算法效率,把属性的区分能力作为启发函数,首先利用不可区分度在一般信息系统中提出了一种能够处理噪声的、高效的完备约简算法;其次,在决策信息系统中利用相对可区分度提出了一种高效的启发式约简算法,并给出了该算法与代数观点和信息观点下约简算法间的关系。通过对仿真数据和UCI数据集的实验结果表明,两种基于区分能力观点的约简算法不仅能有效的处理海量数据,而且在大多数情况下能够得到紧凑约简。(5)针对不协调决策系统,首先讨论了基于区分能力观点的约简定义和现有的不协调决策表多种约简定义之间的关系,给出了多种简化协调决策表的概念,进而提出了一种基于区分能力观点的高效不协调决策表约简算法。实验结果表明,新算法不仅可以求得现有多种方法的属性约简,而且具有较好的约简质量和较高约简效率,适合处理具有大量冗余属性的不协调数据集。(6)考虑到决策信息系统中的噪声,在一般二元关系下提出了两种能够抑制噪声的近似属性约简算法,即AAR-DV算法和AAR-WαA算法,两种算法适用于多种粗糙集扩展模型,摆脱了现有约简算法对特定二元关系的依赖。特别是AAR-WαA算法还将数据的先验知识引入到了约简算法中。实验表明两种近似约简算法可有效增强抗噪性,在有效降低约简属性集规模的同时,还提高了约简结果的分类性能。(7)考虑到进行分类时组合多个约简将产生互补信息,在一般二元关系下提出了一种基于加权α精度的多约简组合分类算法。通过对UCI数据的实验表明,多约简组合分类算法对于存在大量约简的数据集是可行的,在不增加算法时间复杂度基础上,不仅有效降低了特征数量,还大大提高了分类精度。综上所述,本文提出的不确定性度量和高效属性约简算法具有明确的粗糙集理论含义,简单易于理解,适用范围广,具有重要的理论意义和潜在的应用价值。(本文来源于《国防科学技术大学》期刊2010-10-01)

徐略辉[6](2008)在《基于模糊粗集等价聚类的不确定性属性约简及其在服装搭配上的应用》一文中研究指出在人工智能、机器学习、模式识别和数据挖掘等领域的研究与应用中存在着不确定性。例如随机性、模糊性,还有不完全性、不一致性等。这些不确定性对于数据分析处理,尤其是在与决策分类相关的属性约简中必须加以考虑,否则可能得不到满意的约简目标。本文研究一种基于模糊粗集等价聚类的不确定性属性约简及其在服装搭配上的应用。主要的研究内容与创新点有:给出了一种模糊粗糙集等价类聚类划分方法;使用了模糊C—均值方法对模糊粗糙集的论域重新进行相关聚类划分,将分类结果作为等价类;得到的等价类的平均基数比较小,能够有效地加快不确定性属性约简的运算速度。提出了可变截集变精度模糊粗糙集模型:综合地处理不确定性属性约简中的不确定性问题,可以通过改变等价类的截集来去除数据集噪声引起的不确定性;根据需要设定近似概念的精度,从而减少决策概念中含有的不确定性,使得到的决策结果更加可信。给出了一种伪核集粒子群搜索算法:可以减少大规模的数据集处理中花费的时间,满足实时性要求,该搜索算法将粒子的组成与约简的伪核集相联系,从而使粒子朝着更优的方向进化,能加速不确定性属性约简算法的收敛过程。研究了一种考虑不确定性的服装搭配算法:首次给出了基于不确定性属性约简和规则推理的服装搭配系统,能自动地找出服装搭配组合,克服了服装搭配与人的主观性因素造成的不确定性,并且减少了最终搭配方案的误分率。(本文来源于《东华大学》期刊2008-01-01)

不确定性属性约简论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

不确定性度量和属性约简是邻域粗糙集模型中重要的研究内容.针对目前已有的粗糙集不确定性度量方法难以应用于邻域粗糙集中,同时考虑到现有属性约简算法中很少考虑条件属性之间的关系也会影响约简结果和分类精度.首先分析了不一致邻域粗糙集的相关性质,然后提出了邻域条件熵的不确定性度量方法用来评价约简属性的质量,分析证明了相关的性质定理,接着引入统计学中秩相关系数的概念,通过计算条件属性之间的相关系数来剔除冗余属性,构造了基于相关系数的不一致邻域粗糙集属性约简算法(RNRS).最后在UCI数据集上与现有算法进行了比较分析,实验结果表明,本文的算法可以获取较少的属性特征和较高的分类精度.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

不确定性属性约简论文参考文献

[1].姚坤.全粒度粗糙集不确定性度量及属性约简的研究[D].浙江师范大学.2019

[2].姚晟,汪杰,徐风,陈菊.不一致邻域粗糙集的不确定性度量和属性约简[J].小型微型计算机系统.2018

[3].姚晟,汪杰,徐风,陈菊.不完备邻域粗糙集的不确定性度量和属性约简[J].计算机应用.2018

[4].刘洪伟.区间直觉模糊信息系统的不确定性度量与属性约简[D].辽宁工业大学.2015

[5].滕书华.基于粗糙集理论的不确定性度量和属性约简方法研究[D].国防科学技术大学.2010

[6].徐略辉.基于模糊粗集等价聚类的不确定性属性约简及其在服装搭配上的应用[D].东华大学.2008

标签:;  ;  ;  ;  

不确定性属性约简论文-姚坤
下载Doc文档

猜你喜欢