约简分析论文-刘雅丽,张春红,王昕

约简分析论文-刘雅丽,张春红,王昕

导读:本文包含了约简分析论文开题报告文献综述及选题提纲参考文献,主要关键词:粗糙集,属性约简,就业影响因素

约简分析论文文献综述

刘雅丽,张春红,王昕[1](2019)在《基于粗糙集的属性约简及其在高校就业数据分析中的应用》一文中研究指出粗糙集理论是数据分析与知识发现的数学工具,近年来已被广泛应用于各个研究领域。本文利用粗糙集理论的属性约简算法,找出了影响高校数学专业学生就业的约简集。研究成果可以帮助高校学生更好地制定职业规划,为将来就业提供一定的帮助。(本文来源于《信息记录材料》期刊2019年07期)

郑文彬,胡敏杰,何秋红[2](2019)在《遗传算法下的粗糙集属性约简算法及其有效性分析》一文中研究指出将核引入遗传算法初始群体,根据决策属性对条件属性的依赖度来加强局部搜索能力,并保证全局寻优,得到最佳搜索效果。(本文来源于《长春工业大学学报》期刊2019年01期)

李云[3](2018)在《基于属性约简集评价节点重要性分析及应用研究》一文中研究指出准确及时的界定复杂网络中节点的地位对社会关系治理、网络传播与控制等具有重要的意义。一方面,通过研究网络中的重要节点发现薄弱环节,及时采取有效措施提高网络的鲁棒性;另一方面,通过对重要节点的识别,准确有效攻击网络的关键节点可快速达到摧毁目的。本文从评价节点重要性入手,提出了属性约简集算法,并在此基础上研究分析了真实的网络-济南公交网。网络成员的重要性确定通常依赖结构属性对网络节点的评价。本文先定义了网络中节点排序可区分以及属性约简集的概念,并在此基础上量化了属性聚类的阈值,从而确定了类别的数量,设计了网络节点重要性的属性约简集评价算法。通过属性约简集算法在海豚网、9·11恐怖分子合作网上的节点评价值、网络鲁棒性以及节点可区分性等方面的对比分析,发现属性约简集评价节点重要性的合理性与有效性。这些经典数据集的验证结果证明了本文算法既兼顾了网络结构的完整性,又避免了单一属性的片面性和多个属性之间的冗余性,提高了节点评价结果的准确性。公共交通网络作为身边的实际网络,也是一个巨大的复杂系统。其公交站点布局与网络的脆弱性分析也是一直备受关注。因此为了提升城市公交的运营效率,建立具有针对性的防御体系,本文建立了济南市公共交通网络,用复杂网络的理论解决身边的问题现象。通过宏观分析网络结构,得出网络的无标度特性。基于属性约简集算法,得到并分析公交站点的重要性排名,同时利用社团划分对济南公交枢纽布局的合理性进行验证。最后通过蓄意攻击与随机攻击两种分别对济南公交网的站点与线路进行攻击,分析公交网的脆弱性,为公交调度和应急救援提供参考意见。针对节点重要性的评价,本文提出了属性约简集算法,利用节点排序可区分在属性冗余和评价精确性之间做了客观地衡量,既保证了多个属性评价的精确性,又合理控制属性数量。为了实际应用价值,构建了济南市公交网。利用属性约简算法,研究了公交站点的重要性排序;结合社团划分算法,找到公交网的枢纽中心;利用不同攻击方法,研究分析了公交网站点与线路的脆弱性,这具有重要的现实意义与应用价值。(本文来源于《山东师范大学》期刊2018-06-06)

沈华,沈明姝,邱桃荣,张乐,刘萍[4](2018)在《属性约简在中医证候诊疗数据分析中的应用》一文中研究指出针对中医诊疗数据和诊疗结果数据存在不确定性等特点,通过研究基于粗糙集的属性约简方法,引入属性作用集差异度概念,并定义基于属性作用集差异度的属性重要度的计算方法,提出基于属性作用集差异度的属性约简算法,并将其应用于中医证候数据约简中以实现中医证候诊疗症状关键因子提取的需要。通过实际中医证候诊疗数据集上测试及与其他属性约简算法的测试比较,结果表明所提出的属性约简算法是有效的。(本文来源于《南昌大学学报(理科版)》期刊2018年02期)

李春鹏[5](2018)在《因素分析表中的约简及规则提取》一文中研究指出在现在这个信息爆炸的时代,各种各样的数据都在疯狂地增加,那么如何对海量的数据进行简化并且使简化后的数据和原本的数据相比没有信息的丢失以及从简化后的数据中提取有用的信息和知识便显得十分重要。那么作为在数据库中的应用广泛的重要数学理论,因素空间理论以及形式概念分析理论发挥了很大的作用。本文便是结合这两个不同的重要理论,从因素分析表出发,介绍了如何将其诱导形成对应的形式背景,然后得出既约形式背景的约简方法,以及利用描述子依赖等理论在既约因素分析表中进行规则提取的方法,即怎样从数据中得出有用的信息。(本文来源于《郑州大学》期刊2018-04-01)

王曙燕,陈朋媛,孙家泽[6](2017)在《基于变异分析的测试用例约简方法》一文中研究指出针对回归测试过程中由于测试需求的变更导致测试用例规模不断扩大、测试成本不断增加的问题,提出一种基于变异分析的测试用例约简方法(RTM)。首先,以测试用例能否检测到指定变异体为依据,对测试用例进行划分并创建二进制数值形式的变异体事务集矩阵;然后,应用改进的关联挖掘算法获取测试用例间的关联关系;最后,根据这些关联关系有效约简测试用例。6个经典程序仿真实验结果表明,RTM能够使约简后的测试用例约简率达到37%,与传统贪心算法和启发式算法相比,测试用例约简率提高了6%,且在提高测试用例约简率的同时,保证了测试覆盖率,单个测试用例的测试覆盖率平均提高了11%。所提方法能够利用尽可能少的测试用例满足更多的测试需求,有效提高了测试效率,降低了测试成本。(本文来源于《计算机应用》期刊2017年12期)

张亚红[7](2017)在《数据相关性分析和维数约简方法的研究与应用》一文中研究指出面对基因组学、物理学、政治科学、经济学等众多领域日益增长的海量数据,人们越来越多地依赖计算机智能化地从海量数据中获取解决问题所需的有用信息。作为数据智能化分析的两种有效手段,数据相关性检测技术和维数约简技术受到广泛关注。相关性检测方法能够自动地发现数据集中变量间的相关关系;维数约简方法将数据特征从高维降到低维,降维后的特征更能体现数据的本质结构,并且降低了后续数据处理的计算代价。本文对数据相关性分析和维数约简的理论方法和实际应用进行了深入的研究,主要工作概括如下:1.提出了检测多元变量间相关关系的最大信息熵法。对于k元变量集合,该方法首先根据任意两个变量间的最大信息系数值来构造最大信息矩阵R,然后由R的正特征根来计算这k个变量间的最大信息联合熵H_R~k,最后用1-H_R~k来衡量变量间依赖关系的强弱。叁维空间曲线上的仿真实验证明了最大信息熵能够检测叁元变量间的一维流形依赖;此外,通过全球健康数据集的相关性检测实验,证实了该方法的有效性和可行性。2.提出了直接检测叁元变量间一维流形依赖关系的最大全相关系数法。最大全相关系数的基本思想是:如果叁元变量间存在某种相关关系,那么在它们的散点图上就能够构造一个特殊的3维网格,使得数据点在该网格上的全相关明显大于0。最大全相关系数就是通过具有最大归一化全相关的网格来定义的,并由此来评估变量依赖关系的强弱。利用动态规划思想,本文设计出了可以快速求解最优划分的3维网格,并以大量仿真数据集和真实数据集上的实验证实了最大全相关系数的通用性、公平性和有效性。3.提出了一种基于相似性传播的维数约简方法该方法基于原始特征间的相似性,利用相似性传播算法将原始特征进行聚类,再对每个类别中的原始特征进行权重组合得到新的特征(抽取特征),以达到维数约简的目的。该方法能够实现数据维数的自动约简,且不需要求解数据协方差矩阵的特征值和特征向量等复杂运算,保证了算法的计算效率。UCI公开数据集上的可视化和分类实验结果显示新方法的性能要优于二次规划特征选择(QPFC)、近邻保存嵌入(NPE)和自组织特征聚类维数约简(SCFC)等维数约简方法。4.提出了一种基于费希尔信息度量的随机近邻嵌入方法该方法将文本的词频向量看作统计流形上的概率密度样本点,利用费希尔信息度量计算样本点间的距离,从信息几何的观点出发,对t分布随机近邻嵌入进行改进,提出了费希尔信息度量随机紧邻嵌入,解决了面向概率密度样本的维数约简问题。20Newsgroups、TDT2和Reuters21578文本数据库上的2维可视化和分类实验证实了该方法能够很好地处理概率密度样本的维数约简问题,同其它方法的对比实验也显示了它的竞争力。5.提出了深度皮尔逊嵌入框架。提出了一种相关性结构保持的参数化维数约简框架,即深度皮尔逊嵌入(DPE)。DPE采用皮尔逊相关系数来衡量高维样本间的相似度矩阵与低维样本间的欧氏距离矩阵中行向量的相关度,并要求它们尽可能地负相关,以保证高维空间中越大相似度的样本对在低维空间有着越小的欧氏距离。MNIST、COIL-20、Extented Yale B和AR等标准数据集上的大量对比实验证实了DPE的有效性和优越性。(本文来源于《北京工业大学》期刊2017-06-11)

蔡力钢,李广朋,程强,李伟硕[8](2016)在《基于粗糙集与偏相关分析的机床热误差温度测点约简》一文中研究指出为了合理减少温度测点数量并有效提高温度数据采集与分析的效率,提出了一种基于粗糙集与偏相关分析相结合的温度测点约简方法.首先,利用偏相关分析的方法建立了温度变量与主轴热误差之间的偏相关系数,并以此为依据辨识了主要的敏感温度变量.然后,在基于粗糙集理论获取的可行温度测点组合基础上,筛选出包含敏感温度变量最多及偏相关度高的温度测点组合.最后,建立了热误差线性回归模型,并在某型号数控机床上进行验证与分析.结果表明:温度传感器测点可由22个减少到6个,在很大程度上提高了热误差模型的精确性和鲁棒性.(本文来源于《北京工业大学学报》期刊2016年07期)

古莹奎,潘高平,朱繁泷,承姿辛[9](2016)在《基于邻域属性重要度与主成分分析的齿轮箱故障特征约简》一文中研究指出为有效降低齿轮箱故障特征的维数并提高诊断效率,提出了基于邻域属性重要度与主成分分析法相结合的齿轮箱故障特征约简方法,并利用支持向量机和BP神经网络对诊断的准确率进行对比分析。针对齿轮箱中具有不同程度裂纹的齿轮,选取其时域、频域和基于希尔伯特变换的36个特征;将邻域模型引入到特征属性的约简,构造前向贪心算法,以邻域属性重要度较大的9个特征作为特征集,提取累积贡献率达到95%以上的主成分,分别输入支持向量机和BP神经网络分类器中进行分类识别,并与不经过特征优选的主成分特征融合相对比。结果表明,采用基于邻域属性重要度与主成分分析法相结合的特征约简方法,既可以降低齿轮箱故障特征的维数,又不影响对其运行状态的表征,有助于识别不同裂纹水平的齿轮,与不经过特征优选直接进行融合的方法相比,所提出方法诊断准确率更高,训练时间更短。(本文来源于《中国机械工程》期刊2016年13期)

薛小明[10](2016)在《基于时频分析与特征约简的水电机组故障诊断方法研究》一文中研究指出在新时代绿色能源背景下,大力发展水电能源对我国能源结构优化调整和社会经济可持续发展具有重要的战略意义。作为水电站能源转换的关键核心设备,目前,水电机组呈现出巨型化、综合化、高速化、超临界化和智能化的发展趋势,其运行过程面临的故障安全问题日益突出。为降低机组故障事故风险,确保机组安全稳定运行,积极开展水电机组故障诊断研究已在工程界和学术界达成共识。实际应用中,除因机组自身复杂结构特性和多种激励振源干扰外,现有故障诊断理论方法的不足和局限性,在一定程度上阻碍了故障诊断从理论研究向工程应用的转化。基于此,本文围绕水电机组故障诊断中存在的非平稳信号分析处理和特征提取、多维特征约简以及复杂故障模式识别等问题,以经验模态分解、流行学习、混合引力搜索、支持向量机和随机森林等为理论基础与研究手段,探索并克服现有方法存在的理论与应用缺陷,提出了若干有效的水电机组非平稳振动信号分析与特征提取改进方法,针对高维特征冗余干扰等问题,探索并构建了基于空间映射和智能搜索的两种特征约简方法,最终通过引入支持向量机和随机森林故障识别理论,构建了融合时频分析和特征约简的水电机组混合故障诊断模型,为该领域的理论方法创新提供了新的研究思路,并具有一定的工程应用价值。论文的主要研究内容及创新性成果如下:(1)针对经验模态分解存在的端点飞翼现象,深入分析了端点效应发生的本质原因与解决方法,提出了一种极值点混合延拓的经验模态分解端点效应抑制方法,该方法有效融合了支持向量回归机和镜像偶延拓的方法优点。在信号分解初始阶段,利用支持向量回归机良好的近端点预测能力对信号极值点序列进行两端延拓;在信号低频部分,通过镜像偶延拓方法有效规避了支持向量回归机极值点样本训练数据不充足,且抑制效果不理想的问题。最后,采用所提方法对水电机组多故障振动仿真信号进行分解,并与镜像延拓和支持向量回归机信号序列延拓方法进行对比分析,结果表明所提方法能够有效抑制端点效应,并具有较低的计算时耗。(2)考虑到水电机组尾水管压力脉动信号的非平稳及噪声冲击特性,为提高经验模态分解方法的模态混迭抑制能力,引入集成经验模态分解时频分析方法。针对集成经验模态分解存在的参数选择难、高时耗、残噪污染等问题,在互补集成经验模态分解的基础上,创造性地提出了一种自适应快速集成经验模态分解算法。研究通过揭示白噪声频率上限与集成经验模态分解计算效率的间接正比例增长规律,描述了集成经验模态分解小噪声幅值情况下模态混迭问题的消除机制,基于此,将白噪声幅值和集成试验次数分别固定设置为目标信号序列标准差的0.01倍和2,提出了一种相对均方根误差指标的白噪声频率上限自适应确定方法,突破了集成经验模态分解关键参数难以设定的难题。通过仿真实例和国际标准故障诊断案例验证了所提方法的有效性与先进性。最终,将所提方法应用到水电机组尾水管压力脉动信号分析中,表明了方法的工程实用性。(3)为了抑制高维特征空间存在的特征冗余和敏感信息易淹没等问题,通过分析局部和总体主成分分析算法的优势和局限性,构建了样本点邻域关系的皮尔逊相似系数的衡量指标和边权重确定规则,进而提出了自适应近邻关系的监督型局部和总体主成分分析新型数据约简方法。同时考虑到水电机组故障小样本特性,建立了融合流行学习特征约简和支持向量机的多类故障诊断模型,通过电站实际故障案例验证了模型的有效性,并与其他特征降维方法进行了对比分析。此外,针对更为复杂的故障诊断问题,提出了一种多维广域特征的振动故障混合诊断策略,该方法有效融合了概率统计分析和基于机器学习的诊断方法,将整个诊断过程简化为叁大步骤:故障初步监测、故障类型识别和故障程度确定。最后,将混合诊断策略应用于旋转机械故障诊断中,结果表明所提方法不仅提高了故障诊断精度,而且有效降低了诊断模型的复杂度,改善了计算效率,同时,为水电机组复杂故障诊断问题提供了一种有效的解决思路。(4)针对基于空间映射的特征约简方法难以评价各特征属性优劣程度的问题,同时为消除模型参数对随机森林诊断精度的影响。从另一特征约简角度出发,提出了一种基于混合引力搜索算法和随机森林的转子系统故障诊断模型。该模型从特征子集和模型参数两方面对随机森林故障诊断模型进行了优化改进,针对特征子集选择,采用二进制引力搜索算法进行最优子集寻优,同时采用实数引力搜索算法对随机森林的决策树数目进行优化处理。最后,将所提方法应用于转子系统故障诊断中,通过8种故障类型诊断试验,结果表明所提方法能够有效剔除冗余特征信息干扰,解决了随机森林决策树数目选择难的问题,在一定程度上提高了随机森林诊断模型的精度和效率,此外,基于随机森林的袋外数据估计特性,进一步实现了最优特征属性的重要度评估。(本文来源于《华中科技大学》期刊2016-06-01)

约简分析论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

将核引入遗传算法初始群体,根据决策属性对条件属性的依赖度来加强局部搜索能力,并保证全局寻优,得到最佳搜索效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

约简分析论文参考文献

[1].刘雅丽,张春红,王昕.基于粗糙集的属性约简及其在高校就业数据分析中的应用[J].信息记录材料.2019

[2].郑文彬,胡敏杰,何秋红.遗传算法下的粗糙集属性约简算法及其有效性分析[J].长春工业大学学报.2019

[3].李云.基于属性约简集评价节点重要性分析及应用研究[D].山东师范大学.2018

[4].沈华,沈明姝,邱桃荣,张乐,刘萍.属性约简在中医证候诊疗数据分析中的应用[J].南昌大学学报(理科版).2018

[5].李春鹏.因素分析表中的约简及规则提取[D].郑州大学.2018

[6].王曙燕,陈朋媛,孙家泽.基于变异分析的测试用例约简方法[J].计算机应用.2017

[7].张亚红.数据相关性分析和维数约简方法的研究与应用[D].北京工业大学.2017

[8].蔡力钢,李广朋,程强,李伟硕.基于粗糙集与偏相关分析的机床热误差温度测点约简[J].北京工业大学学报.2016

[9].古莹奎,潘高平,朱繁泷,承姿辛.基于邻域属性重要度与主成分分析的齿轮箱故障特征约简[J].中国机械工程.2016

[10].薛小明.基于时频分析与特征约简的水电机组故障诊断方法研究[D].华中科技大学.2016

标签:;  ;  ;  

约简分析论文-刘雅丽,张春红,王昕
下载Doc文档

猜你喜欢