属性挖掘论文-邹静昭,赵宁,卢翠荣,武琳

属性挖掘论文-邹静昭,赵宁,卢翠荣,武琳

导读:本文包含了属性挖掘论文开题报告文献综述及选题提纲参考文献,主要关键词:复杂属性环境,非关系型,大数据,聚类算法

属性挖掘论文文献综述

邹静昭,赵宁,卢翠荣,武琳[1](2019)在《复杂属性环境非关系型分布式大数据挖掘仿真》一文中研究指出对复杂属性环境的数据识别有利于充分挖掘大数据包含的信息与价值,提出一种非关系型分布式大数据挖掘算法。首先,引入分布式的最大频繁项算法模型,在物理分散逻辑下,对非关系型数据应用分布式方法进行数据分析,利用建立候选频繁项的搜索条件降低数据检测次数,并采取划分投影法,计算各频繁项对应的分区编号,将其规划到不同的分区中,从而优化冗余频繁项,然后针对数据库中大数据的数据特征建立各个属性的关联度,根据Boosting聚类方法,把由弱聚类得到的局部模型在每次迭代过程中升级为全局模型,再对其进行区块划分,并利用划分质量重新调整迭代采样率,最终得到聚类结果,完成数据挖掘。通过仿真验证了非关系型分布式大数据挖掘具有显着的准确性、稳定性和实用性。(本文来源于《计算机仿真》期刊2019年10期)

于建平,付继林,白塔娜,李少辉,洪文学[2](2019)在《基于独有属性特征的情态与语境互动关系数据挖掘研究》一文中研究指出情态是一个复杂语义系统,其语义不确定性给其词义识别带来很大困难。语境与情态互动并对情态动词的词义有很大的限制作用,因此,揭示情态与语境互动限制关系对自然语言处理、机器翻译和智能语义识别特征优选研究都具有重要意义。本文基于形式概念分析理论和独有属性特征计算方法,通过数据挖掘发现情态动词词义与语境特征的互动关系,以及语境特征对情态动词词义的限制作用等知识。以英语情态动词must为目标词,针对其主要词义,从语料库中抽取150个样本例句作为对象,分别从must出现的语境中提取了32个特征,包括语义、句法、语用和话题特征作为属性,建立了表达must不同词义对象与其所具有的属性特征之间关系的形式背景。采用独有属性特征计算方法提取了must词义分类规则。通过对比分析其不同词义分类规则,发现了must与不同语境特征的互动限制关系。研究结果为自然语言处理和智能语义识别特征选择研究提供了有价值的依据。(本文来源于《燕山大学学报》期刊2019年05期)

马晶,刘建华[3](2019)在《Spark平台下综合属性权重离群点挖掘算法研究》一文中研究指出针对传统离群点检测算法对海量高维数据检测性能低下的问题,论文提出一种Spark平台下综合属性权重离群点挖掘算法S-CAWOM,通过对数据对象属性的综合加权处理,使不同的属性发挥不同的作用,并在Spark平台并行化提高算法效率。实验结果表明,该算法具有较高的性能。(本文来源于《计算机与数字工程》期刊2019年08期)

中国纺织面料流行趋势专业研究团队[4](2019)在《挖掘自然属性之美》一文中研究指出编者按:2020春夏男装面料将纱线和纹理重塑,使用未染色的有机纱线运用于纯色、同色调条纹和格纹面料当中。天然有机棉、亚麻和麻料在图案和纹理上展现微妙瑕疵,成为除丹宁外的又一经典实用面料,并呈大热之势。雅致街装简洁感和清爽感是该主题的主(本文来源于《中国纺织报》期刊2019-08-07)

江新源[5](2019)在《基于属性划分信息增益的函数依赖挖掘算法研究》一文中研究指出随着互联网时代的进一步发展,数据成为了一种新兴的生产资料。当前,各行各业的信息系统中包含了大量的数据,尤以关系型数据为主,这些数据往往存在错误,难以有效利用。因此,人们希望能够找到一些行之有效的策略对数据进行修复,而在关系型数据中,函数依赖扮演了数据修复的重要角色。函数依赖(Functional Dependency)是关系模型中的一个重要概念,可被用于模式泛化,数据清洗,数据修复,数据整合等。关系数据下的函数依赖发现方法已经被研究数十年,并提出了各种函数依赖挖掘方法,但是仍旧残存了一些问题,例如挖掘属性数目庞大的数据库实例中的函数依赖时,算法速度仍然不理想。近年来传统的发现算法如深度优先遍历的DFD,其时间复杂度会呈现指数级上升。针对该问题,本文提出了属性划分信息增益这一概念,将原始DFD函数依赖发现算法和HYFD算法中的集中抽样方法相结合。首选使用属性划分间的信息增益列表改进原始DUCC算法中下一节点选择的随机游走备选策略,以此寻找唯一属性组合MUC,再通过集中抽样处理方法对数据集进行抽样计算得到非函数依赖,最后对单属性主键节点、非单属性主键、非函数依赖节点路线进行剪枝,并参考信息增益列表对原始DFD算法的起始路线进行选择,使得改进后的算法理论上优于原始算法。最后本文利用Metanome下的公开数据集对算法进行了验证,并开发了一种能够自动检测和修复数据的excel插件。实验结果表明,基于属性划分信息增益的函数依赖挖掘算法相比原始DFD速度更快。当数据集的记录数和属性数较大时,改进后的算法与原始算法相比具有更好的鲁棒性。同时,由于采取了集中抽样处理方法,当改进的算法在计算数据集较大的情况下,其内存开销相比原始DFD算法更小。(本文来源于《重庆邮电大学》期刊2019-06-06)

王少妮[6](2019)在《数据子集的显着属性挖掘研究》一文中研究指出数据子集的显着属性是一个数据子集明显区别于其他数据子集的属性,是许多决策制定的科学依据,在实际生活中具有十分重要的应用价值。数据子集的显着属性挖掘具有多个研究对象,这能够反映一个群体与其他群体差异显着的属性。这些显着属性可以指导研究人员、管理者制定并优化相关决策。目前提出的各种关于显着属性挖掘的方法主要研究对象只有单个,并未涉及多个研究对象,而且现有方法无法有效挖掘数据子集的显着属性,难以满足现实中分析群体之间属性差异的需求。针对研究中存在的这些问题,本文提出了基于多个研究对象的数据子集的显着属性挖掘问题。将提出的数据子集的显着属性挖掘问题进行了形式化定义,并设计了组显着属性挖掘(Group Outlying Aspects Mining,GOAM)算法。实验结果表明,相比于传统的显着属性挖掘算法,该算法能够识别出数据子集的显着属性,进而有效解决了实际生活中有关多个研究对象的显着属性挖掘问题。为了进一步验证和说明本文提出的GOAM算法的可用性和实用性,本文将GOAM算法应用于两个真实数据集上,进行了十二组关于数据子集的显着属性挖掘实验,并将这些挖掘得到的显着属性结果进行了可视化分析,这些分析结果可以作为从业者优化管理决策和制定战略计划的科学依据。(本文来源于《西安石油大学》期刊2019-06-05)

余佳[7](2019)在《基于微博用户属性与发文内容的兴趣挖掘方法研究》一文中研究指出随着互联网和大量社交媒体的飞速发展,特别是移动网络服务的快速普及,微博的用户量正在迅速的增加。根据2018年微博用户发展报告得知,微博月活跃用户已经达到了 3.37亿,比2017年增长3.8%。由于用户可以使用微博平台快速发表自己简短的言论与想法,海量的用户群体一天将产生近亿条数据信息。这些数据中包含了用户的生活经历,专业知识,兴趣爱好,新奇想法等等。如何从这些用户的数据中挖掘出用户的行为,兴趣爱好,消费水平等有价值的信息是一件非常有意义的工作。例如在微博平台对用户进行兴趣挖掘能够带来较大商业价值的就是微博营销和关注用户推荐,它通过人与人之间的关系网络,挖掘每个用户的兴趣,预测一个用户可能感兴趣的物品和可能感兴趣的另一微博用户,将热门物品推荐给每一个用户和将有相同兴趣的用户组成一个群体。因此无论是微博平台为用户进行差异化推荐热门物品的微博营销,还是将有相同爱好的用户进行群体划分,如何准确的挖掘出用户的兴趣偏好都是两者的基本任务。本文针对微博社交网络平台上的用户,分析了微博用户的特征。微博用户的主要特征包括用户的发文内容、用户的个人属性与交互行为叁个方面。用户的兴趣偏向主要体现在用户的发文内容中,用户对什么领域有兴趣,就会更倾向于发表、转发、评论什么领域的话题。因此本文根据微博用户的活跃度将用户分为活跃用户和非活跃用户。针对活跃用户,由于用户发文内容较丰富,可以直接利用用户发文内容挖掘用户的兴趣偏向,但是微博的发文内容是非常常见的短文本,有稀疏性、高维、数据量大等特征存在,所以这是一个很具有挑战性的问题。然而非活跃用户由于发文内容少或者不存在,所有需要充分利用此类用户的所有特征。本文根据划分的两类用户分别做了以下研究:1、针对活跃用户,本文提出了一种结合内部数据的User-LDA主题模型与在非常大的外部语料库上训练的词的潜在特征向量表示来扩展狄利克雷混合多项式主题模型(简称ULW-DMM)。ULW-DMM模型能很好的挖掘微博短文本的有效信息主题,从而综合用户的主题信息挖掘出用户的兴趣点与所在的兴趣领域。2、针对非活跃用户,本文主要从用户的个人属性和少量发文内容中挖掘用户兴趣点。首先提出了将用户的兴趣点数量化的方法,建立了用户对兴趣点的兴趣度值。接着,将二部图、随机游走算法和协同过滤算法进行结合,提出了一种新颖的基于二部图的限制性随机游走协同过滤算法。该算法是通过用户对兴趣点的兴趣度值建立带权用户-兴趣点二部图;然后针对随机游走算法提出限制性游走条件找到相似用户集。最后利用协同过滤算法的核心思想为非活跃用户挖掘出更多的兴趣点。3、最后的实验结果表明,ULW-DMM模型对比其他四类相似模型,在对微博短文本进行主题建模的主题一致性上有着更好的效果,并且在对用户进行分类兴趣领域的任务上都有了比较大的改进,呈现了非常理想的性能。验证了该模型对活跃用户进行兴趣挖掘的有效性。基于二部图的限制性随机游走协同过滤算法对比其它两种协同过滤算法,有着明显的优势。准确度实验证明本文算法在找到非活跃用户的相似用户集有更高的质量。划分实验中本文算法对非活跃用户划分兴趣领域时的F1值提高了27.2%。验证了该算法对非活跃用户进行兴趣挖掘的有效性。(本文来源于《中央民族大学》期刊2019-05-20)

贺珂[8](2019)在《基于关联规则的用户产品属性偏好变化挖掘》一文中研究指出随着交互式网络和电子商务的发展与成熟,关于产品的用户评论数量正在迅速增长,产品在线评论逐渐受到电子商务卖家、产品企业和同行竞争公司的关注。在线评论提供有关产品质量的信息,对帮助消费者判断产品质量、降低购买决策的不确定性从而辅助其更好地做出购买决策具有非常重要的作用。为了更好地挖掘在线评论中的价值,之前的研究通过对评论中产品属性进行提取,获得关键特征,从而获得消费者的需求,为企业的产品战略发展提供支持。但是,关于产品属性的研究缺乏动态性,同时未考虑用户情感与评分不一致的情形。因此,本文从在线产品评论入手,并用评论文本的情感得分代替用户评分,提出基于关联规则的用户产品属性偏好变化挖掘的方法,为企业更深入了解用户需求做出理论支撑,提高研发效率,保持与发展企业优势,增强企业竞争力。本研究选择中关村产品在线评论为研究平台,以OPPO手机R15系列的产品在线评论为例,采用定量分析的研究方法,利用网络爬虫抓取用户对该产品的评论数据。通过对抓取数据进行处理,采用关联规则和情感评分相结合的方法对提取出的产品属性进行分析,并且通过两个不同时期的关联规则趋势挖掘,比较影响用户满意度的关键属性的变化情况,得出如下结论:(1)结合关联规则与情感评分可以将产品在线评论中包含的产品属性进行更准确的分析,避免用户评分与实际满意度不一致的情况;(2)通过基于产品属性的关联规则趋势挖掘可以对两个不同时期的关联规则进行比较,识别出四种变化模式,找出产品关键属性的变化方向,从而获取用户的对产品属性的偏好变化情况。理论上,本文通过情感评分划分用户满意度的方式,采用基于产品属性的关联规则挖掘方法,找出影响用户满意度的重要属性,可以有效提高关联规则挖掘的准确性。另外,对中文在线产品评论两个时期的关联规则趋势分析,弥补了关联规则动态分析在中文文本领域方面的不足。实践上,本文的研究结果可以让商家更深入了解用户需求,在优化产品属性,节约研发成本,提高销售量方面提供参考。(本文来源于《山东大学》期刊2019-05-06)

陈兴蜀,何涛,曾雪梅,邵国林[9](2019)在《基于告警属性聚类的攻击场景关联规则挖掘方法研究》一文中研究指出针对现有攻击场景重构方法中存在关联规则挖掘不充分、攻击场景链断裂的问题,以及安全设备的误告警影响攻击场景重构准确性的现状,提出一种基于告警属性聚类的攻击场景关联规则挖掘方法。该方法能够有效挖掘攻击场景关联规则,减少攻击链断裂,还原实际的多步攻击,更好地帮助安全管理员深入理解攻击者入侵行为并掌握攻击全貌。以真实网络中的安全设备的原始告警为数据源,首先,对原始告警数据进行预处理,实现告警数据的归一化。然后,通过构建告警时间序列,利用FFT和Pearson相关系数对误告警周期特性进行分析,生成误告警过滤规则。接着,提出一种基于动态时间阈值的告警属性聚类方法,通过告警属性相似性刻画告警间相似度,并根据告警发生的时间间隔结合动态时间阈值方法更新聚类时间,对属于同一攻击场景的告警进行聚类。最后,利用Apriori频繁项挖掘算法生成攻击场景序列模式,并对具有重复攻击步骤的攻击场景序列模式进行融合生成关联规则。在四川大学校园网真实环境中进行实验,结果表明所提方法可有效缓解攻击链断裂问题和误告警的影响,相较于对比方法可有效提升生成的攻击场景关联规则的完整性。(本文来源于《工程科学与技术》期刊2019年03期)

董骁阳[10](2019)在《基于属性挖掘的树形结构情感词典在情感计算问题中的研究》一文中研究指出情感计算是计算机技术领域中一项新兴的研究方向,人们在这一方向进行了大量的研究,情感计算的目的是让计算机也能够像人类一样去理解情感。目前情感计算最常用的方法就是基于情感词典的方法,但是目前普遍使用的几个情感词典都是一维的,它们只是简单地将情感词以及它的情感倾向性以链式的结构进行存储,但是同一个情感词在不同的评价对象类别或属性下可能会表现出不同的情感倾向性,这种情况是这些常见的情感词典无法解决的。为了解决这个问题,本文利用树形结构的特点提出了一种树形结构情感词典。在树形结构中同一个父结点下的子结点具有相似性,并且随着层次的加深和树分支的细化,这种相似性会变得越来越大;不同父结点下的子结点间的相似性很小,并且随着公共的祖先结点的减少,相似性会锐减。本文利用这个特点,将评价对象类别和评价对象对应的属性用树形结构存储,并将情感词添加到这个树形结构中,组成一个树形结构情感词典。这样在这个树形结构情感词典中每个情感词都对应一个属性或者评价对象类别,解决了同一个词在不同的评价对象或属性下可能会有不同的情感倾向性这个问题,并且由于在树形结构情感词典中每个子结点都是其父结点的一个属性或者一个子类别,父结点与子结点是包含的关系,所以每个结点都将它存储的情感词向它的父结点进行传递,这样就解决了在树形结构情感词典中对应属性或者评价对象下搜索不到情感词的问题。本文实验利用贝叶斯定理构建出一个具体的树形结构情感词典和一个链式结构情感词典,利用这个树形结构情感词典进行情感计算得到的结果与链式结构情感词典相比,在准确率上平均提升了9.78%;识别正向情感文本的精确度平均提升了10.40%,召回率平均提升了4.78%,F值平均提升了7.72%;识别负向情感文本的精确度平均提升了4.87%,召回率平均提升了20.84%,F值平均提升了12.99%。利用树形结构情感词典进行情感计算得到的结果优于传统的链式结构情感词典。本文的主要创新点是为了解决同一个情感词在不同的评价对象类别或属性下会表现出不同的情感倾向性的情况,提出了树形结构情感词典。本文重点研究了树形结构情感词典的构建和基于树形结构情感词典的情感计算这两大部分。在树形结构情感词典的构建部分,本文首先介绍了如何利用评价对象类别之间的关系构建一棵评价对象树,然后介绍了利用句法分析和关联规则的方法进行属性挖掘和情感词提取,最终构建了树形结构情感词典。在基于树形结构情感词典的情感计算这部分,首先介绍了在树形结构情感词典中搜索情感词的方法,然后介绍了如何判断情感词的情感倾向性,最后介绍了判断文本情感倾向性的方法。(本文来源于《吉林大学》期刊2019-04-01)

属性挖掘论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

情态是一个复杂语义系统,其语义不确定性给其词义识别带来很大困难。语境与情态互动并对情态动词的词义有很大的限制作用,因此,揭示情态与语境互动限制关系对自然语言处理、机器翻译和智能语义识别特征优选研究都具有重要意义。本文基于形式概念分析理论和独有属性特征计算方法,通过数据挖掘发现情态动词词义与语境特征的互动关系,以及语境特征对情态动词词义的限制作用等知识。以英语情态动词must为目标词,针对其主要词义,从语料库中抽取150个样本例句作为对象,分别从must出现的语境中提取了32个特征,包括语义、句法、语用和话题特征作为属性,建立了表达must不同词义对象与其所具有的属性特征之间关系的形式背景。采用独有属性特征计算方法提取了must词义分类规则。通过对比分析其不同词义分类规则,发现了must与不同语境特征的互动限制关系。研究结果为自然语言处理和智能语义识别特征选择研究提供了有价值的依据。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

属性挖掘论文参考文献

[1].邹静昭,赵宁,卢翠荣,武琳.复杂属性环境非关系型分布式大数据挖掘仿真[J].计算机仿真.2019

[2].于建平,付继林,白塔娜,李少辉,洪文学.基于独有属性特征的情态与语境互动关系数据挖掘研究[J].燕山大学学报.2019

[3].马晶,刘建华.Spark平台下综合属性权重离群点挖掘算法研究[J].计算机与数字工程.2019

[4].中国纺织面料流行趋势专业研究团队.挖掘自然属性之美[N].中国纺织报.2019

[5].江新源.基于属性划分信息增益的函数依赖挖掘算法研究[D].重庆邮电大学.2019

[6].王少妮.数据子集的显着属性挖掘研究[D].西安石油大学.2019

[7].余佳.基于微博用户属性与发文内容的兴趣挖掘方法研究[D].中央民族大学.2019

[8].贺珂.基于关联规则的用户产品属性偏好变化挖掘[D].山东大学.2019

[9].陈兴蜀,何涛,曾雪梅,邵国林.基于告警属性聚类的攻击场景关联规则挖掘方法研究[J].工程科学与技术.2019

[10].董骁阳.基于属性挖掘的树形结构情感词典在情感计算问题中的研究[D].吉林大学.2019

标签:;  ;  ;  ;  

属性挖掘论文-邹静昭,赵宁,卢翠荣,武琳
下载Doc文档

猜你喜欢