导读:本文包含了属性相似度关联论文开题报告文献综述及选题提纲参考文献,主要关键词:数据清洗,数据挖掘,关联度,中文简称匹配
属性相似度关联论文文献综述
郭晖,董源,周钢[1](2018)在《基于属性关联相似度的中文简称匹配算法研究》一文中研究指出字符匹配是数据清洗中提高数据质量的重要途径。针对中文名词简称的匹配问题,在分析现有中文匹配算法的基础上,提出一种基于数据库中各属性关联度的匹配算法,通过对匹配名词所处属性的关联属性的数据对比相似度,按照中文简称和全称数据量设置置信度,从而得到简称匹配度。实例实验表明,该算法具有较好的适用性和准确性。(本文来源于《计算机与数字工程》期刊2018年09期)
刘兆丽,秦涛,管晓宏,赵丹,杨涛[2](2016)在《采用用户名相似度传播模型的线上用户身份属性关联方法》一文中研究指出针对用户跨线上行为复杂多样难以融合监控的问题,提出了基于用户名相似度传播模型的线上用户身份属性关联方法。结合中文社交网络中用户名的特征,将用户名中的中英文字符进行分离,并采用贪婪算法分别求取不同用户名之间的中英文字符串的最大公共子串,以此实现含中英文字符的用户名相似度的计算;结合用户线上的好友结构网络,仅利用一阶邻居的用户名相似度求解用户对的匹配度,由此不但实现了用户名相似度沿网络结构的快速传播,也大幅度地降低了匹配算法的计算复杂度。结合所收集的新浪微博和人人网中用户身份属性数据的实验结果表明:新提出的字符串匹配算法将用户名匹配准确率提升了近30%,传播模型也大幅度地减少了用户名匹配的计算量,分析结果不但可以实现用户跨线上应用行为的关联融合,也对网络舆论控制和行为监管具有重要的参考价值。(本文来源于《西安交通大学学报》期刊2016年04期)
高会生,李英敏[3](2015)在《一种基于分层属性相似度聚类的ASON告警关联分析方法》一文中研究指出针对传统属性相似度告警聚类不能充分挖掘告警属性语义信息的不足,结合自动交换光网络(automatically switched optical network,ASON)的告警特点,分析了告警属性语义信息对告警聚类的作用,定义了具有分层特点的属性相似度函数,增强了聚类结果的客观性,并利用历史告警库复杂度和聚类扩充率对聚类效果进行了比较分析。实验表明,新方法与传统的告警属性相似度聚类方法相比,具有更高的准确性。对于在特定时间段内故障类型较多的情况,新方法具有较好的适应性。(本文来源于《科学技术与工程》期刊2015年06期)
李英敏[4](2014)在《基于分层属性相似度的通信告警关联模型研究》一文中研究指出目前,随着网络规模的增大,网络结构复杂度的提高,为保障网络的健壮性,网管系统对网络的综合管理越来越重要。网络告警是在网络构件发生异常行为时上报给网管系统的实时信息,是网络状态的直接表达。一般情况下,网络异常行为指网络故障,网管人员可以通过对告警的分析定位网络故障,并及时采取相应的措施。告警关联则是分析海量告警数据的重要技术。本文建立了基于分层属性相似度的告警关联模型,根据同一故障引发的告警性相似程度高的原理,将原始告警进行分类,形成超告警,从而用一组告警代替单一告警表达故障信息,增加了告警的语义信息,帮助网管人员提高分析效率,降低了工作量。本文对国内外的告警关联研究现状进行了分析,并从不同的角度对告警关联技术进行了分类,比较了各个告警关联技术的优劣势。分析了告警关联在网管系统中的重要作用,总结了告警关联的主要内容。根据某实际电力通信网ASON告警的特点,建立了基于分层属性相似度的通信告警关联模型。该模型相对于传统的告警聚类方法,主要是在定义属性相似函数时引入了“超属性”的概念,实现了对属性相似度函数的分层定义,提高了相似度值的对故障的表达能力。引入了历史告警库复杂度、聚类扩充率、超告警支持计数叁个指标,以在不需要专家知识的前提下实现对聚类效果进行合理的评价。最后将传统的告警聚类方法和基于分层属性相似度的告警聚类方法用于实际电力系统通信网ASON告警关联,并比较了两种方法的聚类效果。由比较结果得,在满足一定工程执行效率的前提下,本文提出的告警关联模型对于某时段内故障情况较复杂的情况有更好的聚类效果。说明本文提出的告警关联模型具有一定的工程实际价值。(本文来源于《华北电力大学》期刊2014-12-01)
韩伟,孙永雄,郭铁颖[5](2012)在《基于属性相似度的TD-SCDMA网络告警关联分析方法研究》一文中研究指出针对TD-SCDMA网络的故障告警信息量大,且具有衍生性和相似性的特点,采用属性相似度的关联分析方法,对故障告警信息压缩、过滤、归一化处理,可有效提高告警数据的质量,结合TD-SCDMA网络故障的特点,讨论了总体属性、网元、时间、告警等级属性的相似度计算方法。(本文来源于《广东通信技术》期刊2012年09期)
毛治佳[6](2011)在《基于属性相似度的报警关联系统的研究与实现》一文中研究指出IDS(Intrusion Detection Systems)旨在检测网络入侵行为,当前的IDS普遍存在以下问题:1)洪流报警:普通的IDS每天几乎能产生数百甚至上千的报警,报警中的大部分都是误报警(false- negative)和重复报警;2)低级报警:大部分基于规则的IDS在工作的过程中,只要检测到满足某个特征的数据包便会产生报警,通过这些低级独立的报警信息很难关联和分析出攻击者的意图;3)报警独立:IDS只能针对不同的攻击产生相互独立的报警,不能报告诸如DDOS和蠕虫病毒等大范围的攻击。本文针对洪流报警和低级报警问题进行了如下的研究:(1)对现有报警相似度计算方法进行了研究和对比分析,确定了IP地址,端口和报警类别相似度的计算方法,并对时间相似度算法进行了重点研究。通过实验分析了报警之间时间相似度的变化趋势及数学模型,给出了本文采用的时间相似度算法和参数的取值。这些相似度算法构成了报警属性相似度综合算法的基础模块。(2)设计了基于属性相似度的报警信息聚合关联系统,针对IDS存在的不同问题,采用不同的模块予以处理,具体包括:采用报警过滤器来过滤重复报警;采用聚合器来关联低级别的独立报警;采用关联器来分析攻击步骤和意图。(3)实现了以上提出的报警信息聚合关联系统,并用DARPA1999数据进行模块测试和整体测试分析。实验证明采用了上述方法的报警聚合关联系统能大量减少IDS的重复报警和误报警,较为准确的聚合和关联相似报警,有效提高了IDS系统的可用性。(本文来源于《西安电子科技大学》期刊2011-01-01)
李瑞民[7](2011)在《基于属性模糊相似度的关联分析》一文中研究指出任何网络信息系统,均易遭受各种网络安全风险的威胁。攻击者有能力攻破许多现已开发的网络安全防护技术,亦可能攻破任何将要开发的新技术。在这种环境下,快速的入侵检测和恢复能力对网络安全至关重要。对分布式入侵检测而言,多个IDS的协同配置在增强网络系统安全的同时,会产生大量的重复报警或警报冗余。为有效消除警报冗余,改善入侵检测的效果和性能,本文提出了一种基于特征属性模糊相似度的入侵警报聚合算法。该算法基于模糊逻辑,通过综合分析告警的攻击类型特征,时间特征,空间特征叁维属性,分别定义具体的隶属函数,按照攻击类型和时间,空间特征属性相似度对入侵警报进行聚合,实时处理事件并进行冗余消除。同时,引进置信度的概念,根据IDS分布环境的差异,选择最优化的置信度,使报警信息融合尽量接近实际情况,充分发挥信息融合的优势。本文结合当今入侵检测系统告警关联现状,在主要研究Valde提出的利用告警信息特征的相似性的基础上,在告警信息关联上提出一些自己的见解,主要工作体现在如下方面:1.引入置信度的概念,并作为告警关联的一个独立属性加载到整个算法中,同时直接优化告警关联的结果。2.对入侵检测系统的报警信息进行标准格式化和集中收集,存储。3.研究,选择,并实现基于属性相似度的关联算法,对采集到的数据进行关联分析,挖掘出报警信息间的关系和联系,通过关联,合并,聚类,形成高质量的告警信息,降低报警信息间的冗余度。4.利用流量产生工具对算法进行仿真实现,初步的实验结果表明该模型能在保证报警信息完整的前提下有效的减少重复报警,降低报警信息的冗余度。(本文来源于《西安电子科技大学》期刊2011-01-01)
属性相似度关联论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对用户跨线上行为复杂多样难以融合监控的问题,提出了基于用户名相似度传播模型的线上用户身份属性关联方法。结合中文社交网络中用户名的特征,将用户名中的中英文字符进行分离,并采用贪婪算法分别求取不同用户名之间的中英文字符串的最大公共子串,以此实现含中英文字符的用户名相似度的计算;结合用户线上的好友结构网络,仅利用一阶邻居的用户名相似度求解用户对的匹配度,由此不但实现了用户名相似度沿网络结构的快速传播,也大幅度地降低了匹配算法的计算复杂度。结合所收集的新浪微博和人人网中用户身份属性数据的实验结果表明:新提出的字符串匹配算法将用户名匹配准确率提升了近30%,传播模型也大幅度地减少了用户名匹配的计算量,分析结果不但可以实现用户跨线上应用行为的关联融合,也对网络舆论控制和行为监管具有重要的参考价值。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
属性相似度关联论文参考文献
[1].郭晖,董源,周钢.基于属性关联相似度的中文简称匹配算法研究[J].计算机与数字工程.2018
[2].刘兆丽,秦涛,管晓宏,赵丹,杨涛.采用用户名相似度传播模型的线上用户身份属性关联方法[J].西安交通大学学报.2016
[3].高会生,李英敏.一种基于分层属性相似度聚类的ASON告警关联分析方法[J].科学技术与工程.2015
[4].李英敏.基于分层属性相似度的通信告警关联模型研究[D].华北电力大学.2014
[5].韩伟,孙永雄,郭铁颖.基于属性相似度的TD-SCDMA网络告警关联分析方法研究[J].广东通信技术.2012
[6].毛治佳.基于属性相似度的报警关联系统的研究与实现[D].西安电子科技大学.2011
[7].李瑞民.基于属性模糊相似度的关联分析[D].西安电子科技大学.2011