导读:本文包含了加权关联模式树论文开题报告文献综述及选题提纲参考文献,主要关键词:信息检索,跨语言检索,文本挖掘,关联规则
加权关联模式树论文文献综述
黄名选,卢守东,徐辉[1](2019)在《基于加权关联模式挖掘与规则后件扩展的跨语言信息检索》一文中研究指出【目的】针对自然语言处理中查询主题漂移和词不匹配问题,提出一种基于加权关联模式挖掘和规则后件扩展的跨语言信息检索模型及其算法。【方法】该模型采用新的加权关联模式支持度和基于最大项目权值的项集剪枝策略挖掘频繁项集,利用置信度和相关度评价加权关联规则,根据扩展模型从规则中提取优质扩展词实现规则后件扩展,扩展词与原查询词项组合为新查询再次检索文档得到最终检索结果。【结果】实验结果表明,与单语言检索基准比较,本文检索模型的R-prec和P@10平均增幅分别为42.49%和25.53%;与跨语言检索基准比较,其平均增幅分别为91.87%和64.61%;与现有基于加权关联规则挖掘的跨语言检索方法比较,R-prec和P@10最高平均增幅分别可达93.20%和34.60%。【局限】只进行实验性研究,需要探讨在实际跨语言搜索引擎中的具体应用。【结论】本文检索模型能有效地减少查询主题漂移和词不匹配问题,改善和提高检索性能。(本文来源于《数据分析与知识发现》期刊2019年09期)
黄名选,蒋曹清[2](2018)在《基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展》一文中研究指出主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法.该算法采用新的完全加权正负项集支持度和关联度计算方法以及模式评价框架,对初检用户相关反馈文档集挖掘与原查询词相关的正负关联模式,从模式中提取扩展词实现跨语言查询译后扩展.与现有基于伪相关反馈、加权关联模式挖掘的跨语言扩展算法比较,本文算法能有效地减少查询主题漂移和词不匹配问题,提高跨语言信息检索性能;本文模式挖掘方法可用于推荐系统,提高其准确性.(本文来源于《电子学报》期刊2018年12期)
徐佳骎[3](2015)在《基于餐饮消费数据的加权关联模式挖掘》一文中研究指出随着我国经济飞速发展,人民生活水平不断提高,酒店餐饮行业也呈现迅猛发展态势。面对顾客日益提升的消费需求和激烈的行业竞争,行业领导者们不断改革创新、与时俱进,以此来适应市场环境、提升自身竞争实力。大数据时代即将到来,利用大数据分析技术从海量数据中提取出有价值的商业模式,能为企业带来更多盈利。许多酒店都使用了餐饮管理系统,在长年累月的经营过程中,积累下大量的顾客消费数据。可以分析这些数据发现顾客的消费习惯、不同消费群体的特征、以及菜品搭配销售等知识,这些都能为企业制定营销策略提供依据。本文对某酒店餐饮消费数据进行分析,采用关联规则方法,以支持度-置信度为剪枝条件,来发现菜品之间同桌出现的关联规律。如今广泛使用的关联挖掘算法--Apriori算法存在一些不足之处:它把数据库中各个项视为同等重要。但现实中经营者们会更加关注利润较高的菜品,而忽略利润较低的菜品;也就是说,要根据各个项的重要性区分对待。为此,本文提出基于Apriori算法的加权关联规则算法,对酒店菜品按一定规则赋予权值进行挖掘。该算法既能挖掘出重要的关联规则,又保持了Apriori算法的频繁集向下封闭的特性,有效地提高了加权算法的运行效率。最后,针对支持度-置信度框架下关联规则挖掘的不足:会产生大量冗余、甚至虚假的规则。本文采用基于X2独立检验的统计方法,对挖掘产生的规则建立二维列联表,通过假设检验,筛选出相关系数显着大于零的规则。(本文来源于《云南大学》期刊2015-05-01)
余如,黄丽霞,黄名选[4](2015)在《教育信息化数据中完全加权正负关联模式发现》一文中研究指出对海量教育信息化数据关联模式的挖掘与分析,有利于发现教育信息化数据中事先不知道的、但又是潜在有用的教育模式和知识,为教育管理、教育决策和教学改革提供科学的依据。研究面向教育信息化数据的完全加权负关联模式挖掘技术,提出一种新的教育信息化数据完全加权正负关联模式挖掘算法。该算法考虑了项目在事务数据库中的权值,从教育数据中挖掘完全加权频繁项集和负项集,在支持度-置信度-相关性架构下从频繁项集和负项集挖掘有趣的教育数据完全加权正负关联模式。通过模式分析,发现教育领域潜在的教育、教学规律和教育发展趋势,提高教育信息化数据分析和处理水平。以真实的教育信息化数据作为实验数据测试集,实验结果表明,与现有的正负模式挖掘算法比较,所提出的算法更有效、更合理,其挖掘出的正负关联模式更加接近现实。(本文来源于《计算机应用与软件》期刊2015年04期)
余如,黄名选,黄丽霞[5](2015)在《基于互信息的教育数据矩阵加权正负关联模式发现》一文中研究指出本文将互信息模型引入教育数据关联模式挖掘,提出一种基于互信息的教育数据矩阵加权正负关联模式挖掘算法,给出与其相关的定理及其证明。本文算法克服了现有挖掘算法的缺陷,考虑了教育数据项集在学生信息数据库中具有的权值,采用新的正负关联模式评价标准,挖掘出更接近实际情况的正负关联模式。通过关联模式分析,发现教育数据中潜在有用的教育、教学规律和教育发展趋势,为教育管理、教育决策和教学改革提供科学的依据。以真实的教育数据作为实验数据测试集,实验结果表明,本文算法有效,在教育信息化数据处理与分析中具有重要的应用价值。(本文来源于《数据采集与处理》期刊2015年01期)
高亮,夏冰,黄名选[6](2015)在《一种有效的完全加权正负关联模式挖掘算法AWAPM_SPRMI》一文中研究指出完全加权正负关联模式在文本挖掘、信息检索等方面具有重要的理论和应用价值。针对现有挖掘算法的不足,构建完全加权正负关联模式评价框架SPRMII(support-probability ratio-mutual information-interest),提出完全加权项集双兴趣度阈值剪枝策略,然后基于该剪枝策略提出一种新的基于SPRMII框架的完全加权正负关联模式挖掘算法AWAPM_SPRMII(all-weighted association patterns mining based on SPRMII)。该算法克服了传统挖掘算法缺陷并采用新剪枝方法从完全加权数据库中挖掘有趣的频繁项集和负项集,通过项集权重维数比的简单计算和SPRMII评价框架,从这些项集中挖掘有效的完全加权正负关联规则。理论分析和实验表明,该算法有效,具有良好的扩展性,与现有经典挖掘算法比较,获得了良好的挖掘性能。(本文来源于《计算机应用研究》期刊2015年06期)
冯婧垚,李兴明[7](2007)在《基于加权关联模式的通信网告警相关性分析》一文中研究指出加权关联规则挖掘是告警相关性分析的重要手段。本文引入了比例加权支持度的概念,提出了一种基于加权关联模式树的加权关联模式挖掘算法。实验表明,本算法与MINWAL(O)算法相比,时间效率有了明显提高,节约了存储空间,告警相关性分析的准确性也得到了提高。(本文来源于《电信科学》期刊2007年11期)
加权关联模式树论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法.该算法采用新的完全加权正负项集支持度和关联度计算方法以及模式评价框架,对初检用户相关反馈文档集挖掘与原查询词相关的正负关联模式,从模式中提取扩展词实现跨语言查询译后扩展.与现有基于伪相关反馈、加权关联模式挖掘的跨语言扩展算法比较,本文算法能有效地减少查询主题漂移和词不匹配问题,提高跨语言信息检索性能;本文模式挖掘方法可用于推荐系统,提高其准确性.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
加权关联模式树论文参考文献
[1].黄名选,卢守东,徐辉.基于加权关联模式挖掘与规则后件扩展的跨语言信息检索[J].数据分析与知识发现.2019
[2].黄名选,蒋曹清.基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展[J].电子学报.2018
[3].徐佳骎.基于餐饮消费数据的加权关联模式挖掘[D].云南大学.2015
[4].余如,黄丽霞,黄名选.教育信息化数据中完全加权正负关联模式发现[J].计算机应用与软件.2015
[5].余如,黄名选,黄丽霞.基于互信息的教育数据矩阵加权正负关联模式发现[J].数据采集与处理.2015
[6].高亮,夏冰,黄名选.一种有效的完全加权正负关联模式挖掘算法AWAPM_SPRMI[J].计算机应用研究.2015
[7].冯婧垚,李兴明.基于加权关联模式的通信网告警相关性分析[J].电信科学.2007