导读:本文包含了图聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:信任,图聚类,最密集子图,协同过滤
图聚类论文文献综述
曹银,李伟[1](2019)在《基于信任和图聚类的协同过滤推荐算法》一文中研究指出推荐系统的作用是为用户提供个性化的建议或服务,从而帮助用户在大量数据中快速找到感兴趣的项目。在现有的推荐算法中,基于模型的协同过滤推荐算法是推荐系统中一种重要且被广泛使用的方法,它可以解决推荐系统中的冷启动和数据稀疏等部分问题。文中对传统的协同过滤算法进行了改进,将组合了信任信息和图聚类算法的协同过滤技术应用在推荐系统。该方法首先将用户/项目信息表示为图形,然后在图形上使用近似最密集子图查找算法来找到初始集群中心,接着应用迭代方法来更新集群中心直到合并集群。最后将找到的集群作为邻居,对未知项目预测评级并向活跃的用户推荐前N项。在不同的数据集中,对比不同聚类方法的评估结果来表明所改进的方法优于其它推荐方法。(本文来源于《信息技术》期刊2019年10期)
张建朋,陈鸿昶,王凯,祝凯捷,王亚文[2](2019)在《基于采样的大规模图聚类分析算法》一文中研究指出针对当前聚类方法(例如经典的GN算法)计算复杂度过高、难以适用于大规模图的聚类问题,本文首先对大规模图的采样算法展开研究,提出了能够有效保持原始图聚类结构的图采样算法(Clustering-structure Representative Sampling,CRS),它能在采样图中产生高质量的聚类代表点,并根据相应的扩张准则进行采样扩张.此采样算法能够很好地保持原始图的内在聚类结构.其次,提出快速的整体样本聚类推断(Population Clustering Inference,PCI)算法,它利用采样子图的聚类标签对整体图的聚类结构进行推断.实验结果表明本文算法对大规模图数据具有较高的聚类质量和处理效率,能够很好地完成大规模图的聚类任务.(本文来源于《电子学报》期刊2019年08期)
袁璐,郑策[3](2019)在《图聚类的算法及其在社会关系网络中的应用》一文中研究指出在现代化社会发展的背景下,科技的发展取得了不小的进步,而本文主要对大数据时代下的图聚类算法以及其在社会关系网络中的应用进行进一步的分析和研究,以此为相关工作提供参考。(本文来源于《数码世界》期刊2019年08期)
莎仁[4](2019)在《基于超图聚类的大数据实体识别算法研究》一文中研究指出现已进入大数据时代,数据量成爆发式增长,数据量的增长带来严重的数据质量问题,使得数据的可用性极大降低,数据清洗变得更加重要。实体识别是数据清洗的重要步骤,主要目的就是准确的识别出同一实体,将数据对象与现实世界的真实实体一一对应,即对数据库中元组对是否指代同一实体进行判别。以此来达成去除冗余,消解不一致的数据清洗效果。通过实体识别可以有效的提高数据同一性。面向大数据的实体识别方法是现在研究的热点之一,但目前面向大数据的实体识别方法在识别效率上依然不尽如人意,目前的实体识别技术多基于领域知识,对领域知识的依赖性很高,领域无关的实体识别算法目前较少,基于图聚类的实体识别算法目前效果比较好,同时Spark计算平台在大数据处理上具有很大的优势,因此本文在基于图聚类的实体识别算法基础上使用Spark计算平台提出基于超图聚类的实体识别算法。本文首先介绍有关实体识别的相关技术以及理论基础,包括实体识别的分块技术和实体识别聚类技术。然后通过使用超图聚类方法,设计并实现在超图模型下的实体识别算法:首先通过建立倒排索引表和频繁项集挖掘的方法对数据进行分块处理,并为超图模型的构建做准备;通过挖掘好的频繁项集构建带权重的超图模型,将数据转换为超图;最后通过优化传统超图聚类方法进行超图聚类,完成对同一实体的识别。最后本文对提出的算法进行实验验证,使用标准的评价方法对算法分别从准确度、效率以及加速比叁个方面进行分析,最终实验证明本文提出的方法可以提高大数据实体识别效率,并在精确性上有不错的表现。适用于当前大数据量下的实体识别工作。(本文来源于《东北师范大学》期刊2019-06-30)
余海青[5](2019)在《基于团图聚类的重迭社区发现算法》一文中研究指出网络科学是研究复杂网络系统的定性和定量规律的一门交叉科学,研究涉及到复杂网络的各种拓扑结构及其性质,其研究对象来源于各应用领域,例如移动通信网络,交通网络,电力网络等.应用领域中很多网络都具有社区结构,即整个网络由多个社区构成,社区内个体之间的连接比较紧密,社区间个体之间的连接比较稀疏.由于社区结构对于深入理解网络的本质和充分利用网络的信息具有重要意义,社区发现成为了网络数据分析的一个重要课题.传统的网络社区发现算法着重于研究社区的定量刻画和社区结构的有效挖掘,多数社区发现算法把网络中的个体分且仅分到一个社区,但在许多实际的网络中,社区结构往往具有相互重迭的特征,即存在一些“骑墙节点”,这些骑墙节点可能同时属于多个社区.在这种情况下,挖掘重迭社区结构和分析重迭节点的特性,将有助于我们更准确地了解网络的结构特征.2010年,Lehmann等人提出了一种能够发现具有重迭性和层次性社区结构的方法,把社区看作是网络中边的集合,对边进行社区发现,进而基于边的社区得到原网络节点的重迭社区.然而,在很多真实网络中边数往往大于节点数,因此把边图作为二级图进行聚类与直接将节点进行聚类相比,将极大地增加社区发现算法的计算量.鉴于此,从实现重迭社区结构发现且同时减少计算时间的角度出发,本文提出了一种基于团图的重迭社区发现新思路.其中,由于在很多网络中团的数目往往远小于边数,我们将把网络中的社区看作网络中团的集合,对团进行聚类,再将团的社区转化为原网络节点的社区.由于节点可以属于不同的团,所以节点就可以属于不同的社区,于是我们将可以得到可重迭的社区结构.基于团结构的全耦合性,团图聚类算法能够在社区内保留团内节点紧密连接的特点,这使得基于团实现的重迭社区发现也保持了准确性.同时提出了重迭节点成对的社区隶属度和成对的社区介数中心性定义,可以通过这些性质来判断重迭节点在所属社区间的传递性.(本文来源于《东北师范大学》期刊2019-05-01)
张远亮[6](2019)在《分布式异构图聚类算法研究》一文中研究指出图模型是计算机科学中最通用的数据结构之一,常用来刻画多源异构数据之间的内在关系。社交媒体数据等都可以利用图模型进行建模,对这些图进行聚类分析能够挖掘出数据中更多有用的信息。为了提高聚类质量,现有工作额外考虑了图顶点的属性信息,从而生成了属性图。然而,现有的属性图聚类方法通常是分别考虑顶点属性相似性和图结构相似性。此外,快速增长的数据量和数据类型要求图聚类算法具有更高的效率和扩展性。因此,本文研究分布式异构图聚类算法,并统一度量顶点属性相似性和图结构相似性。为对属性图顶点属性相似性和图结构相似性进行统一度量,本文提出将属性图转换成星型异构图的图构造策略,然后利用个性化PageRank算法(PPR)来度量图顶点相似性。为提高图顶点相似性计算的性能,本文提出了四种PPR并行计算优化算法来加速计算效率。为对异构图顶点进行高效聚类,本文提出了一种基于近邻图的并行DBSCAN聚类方法,并设计了基于核心顶点骨架的优化策略对聚类效率进行优化。此外,本文提出基于信息熵的边权重迭代优化策略来平衡不同属性的重要性,并提升聚类质量。基于现实数据集的实验评估印证了本课题方法的有效性、高效性和扩展性。(本文来源于《浙江大学》期刊2019-03-15)
朱向[7](2018)在《基于树图聚类的多车货物平衡装载》一文中研究指出针对车辆使用数最少和车辆使用总成本最小的两类多车货物平衡装载问题,采用预分配策略进行处理:在分析货物尺寸及重量匹配状况基础上,设计树图聚类算法实现货物合理组合和向适合车辆分配;再根据各车分配货物的规格状况,提出与之相适应的单辆车的平衡布局算法;最后通过设计参数取值的调整,将两阶段处理有机结合并起来实现整体布局方案优化的目的。算例表明设计的方法可有效提高多车整体装载率,并实现负荷在各车辆间的均衡分布。(本文来源于《系统工程》期刊2018年12期)
王玉辉,张乐,祁颖[8](2018)在《基于马尔可夫的属性图聚类算法》一文中研究指出属性图各顶点包含着丰富的信息,在图聚类问题中如何有效使用这些丰富的信息,已经成为开展此类研究的目的。不同于传统的图聚类问题,属性图上的聚类要同时考虑图的结构信息和节点的属性信息。因此,如何平衡两者之间的关系,是属性图聚类的主要关注所在。由于马尔可夫图聚类算法(Markov Clustering algorithm,MCL)仅使用图的拓扑结构信息,没有考虑属性信息,因此提出一种基于马尔可夫的属性图聚类算法(Attributed-based Markov Clustering algorithm,AMCL),对图顶点的属性相似度进行度量并将其转化为边权重再进行随机漫步。真实数据集上的实验验证了所提算法可得到更好的聚类效果,特别是提升聚类内部顶点的属性相似度。(本文来源于《中国计算机用户协会网络应用分会2018年第二十二届网络新技术与应用年会论文集》期刊2018-11-08)
杨予丹[9](2018)在《基于加权符号图聚类和马尔科夫随机场的图像分割》一文中研究指出图像分割是根据图像的颜色、灰度值、纹理、形状等特征或特征集合的相似性准则,将其分成一些不同且不重迭的区域。图像分割是计算机视觉中的基本而又核心的问题之一,以归一化割(Normalized cut,简称Ncut)等为代表的无符号图聚类方法在该问题上获得了成功应用。相比于无符号图,加权符号图能够表达更丰富的关系。当前普遍应用于图像分割的图聚类方法均以无符号图为基础,本文尝试利用加权符号图聚类进行半监督图像分割,分析了加权符号图上的符号归一化割(Signed Normalized cut,简称 Signed Ncut)的表现,并提出了基于MRF正则化的改进方案。本文的工作有两部分:(1)将半监督信息表达为成对约束,并将像素之间的关系表达为加权符号图,用符号归一化割进行聚类。采用了图聚类的主流优化方法——谱方法来求解其松弛问题,通过k-means算法得到图像的二相分割。Signed Ncut的整体表现明显优于Ncut,说明其在半监督图像分割问题上具有可行性。但是,Signed Ncut在分割精度等统计指标以及轮廓贴合性上仍有待提升。(2)尝试在SignedNcut中引入MRF正则化势函数,以进一步提升Signed Ncut的分割效果。通过对Signed Ncut进行线性近似,构造了上界辅助函数,基于图割技术迭代地优化逼近最优解。实验表明,MRF正则化的SignedNcut具有更好的轮廓贴合性,在相关的统计指标上表现更好。综上所述,本文尝试利用带权符号图来表达像素之间的关系,将Signed Ncut与MRF正则化进行了融合,为图像分割提供了新思路,也扩充了符号图聚类的应用。(本文来源于《湖南师范大学》期刊2018-06-01)
王禹森,余正涛,高盛祥,周超,洪旭东[10](2018)在《基于图聚类的汉越双语新闻话题发现》一文中研究指出跨语言新闻话题发现是将互联网上报道相同事件的不同语言新闻进行自动归类,由于不同语言文本很难表示在同一特征空间下,对其共同话题的挖掘就比较困难。然而类似的新闻事件在不同语言文本表达上具有相同的新闻要素,这些要素之间关联能够体现出新闻事件的关联性,因此,针对汉越新闻话题发现问题,提出基于文档图聚类的汉越双语新闻话题发现方法。首先提取汉越新闻文本新闻要素,借助文本中要素相似度计算汉越文本相关度,构建汉越双语文本图模型,获得新闻文本相似度矩阵;然后,借助图模型中文本间的传播特点,采用随机游走算法对相似度矩阵进行调整,最后利用信息传递算法进行聚类。实验结果表明提出的方法取得了很好的效果。(本文来源于《数据采集与处理》期刊2018年03期)
图聚类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对当前聚类方法(例如经典的GN算法)计算复杂度过高、难以适用于大规模图的聚类问题,本文首先对大规模图的采样算法展开研究,提出了能够有效保持原始图聚类结构的图采样算法(Clustering-structure Representative Sampling,CRS),它能在采样图中产生高质量的聚类代表点,并根据相应的扩张准则进行采样扩张.此采样算法能够很好地保持原始图的内在聚类结构.其次,提出快速的整体样本聚类推断(Population Clustering Inference,PCI)算法,它利用采样子图的聚类标签对整体图的聚类结构进行推断.实验结果表明本文算法对大规模图数据具有较高的聚类质量和处理效率,能够很好地完成大规模图的聚类任务.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
图聚类论文参考文献
[1].曹银,李伟.基于信任和图聚类的协同过滤推荐算法[J].信息技术.2019
[2].张建朋,陈鸿昶,王凯,祝凯捷,王亚文.基于采样的大规模图聚类分析算法[J].电子学报.2019
[3].袁璐,郑策.图聚类的算法及其在社会关系网络中的应用[J].数码世界.2019
[4].莎仁.基于超图聚类的大数据实体识别算法研究[D].东北师范大学.2019
[5].余海青.基于团图聚类的重迭社区发现算法[D].东北师范大学.2019
[6].张远亮.分布式异构图聚类算法研究[D].浙江大学.2019
[7].朱向.基于树图聚类的多车货物平衡装载[J].系统工程.2018
[8].王玉辉,张乐,祁颖.基于马尔可夫的属性图聚类算法[C].中国计算机用户协会网络应用分会2018年第二十二届网络新技术与应用年会论文集.2018
[9].杨予丹.基于加权符号图聚类和马尔科夫随机场的图像分割[D].湖南师范大学.2018
[10].王禹森,余正涛,高盛祥,周超,洪旭东.基于图聚类的汉越双语新闻话题发现[J].数据采集与处理.2018