导读:本文包含了标记传播论文开题报告文献综述及选题提纲参考文献,主要关键词:传播算法,多标记,主题模型,滑动窗口
标记传播论文文献综述
刘芳芳,谷瑞军,张婉婷[1](2018)在《滑动窗口多标记传播算法在微博用户聚类的应用》一文中研究指出对微博用户进行合理的分类有助于理解特定网络社群的行为,为之提供多元化的网络服务。通过用户的自我标签和对历史微博进行分词获取主题标签,摈弃权值较低的主题标签,然后结合用户自我标签与话题标签提取带权值的用户标签,计算用户相似度构造一个无向图。最后,应用基于滑动窗口的多标记传播算法对无向图进行社区划分。滑动窗口可以存放多个标记,从而一个用户可以归属于多个类别。通过新浪微博爬取的真实数据进行实验,结果表明该方法能有效发现具有重迭划分的簇,且簇的意义比较明确。(本文来源于《内江科技》期刊2018年12期)
葛芳,郭有强,王磊,马程[2](2015)在《基于改进标记传播算法的基因表达谱数据研究》一文中研究指出提出一种改进的标签传播算法,并将其应用于基因表达谱数据分析中.首先使用概率矩阵表示基因表达数据,将少量样本标记为已知,同时定义一个标记序列表示样本的类别属性;然后通过迭代公式更新标记序列,得到标记序列的收敛解,并证明了该收敛解的唯一性;最后采用正负标记的方式,根据标记序列各分量的符号差异实现数据类别的划分.经过癌症数据集实验的验证,证明了提出的方法可以快速有效地实现基因表达数据的聚类.(本文来源于《商丘师范学院学报》期刊2015年06期)
王年,葛芳,王俊生,唐俊[3](2014)在《基于改进标记传播算法的基因表达谱数据分析》一文中研究指出针对原始标记传播算法迭代次数过多和阈值选取的不确定性等问题,提出一种改进的标记传播算法,并将其应用于基因表达谱数据分析。首先将高维基因表达谱数据表示为权值矩阵,同时定义一个表示样本类别属性的标记序列,并将其中少量样本标记为已知;然后利用根据Gauss-Seidel迭代算法推导出的迭代公式更新标记序列,并证明标记序列的解的收敛性;最后采用正负标记的方式,根据标记序列各分量的符号差异实现数据类别的划分。通过白血病和结肠癌数据集实验,证明了本文方法的有效性。(本文来源于《中南大学学报(自然科学版)》期刊2014年07期)
牟南[4](2013)在《基于限制标记传播的搜索引擎反链接作弊方法》一文中研究指出当今网络环境下,搜索引擎是人们获取信息的一条主要途径。然而搜索引擎的发展受到了搜索引擎作弊行为的挑战。搜索引擎作弊行为定义为采用一些刻意设计的机制来提高网站或网页在搜索引擎结果中排名的行为。进行搜索引擎作弊行为的网站就叫做作弊网站。作弊者为了达到他们的目的,会仔细研究搜索引擎的排名算法,找出排名依据的主要因素加以利用。所以,搜索引擎作弊是搜索引擎面对的最主要挑战,如果不采取措施,搜索引擎的结果会被严重干扰,导致许多人不再信任搜索引擎。由于搜索引擎作弊技术在不断进化,其方法也多种多样,再加上互联网数据的庞大性,这些因素都给反搜索引擎作弊工作带来了困难。从搜索引擎作弊出现至今,人们已经提出了多种多样的应对不同类型搜索引擎作弊的策略。本文首先分类说明了了常见的搜索引擎作弊方法,包括基于内容的、基于链接的和基于隐藏页面的。之后详细介绍了已有的几种代表性的搜索引擎反作弊算法。同时提出了已有的主流反作弊方法,即基于标记传播的方法的缺陷。本文进一步提出了限制标记传播的反作弊方法,先使用随机游走获取到作弊社区群,然后根据作弊社区群的信息对信任值标记和作弊值标记在网络中的传播进行限制,在一定程度上弥补了已有算法的缺陷。通过在多个真实数据集上的实验,证明了限制标记传播的算法相比已有的标记传播算法效果的提升,改进了搜索引擎反作弊的质量。(本文来源于《大连理工大学》期刊2013-03-21)
佘俏俏,俞扬,姜远,周志华[5](2012)在《一种基于标记传播的大规模图像分类方法》一文中研究指出在基于内容的图像检索中,图像标记具有十分重要的作用.由于为图像加标注代价昂贵,研究者通过利用大量的未标记数据来提高分类性能,标记传播是其中的一类有效方法.随着数据采集、存储技术的发展,数字图像的积累越来越容易,但现有的标记传播方法难以处理真实世界中的大规模数据.因此,针对大规模图像标记,融合标记传播和随机森林技术,提出一种新方法RFLP.它使用随机决策树进行样本压缩,使得传统的标记传播方法能够在压缩过的示例上高效执行,以利用未标记数据提高分类性能,然后利用随机森林将标记传播的结果推广到所有未标记示例上.实验结果表明,新方法RFLP的可扩展性明显优于传统标记传播方法,且其分类性能良好.(本文来源于《计算机研究与发展》期刊2012年11期)
黄健斌,钟翔,孙鹤立,茆婉婷[6](2013)在《基于相似性模块度最大约束标记传播的网络社团发现算法》一文中研究指出提出一种基于相似性模块度最大约束标记传播的快速网络社团发现算法(MLPA)。该方法采用结构相似度计算,通过最大约束标记传播模型更新节点标记,使社团的划分结果更加符合社团内部结构相对紧密、社团之间结构相对稀疏的特点,提高社团划分的精确度。结合标记传播5次循环迭代可以完成95%或者更多节点标记过程的实验结果,判定标记更新过程趋于稳定,从而在稳定时停止更新,降低了运行时间。MLPA避免了传统的邻接矩阵计算方法,适合大规模网络的社团发现。(本文来源于《北京大学学报(自然科学版)》期刊2013年03期)
谷瑞军,陈圣磊,陈耿,汪加才[7](2012)在《图像搜索结果的滑动窗口多标记传播聚类》一文中研究指出针对图像聚类中数据量大、部分重迭等问题,提出一种基于滑动窗口的多标记传播聚类算法。首先根据图像距离计算图像间的相似度,设定阈值将相似度转变为链接,构造出一个无向图;然后应用基于滑动窗口的多标记传播算法对无向图进行社区划分。滑动窗口可以存放多个标记,从而一个图像可以归属于多个类别。对公开网络数据和搜索引擎返回的真实图像数据进行实验,结果表明,该方法能有效发现具有重迭划分的簇,且簇的意义比较明确。(本文来源于《中国图象图形学报》期刊2012年09期)
胡正平,王玲丽[8](2011)在《基于L1-Graph表示的标记传播多观测样本分类算法》一文中研究指出同类样本被认为是分布在同一个高维观测空间的低维流形上,针对多观测样本分类如何利用这一流形结构的问题,提出基于L1-Graph表示的标记传播多观测样本分类算法。首先基于稀疏表示的思路构造L1-Graph,进而得到样本之间的相似度矩阵,然后在半监督分类标记传播算法的基础上,限制所有的观测样本都属于同一个类别的条件下,得到一个具有特殊结构的类标矩阵,最后把寻找最优类标矩阵的计算转化为离散目标函数优化问题,进而计算出测试样本所属类别。在USPS手写体数据库、ETH-80物体识别数据库以及Cropped Yale人脸识别数据库上进行了一系列实验,实验结果表明了本文提出方法的可行性和有效性。(本文来源于《信号处理》期刊2011年09期)
赵娜,臧景才[9](2009)在《多标记传播聚类算法在电子商务中的应用》一文中研究指出文中介绍了Web挖掘的基本概念,提出了一种基于加权关联矩阵聚类的Web日志挖掘算法——多标记传播聚类算法,设计了一个面向电子商务的Web日志挖掘系统模型。(本文来源于《青海大学学报(自然科学版)》期刊2009年01期)
赵娜[10](2008)在《多标记传播聚类算法及其在Web日志挖掘中的应用》一文中研究指出随着Internet的飞速发展,人们在享受网络带来的丰富信息和极大便利的同时,也遇到了“数据丰富知识贫乏”的问题。有效的解决途径就是将数据挖掘技术应用到WWW的挖掘中,即Web挖掘。Web挖掘包括Web内容挖掘、Web结构挖掘和Web使用挖掘。其中,Web日志挖掘作为Web使用挖掘中最有研究价值的一部分,得到了研究人员的极大关注。利用Web日志挖掘技术可以发现用户访问网站的浏览模式及网站页面之间的关系,继而进行用户聚类和页面聚类。数据预处理是数据挖掘前期的必要工作,是为数据挖掘算法提供有效输入和获取有价值的挖掘结果的前提条件。本文研究了传统的数据预处理过程,针对网站拓扑结构比较复杂时用户识别算法时间效率低的缺陷,对传统的用户识别算法进行了改进。根据多标记传播聚类算法的需要,构造了一种适用于该算法的数据预处理过程。本文在对聚类算法研究的基础之上,为了更好地体现用户的访问兴趣,以网站访问频度为参数,引入了加权关联矩阵的概念,并提出了一种基于加权关联矩阵聚类的挖掘算法——多标记传播聚类算法(MPCA),该算法是对标记传播思想的扩展,目的在于利用矩阵的稀疏特性来减少算法的执行时间。本文构造的预处理过程省略了复杂的会话识别和事务识别环节,可以更加真实地再现用户的访问情形。算法效率高,能够为挖掘算法提供有效的输入数据。与普通的矩阵聚类算法相比,多标记传播聚类算法克服了基于距离的算法在空间复杂性和时间复杂性方面的局限性,在处理Web日志构成的大稀疏矩阵方面具有一定的优势。经实际检验,表明采用多标记传播聚类算法的挖掘结果对于用户聚类和页面聚类是有效的、可行的。本文提出的多标记传播聚类算法虽然具有良好的可扩展性,但是还需要进一步改进,比如,设计出高效的基于Web日志的数据挖掘系统;将多标记传播聚类算法与遗传算法相结合,以获得更高的挖掘效率。(本文来源于《西安电子科技大学》期刊2008-04-01)
标记传播论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
提出一种改进的标签传播算法,并将其应用于基因表达谱数据分析中.首先使用概率矩阵表示基因表达数据,将少量样本标记为已知,同时定义一个标记序列表示样本的类别属性;然后通过迭代公式更新标记序列,得到标记序列的收敛解,并证明了该收敛解的唯一性;最后采用正负标记的方式,根据标记序列各分量的符号差异实现数据类别的划分.经过癌症数据集实验的验证,证明了提出的方法可以快速有效地实现基因表达数据的聚类.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
标记传播论文参考文献
[1].刘芳芳,谷瑞军,张婉婷.滑动窗口多标记传播算法在微博用户聚类的应用[J].内江科技.2018
[2].葛芳,郭有强,王磊,马程.基于改进标记传播算法的基因表达谱数据研究[J].商丘师范学院学报.2015
[3].王年,葛芳,王俊生,唐俊.基于改进标记传播算法的基因表达谱数据分析[J].中南大学学报(自然科学版).2014
[4].牟南.基于限制标记传播的搜索引擎反链接作弊方法[D].大连理工大学.2013
[5].佘俏俏,俞扬,姜远,周志华.一种基于标记传播的大规模图像分类方法[J].计算机研究与发展.2012
[6].黄健斌,钟翔,孙鹤立,茆婉婷.基于相似性模块度最大约束标记传播的网络社团发现算法[J].北京大学学报(自然科学版).2013
[7].谷瑞军,陈圣磊,陈耿,汪加才.图像搜索结果的滑动窗口多标记传播聚类[J].中国图象图形学报.2012
[8].胡正平,王玲丽.基于L1-Graph表示的标记传播多观测样本分类算法[J].信号处理.2011
[9].赵娜,臧景才.多标记传播聚类算法在电子商务中的应用[J].青海大学学报(自然科学版).2009
[10].赵娜.多标记传播聚类算法及其在Web日志挖掘中的应用[D].西安电子科技大学.2008