导读:本文包含了主题树论文开题报告文献综述及选题提纲参考文献,主要关键词:主题树,特征匹配,搜索,层状拓展
主题树论文文献综述
张军丽,何保锋,马建红[1](2015)在《基于语义主题树的搜索覆盖度层状拓展方法》一文中研究指出为了提高用户对网站使用的效率,提高网站本体模型的搜索性能,研究一种高效的网页语义概念树构建方法,进行搜索覆盖度层状拓展。传统方法中,使用搜索引擎的词语相似度算法进行搜索拓展,利用规则、聚类等技术对形式背景进行约简,无法有效简历概念间的上下位关系,性能不好。提出一种基于语义主题树特征匹配的搜索覆盖度层状拓展方法,进行Web语义模型和主题树构建,构建特征空间互信息区域文档词频向量模型,对数据库中记录的属性字段进行归类抽象,形成概念汇聚点,实现语义主题树构建搜索覆盖度拓展设计,构建语义主题树特征匹配算法,优化搜索引擎对文本特征的搜索敏感度,提高搜索覆盖度,实现文本搜索覆盖度层状拓展。实验分析得出,该方法具有较好的文本特征分类结果,语义层次结构清晰,可以有效提高文本数据召回率和查准率,展示了较好的应用价值。(本文来源于《科技通报》期刊2015年04期)
邱云飞,郭弥纶,邵良杉[2](2014)在《基于主题树的微博突发话题检测》一文中研究指出针对传统话题检测方法不能很好处理微博中用语不规范、随意性强、指代不明确以及存在大量网络用语的问题,提出了一种基于潜在狄利克雷分配(LDA)模型的主题树检测方法。首先,运用自然语言处理(NLP)中增大信息熵的方法将相关微博整理成一棵主题树,配合狄利克雷先验α与经验值β随主题数目动态变化的设计思想,结合该模型独特的双重概率统计模式,实现了对文本中每个词"贡献度"的统计,提前处理掉干扰信息,排除垃圾数据对话题检测的影响;然后,利用该"贡献度"作为空间向量模型(VSM)改进后的参数值计算文档间相似度来提取突发话题,达到提高突发话题检测精准度的目的。提出的基于LDA模型的主题树检测方法从F值比对与人工检测两个角度进行了相关实验,实验数据显示该算法不仅可以检测到突发话题,而且获得的结果与知网模型和TF-IDF算法相比分别高出3%、7%,且更符合人的判断逻辑。(本文来源于《计算机应用》期刊2014年08期)
朱珂珂,李华,唐新怀[3](2014)在《一种基于主题树的DDS发现机制的研究与实现》一文中研究指出研究了DDS规范中的节点发现机制以及现有DDS中间件产品中不同实现机制,分析了现有的发现机制在大型分布式场景中所面临的问题,设计并实现了一种基于主题树的发布/订阅关系信息配置系统(Topic Tree Info Repo,TTIR)。通过TTIR对主题的实时过滤,有效降低了节点发现过程所需要发送的消息数量。同时,在TTIR上实现了一种分布式的主题链路锁机制,用于管理DDS系统中并行实施的发布/订阅关系变更,有效保证了系统在升级维护过程中的高可用性。(本文来源于《航天制造技术》期刊2014年03期)
胡雪娇,李慧,马国栋[4](2013)在《基于主题树的BBS论坛用户互动行为分析》一文中研究指出用户之间的互动对研究BBS论坛有着重要意义。为准确描述BBS树状论坛用户之间的互动过程,引入了主题树的概念,并根据自主定义的主题广度系数W和主题综合深度系数D等统计指标,对主题中用户的互动情况进行了详细描述。研究结果表明:主题总帖数的大小并不能全面描述主题中用户的互动情况,用户互动频繁的主题帖不一定具有较高的主题总帖数。因此,根据主题广度系数W和主题综合深度系数D对用户的互动行为进行划分,得到5种分类结果。(本文来源于《计算机科学》期刊2013年S1期)
张宗仁,杨天奇[5](2011)在《基于主题树的个性化元搜索引擎》一文中研究指出针对元搜索引擎在个性化处理上的不足,提出了主题树的方法,把用户的查询映射到主题树上并返回相关查询,比较准确地表达了不同用户的检索需求。根据用户的浏览行为提出了准确度偏差,用户满意度的评价公式,以用户为中心反映排序是否符合用户的需要。结果排序时不仅考虑了页面的标题、摘要和用户查询的相关性,也考虑了各成员搜索引擎的原来的排序信息以及关键词出现的个数和位置。实验结果表明,该方法有效地提高了元搜索引擎的结果排序能力和个性化处理能力,结果的显示顺序基本符合用户的需要。(本文来源于《计算机工程与设计》期刊2011年01期)
王森[6](2010)在《基于主题树的自上而下文本复制检测研究》一文中研究指出最近几年受社会一些不良风气的影响论文抄袭现象越来越严重,引起越来越多的人甚至是全社会的关注。为了保护知识产权、端正学术风气,并减少论文抄袭现象带来的严重后果,进行文本复制检测技术的研究变得十分必要。本文针对基于字符串匹配算法的文本块选择难题和基于词频统计算法没有充分考虑文本的语义和结构信息等问题,提出了基于主题树的自上而下文本复制检测算法。首先阐述了文本的主题树表示方式:根结点用文本的题目、作者、单位、摘要、关键词和分类号信息表示;分支结点用主题包表示,由语义聚类的方法形成主题,再由句子关系图方法抽取具有代表性的句子,从而形成主题包;叶结点用文本的所有句子表示。然后提出自上而下的主题树相似度计算方法:第一,计算根结点相似度,即比较两篇文本的根结点信息,若根结点不相似则相似度计算结束,否则继续计算下一层结点相似度;第二,计算分支结点相似度,以句子相似度为基础计算两篇文本的主题包之间的相似度,若分支结点总相似度小于阈值则相似度计算结束,否则继续计算下层结点相似度;第叁,计算叶结点相似度,即计算两篇文本所有句子的相似度,若叶结点总相似度小于阈值则认为两篇文本不存在抄袭,否则认为两篇文本之间存在抄袭。本文设计并实现了文本复制检测系统,实验中分别收集了五个不同领域的论文各200篇。然后对每个领域的论文分别进行不同级别的复制,形成论文20篇,并收集了5篇完全无关的论文,这25篇论文作为实验中的待检测论文。为了验证本文提出的新的复制检测算法的有效性,利用作者之前提出的多种复制检测算法作了3组对比实验,实验结果显示,本文提出的算法耗费的时间少、抄袭判定的区分度好、检测准确率高。(本文来源于《大连理工大学》期刊2010-11-05)
王莉敏,王金芳[7](2009)在《省媒体采访团聚焦我市》一文中研究指出本报讯 王莉敏、通讯员王金芳报道:17日,省媒体“树信心、保增长、促发展”采访团来咸,采访报道咸宁经济开发区及赤壁市政府抢抓机遇,积极应对金融危机的举措。 据介绍,此次活动由省委宣传部牵头,湖北日报、湖北卫视、楚天都市报、楚天金报、(本文来源于《咸宁日报》期刊2009-03-19)
魏敏[8](2009)在《“主题树”中采硕果——谈语文教学读写结合训练》一文中研究指出一、关于"主题树"的阐释我们现在的教材,编排十分合理,可操作性强。每个单元都有一个相关的"主题",教材中选取的主体课文、快乐读书屋、能说会写、日积月累、知识窗……的内容都紧紧围绕同一"主题"进行编排设计。我们在教学课文时,应紧紧围绕主题单元选取的文章,分析作者的写作方法、遣词造句、布局谋篇等方面(本文来源于《黑龙江教育(小学教学案例与研究)》期刊2009年03期)
杨创新,彭宏,杨沛[9](2004)在《一种基于主题树模型的Web主题检索算法》一文中研究指出面向主题的Web检索是当前的一个研究热点。而常规的关键词检索方式的主要缺点是不能准确地表达用户的查询意图。为此,文章在概念语义空间的基础上构建了一个新的主题树模型,并提出了一种基于主题树模型的主题扩展算法,可应用于主题检索;同时,提出了主题偏移度和切题度等概念,用于动态跟踪用户的检索过程以进行查询反馈。实验表明,主题树模型及相关的检索算法,能对主题检索进行有效地扩展,减少用户检索过程中产生的主题漂移,提高检索的速度和查准率。(本文来源于《计算机工程与应用》期刊2004年16期)
杨创新[10](2004)在《基于主题树模型的主题距离及其分类算法》一文中研究指出本文介绍了基于向量空间的常用距离的算法,并在概念语义空间的基础上,提出一种面向主题的距离和分类的算法。实验结果表明,该算法能有效地提高主题分类的准确度,可用于主题检索、搜索和聚类等方面。(本文来源于《广东自动化与信息工程》期刊2004年01期)
主题树论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对传统话题检测方法不能很好处理微博中用语不规范、随意性强、指代不明确以及存在大量网络用语的问题,提出了一种基于潜在狄利克雷分配(LDA)模型的主题树检测方法。首先,运用自然语言处理(NLP)中增大信息熵的方法将相关微博整理成一棵主题树,配合狄利克雷先验α与经验值β随主题数目动态变化的设计思想,结合该模型独特的双重概率统计模式,实现了对文本中每个词"贡献度"的统计,提前处理掉干扰信息,排除垃圾数据对话题检测的影响;然后,利用该"贡献度"作为空间向量模型(VSM)改进后的参数值计算文档间相似度来提取突发话题,达到提高突发话题检测精准度的目的。提出的基于LDA模型的主题树检测方法从F值比对与人工检测两个角度进行了相关实验,实验数据显示该算法不仅可以检测到突发话题,而且获得的结果与知网模型和TF-IDF算法相比分别高出3%、7%,且更符合人的判断逻辑。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
主题树论文参考文献
[1].张军丽,何保锋,马建红.基于语义主题树的搜索覆盖度层状拓展方法[J].科技通报.2015
[2].邱云飞,郭弥纶,邵良杉.基于主题树的微博突发话题检测[J].计算机应用.2014
[3].朱珂珂,李华,唐新怀.一种基于主题树的DDS发现机制的研究与实现[J].航天制造技术.2014
[4].胡雪娇,李慧,马国栋.基于主题树的BBS论坛用户互动行为分析[J].计算机科学.2013
[5].张宗仁,杨天奇.基于主题树的个性化元搜索引擎[J].计算机工程与设计.2011
[6].王森.基于主题树的自上而下文本复制检测研究[D].大连理工大学.2010
[7].王莉敏,王金芳.省媒体采访团聚焦我市[N].咸宁日报.2009
[8].魏敏.“主题树”中采硕果——谈语文教学读写结合训练[J].黑龙江教育(小学教学案例与研究).2009
[9].杨创新,彭宏,杨沛.一种基于主题树模型的Web主题检索算法[J].计算机工程与应用.2004
[10].杨创新.基于主题树模型的主题距离及其分类算法[J].广东自动化与信息工程.2004