导读:本文包含了主题域划分论文开题报告文献综述及选题提纲参考文献,主要关键词:主题域划分,特征提取,潜量子,显量子
主题域划分论文文献综述
王小芳[1](2009)在《文本主题域划分与无监督特征提取》一文中研究指出本文针对性地解决文本聚类中的一些相关问题,包括主题域划分和无监督特征提取。当前,文本主题域划分方法较少,现有的方法受领域知识库和非全局优化等方面的制约,在通用性及划分效果等方面有很大的局限性。本文主要建立一种新的全局最优化的,与具体应用领域无关的主题域划分模型,在模型的构造过程中着重考虑了主题域内距离、主题域间距离、主题域内夹角和主题域间夹角等要素,通过求解最优化模型得到最优的主题域划分模式。特征提取和权重计算是文本聚类中最为重要的环节.本文提出一种新的特征提取和权重计算方法。首先定义了语义量子,并依据不同类型的语义量子对表达文本主题的贡献将语义量子分为潜量子和显量子;进而借助于改进的向量空间模型进行语义显量子的结构化表达,借助改进的词序列模型对语义潜量子进行结构化表达,从而建立了一种新的基于主题概念模型的文本表示模型;最后采用显量子分布模型进行显量子权重计算,通过在有效区域内潜量子的共现模型进行潜量子权重的计算。该算法无需领域知识库,且支持后续增量式文本聚类,为文本聚类在互联网上的应用奠定基础.(本文来源于《吉林大学》期刊2009-12-01)
王小芳,王瑞芳,张树功[2](2009)在《基于最优化控制模型的文本主题域划分》一文中研究指出提出一种基于最优化控制模型的文本主题域划分方法,采用主题域内距离、主题域间距离、主题域内夹角和主题域间夹角等相关要素,构建了最优化模型的目标函数,进而通过对模型求解得到文本主题域的最优划分模式.该方法为全局最优化方法,与具体的应用领域无关,具有较高的普适性.实验结果表明,在算法适用性、F1评价和Window Diff评价上,该算法均优于其他相关算法.(本文来源于《吉林大学学报(理学版)》期刊2009年04期)
主题域划分论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
提出一种基于最优化控制模型的文本主题域划分方法,采用主题域内距离、主题域间距离、主题域内夹角和主题域间夹角等相关要素,构建了最优化模型的目标函数,进而通过对模型求解得到文本主题域的最优划分模式.该方法为全局最优化方法,与具体的应用领域无关,具有较高的普适性.实验结果表明,在算法适用性、F1评价和Window Diff评价上,该算法均优于其他相关算法.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
主题域划分论文参考文献
[1].王小芳.文本主题域划分与无监督特征提取[D].吉林大学.2009
[2].王小芳,王瑞芳,张树功.基于最优化控制模型的文本主题域划分[J].吉林大学学报(理学版).2009