导读:本文包含了语义体论文开题报告文献综述及选题提纲参考文献,主要关键词:语义体,词语相似度,语义距离,文本聚类
语义体论文文献综述
王鹏[1](2012)在《基于语义体与文本聚类的中文垃圾邮件过滤方法研究》一文中研究指出随着互联网的迅猛发展,电子邮件已逐渐成为人们日常生活中不可缺少的通信方式之一。与此同时,垃圾邮件作为电子邮件的错误衍生品,也发展迅速。尤其是近几年电子商务和移动互联的迅猛发展,促使基于文本形式的企业邮件和手机邮件的增多。另外,中文的语言复杂度远大于英文,导致对中文垃圾邮件的处理不能照搬外国的方法。目前,文本垃圾邮件过滤的主流方法仍然是基于内容的垃圾邮件过滤技术,但大多数方法都是一些基于关键字的与语义无关的垃圾邮件过滤方法,如:贝叶斯方法、基于案例的方法和文本分类方法等,此类方法对垃圾邮件内容所表达的思想缺乏精准的描述。现在新型的文本垃圾邮件利用同义词、近义词等手段,伪装成正常邮件,使传统的方法难以把垃圾邮件和正常邮件进行区分。因此,论文在语义相似度的基础上,利用《知网》在语义分析方面的优势,提出一种基于语义体和文本聚类算法相结合的新型中文文本垃圾邮件过滤方法。本文的研究主要有以下两方面:1.从具有同义词或近义词的新型中文文本垃圾邮件中提取特征。本文对邮件文本进行分词、去除停用词后,对余下的词语集合进行词义消歧,得到每个词语在邮件中的唯一词义,便于邮件特征的提取;将词语集合中的每个词语作为一条词汇链,并将词义相同或相似的词汇链合并为一条词汇链,利用TFIDF方法从每条词汇链中选取唯一的词语作为该词汇链代表;最后,提取规定个数的词语作为该邮件的特征,即语义体。经仿真实验表明:该方法提取的邮件特征更加准确。2.针对得到的垃圾邮件的语义体,本文采用基于语义距离的文本聚类算法进行垃圾邮件过滤。该方法利用基于《知网》的文本相似度对邮件集合进行第一次文本聚类,为了避免邮件输入顺序对聚类结果的影响,对经过整理的第一次聚类结果进行第二次文本聚类,使得最终得到的聚类结果更加准确,利用得到的聚类结果完成对垃圾邮件的过滤。通过实验验证,本文方法对具有同义词或近义词的新型垃圾邮件有很好的过滤效果:论文所提方法与传统的邮件过滤方法相比,在对邮件内容的判断中更具客观性,对内容表意不明的垃圾邮件,其方法在邮件识别的召回率方面体现了较大的优势。(本文来源于《兰州理工大学》期刊2012-04-25)
尚新[2](2011)在《论英汉语法体对语义体的运算及其句法层级选择性》一文中研究指出语义体具有合成性和内在时间结构特征,语法体的运算功能是对语义体的内在时间阶段做择取和突显。语义体的合成具有句法层级特征,英汉语遵循相同的合成层级顺序。英汉完整体标记均对语义体的结尾阶段做择取和突显,非完整体标记均对持续阶段做择取和突显,但同类体标记存在运算值域上的差异。在语法体运算的句法层级方面,英语为单层级运算语言,汉语为多层级运算语言。该差异表明英汉语在时体运算方面有着不同的概念结构。(本文来源于《解放军外国语学院学报》期刊2011年06期)
杨慧娟[3](2011)在《基于语义体与模糊聚类的中文垃圾邮件过滤方法研究》一文中研究指出目前,基于内容的垃圾邮件过滤方法主要采用统计分析法,此类方法对垃圾邮件内容所表达的思想缺乏精准的定量描述,研究垃圾邮件内容所表达思想的描述形式对垃圾邮件的准确识别有着十分重要的意义。邮件正文部分是一封邮件的主体,其内容是通过大量语义元(即词的语义)所形成的语义体反映出来的,所以在邮件过滤中研究语义体的信息是最权威、最有效的。因此,论文在句子相似度的基础上,利用《知网》在语义元分析中的优势,对邮件正文中包含的语义体进行分析,提出了一种语义体构建的方法及语义体间相似度的计算方法。由于自然语言的复杂性,以及在描述和理解方面具有高度的不确定性和模糊性,因而基于内容的邮件过滤的识别带有一定的模糊性,对这些具有模糊性的模式借助于模糊理论来刻画显得很自然,论文采用模糊聚类方法来解决,并将语义体与此进行结合,提出了一种基于语义体的模糊聚类方法。该方法与传统方法的不同之处在于在分类时将语义体作为分类对象,将语义体之间的相似度作为构建模糊相似矩阵的相关系数,此方式大大降低了模糊聚类方法在处理文本分类问题时的维度。最后,将基于语义体的模糊聚类方法应用到垃圾邮件过滤中。经仿真实验证明:论文所提方法与传统的邮件过滤方法相比,在对邮件内容的判断中更具客观性,对内容表意不明的垃圾邮件,其方法在邮件识别的召回率方面体现了较大的优势。(本文来源于《兰州理工大学》期刊2011-05-28)
尚新[4](2010)在《语法体对语义体运算的语义阶段及句法层级:英汉语对比分析(英文)》一文中研究指出There has been much disscussion on the unviersality and typological issues of tense and Aspect in world languages since Vendler (1957). The purpose of the present paper is to explore interaction between grammatical and semantic Aspects, with a perspective of contrast between English and Chinese. Though researchers (Olsen 1997; Bybee, et al 1994) have elaborated on the operator function of grammatical Aspect on semantic Aspect, it is little known as to how systematically the operation function can be realized, and how different languages, such as Chinese and English, are typologically varied in terms of this interaction.(本文来源于《中国英汉语比较研究会第九次全国学术会议暨国际英汉比较与翻译研讨会论文集》期刊2010-11-05)
于善志[5](2008)在《轻动词结构形式及其语义体转变》一文中研究指出本文讨论了英语轻动词结构的形式及其语义体之间的关系。轻动词结构的语义体既要受其自身结构义的制约,又要受其结构内外成分的语法义及词汇义的影响。"LV+a+NP"中的名词如果具有"有界"含义且被一个表时间点的状语修饰时,LVC表达的就是一个凸显的典型语义完成体。LVC结构中的名词如果在语境中改变其"有界"特征或语法形式,或被一个表示一段时间的介词短语修饰,轻动词结构的语义完成体也会发生改变。LVC结构语义体从典型的完成体到进行体的转变是轻动词结构中变异力量相互作用的结果。(本文来源于《现代外语》期刊2008年03期)
语义体论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
语义体具有合成性和内在时间结构特征,语法体的运算功能是对语义体的内在时间阶段做择取和突显。语义体的合成具有句法层级特征,英汉语遵循相同的合成层级顺序。英汉完整体标记均对语义体的结尾阶段做择取和突显,非完整体标记均对持续阶段做择取和突显,但同类体标记存在运算值域上的差异。在语法体运算的句法层级方面,英语为单层级运算语言,汉语为多层级运算语言。该差异表明英汉语在时体运算方面有着不同的概念结构。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语义体论文参考文献
[1].王鹏.基于语义体与文本聚类的中文垃圾邮件过滤方法研究[D].兰州理工大学.2012
[2].尚新.论英汉语法体对语义体的运算及其句法层级选择性[J].解放军外国语学院学报.2011
[3].杨慧娟.基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D].兰州理工大学.2011
[4].尚新.语法体对语义体运算的语义阶段及句法层级:英汉语对比分析(英文)[C].中国英汉语比较研究会第九次全国学术会议暨国际英汉比较与翻译研讨会论文集.2010
[5].于善志.轻动词结构形式及其语义体转变[J].现代外语.2008