语义集合模型论文-周尔强

语义集合模型论文-周尔强

导读:本文包含了语义集合模型论文开题报告文献综述及选题提纲参考文献,主要关键词:语义集合模型,垃圾邮件类,规则过滤,有限自动机

语义集合模型论文文献综述

周尔强[1](2008)在《基于语义集合模型及有限自动机的垃圾邮件分类研究》一文中研究指出根据中国互联网协会反垃圾邮件中心2007年反垃圾邮件调查,我国的垃圾邮件数量居全球第叁位,反垃圾邮件研究显得日益突出和重要。目前,主流反垃圾邮件方法是基于内容的过滤,该方法可分为基于规则过滤和基于统计及机器学习两种。首先,本文根据有限自动机理论对现有的规则过滤方法进行了改进,使其处理效率大幅提高。第二,由于基于统计及机器学习的方法受其所使用的向量空间模型的限制,不能利用邮件中蕴含的丰富语义信息,本文创新性的提出并实现了一种基于语义集合模型(Semantic Set Model,SSModel)的垃圾邮件分类方法,并在CCERT数据集上对该模型及分类方法进行了评估及试验分析。目前在使用规则过滤方法的反垃圾邮件系统中,规则匹配部分基本上都采用SpamAssassin(SA)的办法,即以perl正则表达式匹配为基础。但对这些系统而言,当规则集过大时,系统的性能就会大幅降低。本文将有限自动机理论应用于规则匹配,不仅解决了由于规则集过大而造成的系统性能下降问题,并且使系统不再依赖于perl解释器,从而可最大限度的将已有规则集集成到其它反垃圾邮件系统中。本文提出的基于语义集合模型的垃圾邮件分类方法有如下两大优点:第一,语义集合模型的独创性在于它以自然语言中词之间的天然联系为基础,试图将语言中所蕴含的部分语义信息保留到模型里,从而可以在以后的处理中利用该信息提高反垃圾邮件系统的准确率。第二,由于隐私保护策略,合法邮件数据集的获取是一个难题。本文在语义集合模型的基础上建立了仅依赖于垃圾邮件数据集的“垃圾邮件类”,该邮件类充分挖掘了垃圾邮件本身的特征,使其可以识别足够多的垃圾邮件,从而将合法邮件定义为它所不能识别的邮件,这与现实中合法邮件广泛的主题相吻合。这一分类方法使得垃圾邮件过滤系统的建立不再需要合法邮件样本集,据我们所知,我们的垃圾邮件过滤系统是第一个仅依赖于垃圾邮件数据集的过滤系统。本文使用垃圾邮件精确率(SP)、垃圾邮件召回率(SR)及总代价率(TCR)对基于语义集合模型的分类方法进行了评估。在CCERT 2005年7月数据集上,该方法所得的精确率为97.51%、召回率为93.34%;当参数λ为1、9时,所得的TCR分别为11.05、3.55(参数“距离”为30,“阈值”为5)。(本文来源于《电子科技大学》期刊2008-03-01)

包海挺,刘飞飞[2](2006)在《ER模型的语义概念集合和表示法》一文中研究指出ER模型能够清晰地表达现实世界的实体、联系和约束。主要从数据结构、数据操作、数据的约束条件3个方面归纳了ER模型所支持的语义概念集合,介绍了几种在应用中使用比较广泛的表示法,并对它们所支持的概念集合、图形表示法和CASE支持工具等进行了比较。(本文来源于《科技情报开发与经济》期刊2006年06期)

语义集合模型论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

ER模型能够清晰地表达现实世界的实体、联系和约束。主要从数据结构、数据操作、数据的约束条件3个方面归纳了ER模型所支持的语义概念集合,介绍了几种在应用中使用比较广泛的表示法,并对它们所支持的概念集合、图形表示法和CASE支持工具等进行了比较。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语义集合模型论文参考文献

[1].周尔强.基于语义集合模型及有限自动机的垃圾邮件分类研究[D].电子科技大学.2008

[2].包海挺,刘飞飞.ER模型的语义概念集合和表示法[J].科技情报开发与经济.2006

标签:;  ;  ;  ;  

语义集合模型论文-周尔强
下载Doc文档

猜你喜欢