海量邮件论文-步芸

海量邮件论文-步芸

导读:本文包含了海量邮件论文开题报告文献综述及选题提纲参考文献,主要关键词:日志分析,实时处理,图数据库,ELK

海量邮件论文文献综述

步芸[1](2018)在《面向海量邮件日志的异常信息发现与挖掘》一文中研究指出电子邮件因为其方便、快捷、低成本的特点成为了人们生活中和工作中不可或缺的信息传递媒介,也因此导致垃圾邮件泛滥成灾。特别是在高校,这种问题尤其严重。杜绝垃圾邮件的传播,有效地对邮件系统进行垃圾邮件的过滤,是学校,乃至企业网络中心十分关注的核心焦点。现如今已存在许多相关研究,比如常用的贝叶斯、支持向量机过滤算法,也获得了很多成果,但是大部分都是基于邮件内容的过滤算法。在现实中,往往因为隐私问题无法获取邮件的文本内容,并且基于内容的过滤也耗费了大量的处理时间。因此,必须寻求新的方法和算法。本文以某高校的邮件系统为例,提出了一种基于ELK对邮件日志的信息处理架构,能够实时处理大量日志流数据,在现实中,高校邮件系统每天产生可达上亿数量级的邮件日志,该框架对上亿的吞吐量仍然表现良好。然后利用正则表达式进行日志分析,提取日志中实验所需的信息,如发件人、收件人、发送时间、接受时间等元素,并定义了邮件事件的概念将所得元素组合进行建模,存入图数据库。然后引入用户基本行为模式单元(简称模式单元)的概念,改进了用户行为模式挖掘算法,提取用户行为特征,通过分析快照中的特征,发现邮件信息的异常。实验证明,该方案能实现对大规模量数据的实时处理与建模存储,满足邮件系统的需求。本文的主要工作在于提供了一个新的工具组合ELK+Neo4j处理邮件日志,利用ELK实现邮件日志的实时搜索。采用正则表达式的方法提取邮件日志中零零散散的信息,将零碎的信息组合建模,提出邮件事件的概念,将事件存入图数据库Neo4j中。引入模式单元的概念,改进了用户行为模式算法来检测用户异常信息,发现垃圾邮件。(本文来源于《重庆邮电大学》期刊2018-03-28)

郭永健,郑麟,郭杰[2](2015)在《大数据时代背景下的海量电子邮件分析》一文中研究指出电子邮件证据在涉网案件侦办中的作用越来越重要。面对海量电子邮件,如何快速、有效地固定和分析邮件证据成为大数据时代海量电子邮件分析的一个焦点。通过解读大数据时代海量电子邮件分析的挑战与机遇,提出了通过邮件各元数据信息的分析与挖掘、邮件关系分析和邮件行为分析,从而准确研判邮件联系人的关系、涉案人员及涉案人员生活规律的分析思路。(本文来源于《警察技术》期刊2015年01期)

戴佳男[3](2015)在《基于MapReduce模型的海量邮件社交关系分析研究》一文中研究指出进入新世纪以来,随着Internet的高速发展,电子邮件作为Internet上的一种沟通交流方式,已经成为人们日常生活中必不可少的交流通信方式之一。电子邮件网络作为社会网络的一种,能够在一定程度上反映人们的社交关系。研究电子邮件网络拓扑模型的结构,可以为网络中消息或者病毒的传播模式以及人们的通信行为提供理论基础。然而,对于我们来说,如何快速有效地处理网络爆炸时代的海量电子邮件数据并从中挖掘分析其中蕴含的社交关系,如寻找网络中存在的用户之间的关系链以及发现网络中的朋友圈等社交关系,是一个难度不小的挑战。本文的主要研究内容如下:(1)由于电子邮件网络的复杂性,本文在充分研究复杂网络理论之后,从实际电子邮件网络出发,采用复杂网络理论处理电子邮件网络,构造了有向加权的电子邮件网络拓扑模型,并分析其拓扑特性。(2)参考复杂网络的搜索策略原理,从搜索路径的可靠性出发,提出了一种基于点权和边权(WNE)的电子邮件网络搜索策略,在兼顾搜索速度和搜索代价的基础上,找到一条可靠性高的路径。(3)提出了改进的边聚类系数社团划分(ICPECC)算法。该算法考虑电子邮件网络的社会网络特性,在社团划分之初,引入Canopy算法对网络进行初始粗糙划分,将网络划分为若干个较为紧密结合的子集,在此基础上,采用适宜社会网络分析的Radicchi社团划分算法对Canopy集合中的弱标记节点集进行处理,降低算法计算量,提高算法效率。本文提出的这种社团划分算法最终划分的结果比较适合分析社会网络的“圈子”特性,且算法的执行效率有了一定提升,同时优化后的算法流程非常适合在并行计算模型MapReduce上实现,对海量邮件数据的处理具有很高的实用价值。(4)就以上叁个方面的研究内容,在某合作单位提供的电子邮件语料集上进行实验,详细分析验证模型及算法的效果,验证其合理性和有效性。(本文来源于《南京理工大学》期刊2015-01-01)

榕江[4](2014)在《海量快递邮件 拉动卡车前行》一文中研究指出在刚刚过去的“双11”,网民享受了低价购物的狂欢。但购物狂欢之后,网民们也制造了海量的快递单件,据中国快递协会统计数据显示,“双11”全天处理的快件量将达到5.86亿件,比去年同期增长近70%。 快递业内人士介绍,“双11”首日,快递业务量尚未(本文来源于《现代物流报》期刊2014-11-21)

吴蒙[5](2014)在《海量邮件自动化分析技术的研究与应用》一文中研究指出电子邮件中蕴含的大量信息让它成为了数据挖掘和大数据分析的重要对象。利用和分析这些信息成为很多用户所关注的需求。而将原始的邮件文件高效快速的转化为邮件元数据,并构建一个拥有便于分析和利用海量邮件数据的邮件自动分析平台,就将为分析和利用好这些信息提供良好的基础。本文研究了海量邮件自动化分析涉及的关键技术、设计实现了一个海量邮件自动化分析系统。首先,针对海量内容和自动化这两大需求,在尽可能不遗漏邮件文件信息的前提下,建立邮件快速导入模块,分析并归类邮件中的元信息,尽最大可能的提升导入效率、降低数据规模、提升用户体验和保证信息的完备性,解决了在海量邮件的前提下处理邮件速度和软硬件基础利用效率的问题,为进一步开展数据挖掘和分析提供良好的数据条件。其次,通过深入用户工作实际,发现在人工分析中存在的流程特点和管理特点,实现对人工分析工作流程的集成,减少人工分析中不必要的工作和降低程序的运行开销,提升了人工分析部分的信息化程度。接下来,在邮件元数据、邮件文本信息和分析结果入库的前提下,本文实现了对上述信息的索引和检索功能,提高了在面对海量邮件信息时快速检索到感兴趣信息的能力。在此基础上,系统实现了邮件自动化分类标记的功能,整体提升了系统的自动化能力。此后,本文设计了对感兴趣的信息进行统计和导出的功能,实现了信息从分解、归类、索引、统计到再次整合的过程。最后,还针对实际工作环境中的信息管理的具体流程和需要,建立了分角色的信息管理系统,提升整个工作的信息化程度。本文对系统部署之后的工作情况做出了统计测试和对比,并对统计和对比结果反映的问题做出了分析和解释。统计和对比数据表明,系统基本实现了用户的需求并且可以服务于实际的工作。最后,本文还总结了海量邮件自动化分析系统需要改进的地方。并为海量邮件自动化分析系统将来功能的拓展和研究提出了一些自己的想法。(本文来源于《电子科技大学》期刊2014-03-24)

曾青华[6](2012)在《面向海量邮件过滤的云计算技术研究》一文中研究指出目前,全球范围内的垃圾邮件问题日益严重,不仅严重占用网络资源,威胁网络安全,更对人们的日常生活造成了严重困扰,给传统反垃圾邮件过滤技术带来了巨大挑战。云计算的出现和发展,打破固有模式,提出了新型的分布式并行编程模型和服务应用模式,为反垃圾邮件过滤课题提供了新的思路。本文选取贝叶斯邮件过滤算法作为研究对象,在深入研究了云计算在海量数据处理方面的核心技术之后,针对传统分布式贝叶斯算法实现中存在效率低、前期训练消耗资源大等缺点,对贝叶斯邮件过滤算法进行了改进,设计和实现了一种基于Hadoop开源云架构的贝叶斯邮件过滤MapReduce模型,还引入反馈学习机制,以适应垃圾邮件的不断更新与变化,提高垃圾邮件过滤的效率。实验结果表明,贝叶斯邮件过滤的MapReduce模型,在保持召回率、查准率和判对率等指标良好表现的同时,提高了过滤的执行效率。在对比不同角色的邮件过滤类型之后,本文采用位于MDA端的邮件过滤方式,并结合贝叶斯垃圾邮件安全性过滤MapReduce模型在Hadoop平台上的实现,设计出一种以邮件服务供应商为主要用户群体的SaaS云过滤服务模式。此模式包含应用业务层、云过滤层和硬件资源层,能为服务用户提供一种便捷、可订购、低成本、安全、可靠的邮件过滤功能。(本文来源于《南京航空航天大学》期刊2012-12-01)

菠萝王[7](2010)在《海量邮件,有了标签不再乱糟糟》一文中研究指出慢条斯理的人,做事都比较细心,经常会在自己记事本中,把不同的事情归类标记为不同的标签,像待办的事情、今天的事、紧急等等,这样事情做起来就会有个先后,整理也更加容易。你想过为自己电子邮件也设定这样类似的标签吗?如果生活中你就是这么一位喜欢加注标签的人,那么QQ邮箱新增的这个"邮件标签"功能你一定会喜欢。(本文来源于《电脑知识与技术(经验技巧)》期刊2010年07期)

郭绍忠,甄涛,贾琦[8](2010)在《基于存储过程的海量邮件数据挖掘》一文中研究指出现有的邮件系统缺少对海量邮件数据的分析和挖掘功能,传统的对单封邮件的分类方式效率低下。针对该问题,研究文本挖掘特点,提出一种基于海量关系型数据库存储过程实现的高效的海量邮件内容数据挖掘算法,并对算法进行多个级别的性能优化。实验结果表明,该算法具有高效性、稳定性和普适性。(本文来源于《计算机工程》期刊2010年01期)

邓辉舫,陈晓伟[9](2009)在《海量邮件分布式文件系统的设计与实现》一文中研究指出本文通过归纳分析已有的分布式系统体系结构,研究并设计了一个针对于海量邮件存储的分布式文件系统。受Google File System架构的启发,针对单个元数据服务器带来的瓶颈问题,提出了多个元数据服务器的解决方案。针对邮件写入格式的特殊性和数据源的多样性,设计并实现了多数据源的相同接口的写入支持,并对写入文件的格式进行压缩和添加sync字段,使整个系统具有更好的I/O性能以及更好的数据完整性。(本文来源于《微计算机信息》期刊2009年18期)

施兴[10](2008)在《面向海量邮件的检索系统研究与实现》一文中研究指出随着计算机的不断发展和网络的普及,电子邮件作为Internet的重要应用,以其方便、快捷的特性而深受广大网络用户的欢迎。不论是个人、企业、政府甚至包括军方等,都在通过电子邮件来进行日常生活和工作上的联系。然而,非法商家和不法分子利用电子邮件推送广告、病毒、不健康图文以及破坏国家安定团结的非法信息,对个人、企业和国家造成不同程度的安全隐患。现有的比较成熟的技术是邮件过滤,它能屏蔽一些垃圾信息,但不能阻止那些利用网络伪造的破坏国家安全的信息随处传播。如何在浩瀚的信息海洋检索到一些敏感信息,从而追踪到可疑邮件以及可疑用户成为现代信息安全的一个方向。因此迫切需要对海量邮件进行有效的管理和安全监控。针对此问题,本文分析了邮件的文档特性及其格式,提出并设计了一个面向海量邮件的检索系统。该系统能高效地检索到用户感兴趣的邮件正文,收件人发件人等信息,从而有效地解决邮件信息的监控管理。为了提高海量邮件的处理效率,本文重点研究了分布式解析,索引及查询过程。首先介绍了邮件这一特殊文档的相关理论背景,分析了邮件格式和邮件文档的向量空间模型。接着,邮件索引采用传统的倒排索引文档。同时,与普通的检索系统不同,本系统实现了增量式索引,有效节省了索引更新的时间。在系统架构上,为了快速处理海量规模邮件文档数据,本文采用了分布式处理技术。在邮件的前期处理,系统实现了相关的分布式算法,使得多节点并行运行同一任务,从而快速地完成邮件解析与索引;在查询过程中,分布式技术确保了检索的快速稳定。论文最后给出了系统的测试结果,比较了单机系统与分布式系统的解析、索引速度的差距,并得出检索时间主要与邮件规模、查询复杂度相关的结论。系统实现了海量邮件的解析、索引、查询等一系列用户操作,并把这些操作有效地和分布式并行等关键技术结合在一起。系统采用倒排索引技术来存储和组织邮件索引,利用邮件向量空间模型计算查询与文档之间的相似度,使最终返回的结果最大程度上满足用户的查询需求。同时,系统提供了统一的接口和方法,为海量邮件信息处理的应用提供了良好的计算能力和应用开发环境。(本文来源于《哈尔滨工业大学》期刊2008-07-01)

海量邮件论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

电子邮件证据在涉网案件侦办中的作用越来越重要。面对海量电子邮件,如何快速、有效地固定和分析邮件证据成为大数据时代海量电子邮件分析的一个焦点。通过解读大数据时代海量电子邮件分析的挑战与机遇,提出了通过邮件各元数据信息的分析与挖掘、邮件关系分析和邮件行为分析,从而准确研判邮件联系人的关系、涉案人员及涉案人员生活规律的分析思路。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

海量邮件论文参考文献

[1].步芸.面向海量邮件日志的异常信息发现与挖掘[D].重庆邮电大学.2018

[2].郭永健,郑麟,郭杰.大数据时代背景下的海量电子邮件分析[J].警察技术.2015

[3].戴佳男.基于MapReduce模型的海量邮件社交关系分析研究[D].南京理工大学.2015

[4].榕江.海量快递邮件拉动卡车前行[N].现代物流报.2014

[5].吴蒙.海量邮件自动化分析技术的研究与应用[D].电子科技大学.2014

[6].曾青华.面向海量邮件过滤的云计算技术研究[D].南京航空航天大学.2012

[7].菠萝王.海量邮件,有了标签不再乱糟糟[J].电脑知识与技术(经验技巧).2010

[8].郭绍忠,甄涛,贾琦.基于存储过程的海量邮件数据挖掘[J].计算机工程.2010

[9].邓辉舫,陈晓伟.海量邮件分布式文件系统的设计与实现[J].微计算机信息.2009

[10].施兴.面向海量邮件的检索系统研究与实现[D].哈尔滨工业大学.2008

标签:;  ;  ;  ;  

海量邮件论文-步芸
下载Doc文档

猜你喜欢