导读:本文包含了自然语言数字水印论文开题报告文献综述及选题提纲参考文献,主要关键词:数字水印,篇章层,扩展频谱,命名实体
自然语言数字水印论文文献综述
刘玉玲,辛国江[1](2010)在《篇章层自然语言数字水印方法》一文中研究指出通过引入扩展频谱技术对水印信息进行编码,提出一种篇章层的自然语言数字水印方法。抽取文本中所有命名实体构成一个向量空间,根据密钥选择一个子空间用于嵌入信息,通过指代消解技术修改子空间内命名实体的个数实现信息嵌入。通过比较最终提取的信息向量与原始水印信息所生成的向量判断是否嵌入了水印信息。实验结果表明该算法具有较好的鲁棒性,能抵抗一些常见的主动攻击。(本文来源于《计算机工程》期刊2010年12期)
邱志龙[2](2009)在《基于自然语言处理的文本数字水印技术研究》一文中研究指出随着网络技术的飞速发展以及信息化进程的迅速推进,数字媒体已成为成为当今社会一种重要信息媒介。互联网的便捷性和数字媒体复制的低成本,在促进数字产品的在现实中应用迅速发展的同时,也带来了一系列挑战。其中,数字信息传播的不可控性使得数字媒体的版权保护问题变得倍受关注,而数字水印技术正是解决这一问题的有效技术手段之一。在众多的数字媒体信息中,文本信息的传播和应用都是最广泛的,文本内容更有价值,却更容易复制,所以针对文本数字水印的研究变得更加急迫。目前,针对文本水印大部分的研究是基于文本格式的,最典型的研究是字移、行移和特征编码等,而此类水印算法的鲁棒性较差,且无法在无格式文本中实现水印。本文针对文本信息版权保护的需求,提出了基于词性标注序列的文本水印算法和改进的语法水印算法,能够很好解决基于格式水印出现的问题,鲁棒性、隐蔽性以及容量方面都很具有很好的性能,并且结合这两种文本水印算法的特点,实现适用版权保护的多重水印技术。本文首先提出了一种基于词性标注序列的文本水印算法,通过分词和词性标注技术将文本内容映射为词性标注序列,利用Huffman编码,将水印信息的产生和解码转化为文本内容与词性标注序列的关系,该算法是一种零水印算法,改变了传统数字水印必须改变载体内容的工作方式,与传统方法相比具有更好的隐蔽性和更广泛的适应性。然后,本文针对M.J. Atallah教授的提出语法水印算法容量较小的问题,通过加入介词短语与分词短语和从句的之间的转化,以及随机组合等方式丰富语法转换方法,引入可嵌入集合和不可嵌入集合,利用语法结构变换将水印信息分段嵌入,进而改进了Atallah教授提出的语法水印算法。本算法最大限度地利用文本中可以进行语法转化的句子,实现语法水印的最大容量嵌入,并具有较强的鲁棒性。实验表明该算法和原有的语法水印算法相比,水印嵌入容量平均提高58.2%,有很大程度的提高。在最后,本文基于课题在课题中前面的两种文本水印算法,提出基于多重水印技术的版权保护方案,进而针对MS Word文档实现版权保护系统,这对于网络图书馆和电子出版的应用都有着非常深远的意义。(本文来源于《哈尔滨工业大学》期刊2009-06-01)
余振山[3](2009)在《自然语言文本中数字水印的设计与研究》一文中研究指出自然语言是人类相互交流中最主要、最准确、最高效的方式。随着数字时代的来临,人们每天都会接触大量的电子文档、网络新闻、论坛、博客等,自然语言数字文本已经成为新的交流层面上最重要的载体,如何保护其版权是亟待解决的问题。数字水印是数字文件版权保护的重要手段。对于数字水印的研究首先在多媒体载体的领域展开,在图像、音视频方面都出现了针对人类视觉特点或者听觉特点的水印算法。由于这几种媒体的处理手法相近,冗余度也较高,研究不断深入。近年来逆向的对水印算法的检测等攻击分析也逐渐得到重视。数字水印是数字文件版权保护的重要手段。对于数字水印的研究首先在多媒体载体的领域展开,在图像、音视频方面都出现了针对人类视觉特点或者听觉特点的水印算法,由于这几种媒体的处理手法相近,冗余度也较高,研究不断深入。逆向的对水印算法的检测等攻击分析也逐渐得到重视。反观文本方面,存在处理手段特殊、冗余度低、自然语言规则复杂、计算语言学受限等困难,文本数字水印的研究起步晚,成果也较少。但是因为文本既常见又重要,所以近年来投身文本水印领域的研究者逐渐增加,从排版类到语法语义类都出现了新颖的水印算法,同时文本水印算法的检测分析工作也已起步。不过总体来说,文本数字水印领域还未出现足够实用的方案,水印算法的检测分析成果凤毛麟角,整体上缺乏系统的理论基础。有鉴于此,本文的研究工作及取得的相应成果主要包括:1.自然语言文本中数字水印模型的研究。建立了适合文本的通讯模型,根据密码学基础的方法定义了水印的不可检测性、程序敌手、人类敌手、不可见攻击、鲁棒性等概念,构造了用交互证明系统验证水印算法安全性的方法,并将其应用于对实际水印系统的评价。2.自然语言文本中数字水印的设计。提出并实现一种新的文本数字水印算法——宋词水印。这是一种附加型生成文本水印,算法由水印信息直接生成一段宋词,这段宋词在字数、行数、句子形式、格律和韵脚等方面符合某个词牌,具有很强的迷惑性。将生成的宋词附加于载体文本中,验证时提取这段宋词,对照词典即可还原出水印信息。由于生成的宋词具有较高的迷惑性,所以水印具有良好的隐蔽性。实验结果表明水印信息与生成文本的大小比值达到16%,因此本方法也可作为一种高嵌入率的文本隐写算法。据我们所知,这是第一个利用特殊体裁的文本水印算法。3.自然语言文本中数字水印的检测研究。针对排版类的Snow水印设计检测算法,并指出检测一般性排版类水印算法的思路。针对语义类的基于同义词替换的水印,设计利用上下文信息的检测算法,通过考量关键词是否是同义词集合中最适合上下文的词语,判断该点是否被嵌入信息,整篇文章的关键词的考量结果导致文本是否带有水印信息的判断。同一同义词集合的词语对同样的上下文比较合适度时,我们用IDF系数调整常用词和冷僻词之间的差距。实验表明检测算法对于T-Lex同义词水印系统达到了90.0%的准确率、86.6%的精度和82.5%的召回率。针对基于翻译的水印系统,我们也设计了检测的方法。4.提出将整个互联网作为语料库的思想。如果将每个包含自然语言文本的网页视作语料库中的一篇文档,那么整个互联网就可视为一个超大规模的、按影响力有序的、实时更新的语料库。配合搜索引擎等工具,人们可以从中提取自然语言使用习惯等传统语料库因规模受限、成本过高等原因无法有效提供的信息。(本文来源于《中国科学技术大学》期刊2009-05-02)
杨超,李仁发,蒋斌,雷衍凤[4](2005)在《基于语义的自然语言文本数字水印研究》一文中研究指出数字水印技术是信息隐藏技术研究领域的重要分支,也是当今网络信息安全和数字媒体版权保护研究的重要手段之一。目前数字水印技术的研究主要集中在静止图像和视频的保护等方面,文本数字水印研究较少。针对自然语言文本自身的特性,分析和比较了目前主要的文本数字水印方法及其技术特点,提出了文本数字水印的理论目标和攻击模型,给出了一种基于语义的文本数字水印算法,最后展望了文本数字水印技术研究的发展前景。(本文来源于《计算机工程与设计》期刊2005年06期)
自然语言数字水印论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着网络技术的飞速发展以及信息化进程的迅速推进,数字媒体已成为成为当今社会一种重要信息媒介。互联网的便捷性和数字媒体复制的低成本,在促进数字产品的在现实中应用迅速发展的同时,也带来了一系列挑战。其中,数字信息传播的不可控性使得数字媒体的版权保护问题变得倍受关注,而数字水印技术正是解决这一问题的有效技术手段之一。在众多的数字媒体信息中,文本信息的传播和应用都是最广泛的,文本内容更有价值,却更容易复制,所以针对文本数字水印的研究变得更加急迫。目前,针对文本水印大部分的研究是基于文本格式的,最典型的研究是字移、行移和特征编码等,而此类水印算法的鲁棒性较差,且无法在无格式文本中实现水印。本文针对文本信息版权保护的需求,提出了基于词性标注序列的文本水印算法和改进的语法水印算法,能够很好解决基于格式水印出现的问题,鲁棒性、隐蔽性以及容量方面都很具有很好的性能,并且结合这两种文本水印算法的特点,实现适用版权保护的多重水印技术。本文首先提出了一种基于词性标注序列的文本水印算法,通过分词和词性标注技术将文本内容映射为词性标注序列,利用Huffman编码,将水印信息的产生和解码转化为文本内容与词性标注序列的关系,该算法是一种零水印算法,改变了传统数字水印必须改变载体内容的工作方式,与传统方法相比具有更好的隐蔽性和更广泛的适应性。然后,本文针对M.J. Atallah教授的提出语法水印算法容量较小的问题,通过加入介词短语与分词短语和从句的之间的转化,以及随机组合等方式丰富语法转换方法,引入可嵌入集合和不可嵌入集合,利用语法结构变换将水印信息分段嵌入,进而改进了Atallah教授提出的语法水印算法。本算法最大限度地利用文本中可以进行语法转化的句子,实现语法水印的最大容量嵌入,并具有较强的鲁棒性。实验表明该算法和原有的语法水印算法相比,水印嵌入容量平均提高58.2%,有很大程度的提高。在最后,本文基于课题在课题中前面的两种文本水印算法,提出基于多重水印技术的版权保护方案,进而针对MS Word文档实现版权保护系统,这对于网络图书馆和电子出版的应用都有着非常深远的意义。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
自然语言数字水印论文参考文献
[1].刘玉玲,辛国江.篇章层自然语言数字水印方法[J].计算机工程.2010
[2].邱志龙.基于自然语言处理的文本数字水印技术研究[D].哈尔滨工业大学.2009
[3].余振山.自然语言文本中数字水印的设计与研究[D].中国科学技术大学.2009
[4].杨超,李仁发,蒋斌,雷衍凤.基于语义的自然语言文本数字水印研究[J].计算机工程与设计.2005