导读:本文包含了规范词论文开题报告文献综述及选题提纲参考文献,主要关键词:文本规范化,问答社区,信息抽取
规范词论文文献综述
田天[1](2018)在《基于问答社区的网络非规范词规范化技术研究》一文中研究指出互联网文本中存在着大量的非规范词,这些非规范词既包含用户无意识产生的输入错误,也包含用户出于幽默、规避审查等目的而使用的一些约定俗成的网络新词。正是这些非规范词的存在使得传统NLP工具在处理互联网文本时性能较低,因此在预处理阶段,把非规范词替换为对应的规范词是提升下游NLP任务性能的重要手段。本文主要研究非规范词的规范化任务,即给定一个非规范词寻找与其相对应的规范词。主要创新点和研究成果如下:(一)提出了基于网络知识库的词规范化技术框架,并对其中的关键问题进行研究。过去的工作主要将中文词规范化视作一个拼写修正的问题,从音似、词法的角度进行研究,对新出现的非规范词产生机制如音译、同义替换等难以进行有效建模。本文从知识抽取的角度对词规范化任务进行研究,首先从网络知识库中获取解释非规范词词义的句子,进而利用语义理解及分类的方法从中抽取出目标规范化词,完成词规范化。本文以问答社区为网络知识库,对所提出的技术方案进行了有效性验证。(二)研究了从问答社区用户答案中抽取目标规范词的问题,并从句子语义角度出发设计和实现了基于LSTM的目标规范词抽取算法。从问答社区中获取到解释给定非规范词词义的用户答案后,问题便转变为如何从用户答案中准确地抽取出目标规范词。本文从句子语义角度出发,提出若干基于LSTM的抽取模型,包括预测目标词起止位置的抽取模型和词块编码的排序模型,同时实现了传统的模式匹配模型,并通过实验对比了不同模型性能的差异。(叁)从非规范词的产生机制出发,设计和实现了基于词对内在关联特征的候选规范词判断方法。目前仅依靠语义理解,难以获得高质量的非规范词-规范词对,因此本文又对词对本身的关联变化特点进行建模,对抽取出的有噪声的非规范词-规范词对做进一步的分类过滤。本文针对不同的变化关系设计相应的拼音、字形等特征,通过实验对比了多种分类器在本任务上的性能,取得了良好的分类效果。(本文来源于《北京邮电大学》期刊2018-01-16)
魏治勋,陈磊[2](2014)在《法律规范词的语义与法律的规范性指向——以“不得”语词的考察为例》一文中研究指出规范法学向来重视对法律语词的意义分析,这其中又以对法律规范词的分析尤显重要,因为规范词往往通过对行为模态的设定而决定着法律规范的意义。通过界定"不得"的主要禁止性规范词的地位、辨析其音义以及将规范词"不得"与作为体标记的"不得"的严格区分,规范词"不得"的准确意义较为清晰地呈现出来,这对我们更好地理解法律的规范性指向并将法治建设推向深化颇有助益。(本文来源于《理论探索》期刊2014年03期)
张晖[3](2013)在《关于建立面向应用的规范词异名库的若干理论探讨》一文中研究指出收集整理规范术语的异名,用于开发面向应用的术语纠错工具,可使规范科技术语的宣传与推广工作达到事半功倍的效果。规范词异名是指与国家审定公布的规范科技术语"正名"表达相同概念,但词形不同的非推荐名。规范词异名的认定需经过收词和审词两个阶段。收词方法包括人工收集和自动抽取。通过规则和统计并举的自然语言处理技术进行自动抽取,可以有学科领域关联、英文术语一词多译关联、语义网络关联叁种路径。规范词异名的人工收集和审词重在确保语义等价。(本文来源于《中国科技术语》期刊2013年04期)
崔山佳[4](2013)在《“幽夐”等应是规范词》一文中研究指出一有这样的一段话;只有观察生活的眼光敏锐而又幽夐,加工生活的头脑清醒而又明达,才能做到准确、深刻地反映现实生活。对于上面的"幽夐"一词,郭良夫(1990:79)认为"幽夐"不规范:"其所以造出像‘幽夐’这样的词来,原因在于作者的根据不是语言,而是与语言脱节的纸面上的文字。"我们对此表示不同看法。说"幽夐"比较生僻,一般的读者难以理解,这是符合实际的,(本文来源于《汉字文化》期刊2013年04期)
尹延安[5](2012)在《汉语立法文本中禁止性规范词分析及英译》一文中研究指出基于立法文本中禁止性规范词的法理、语言功能的分析,以英语立法文本中禁止性规范词使用为参照,归纳总结了汉语立法文本中禁止性规范词的具体表达形式及其英译方式。(本文来源于《西南农业大学学报(社会科学版)》期刊2012年12期)
尹延安[6](2012)在《汉语立法文本中禁止性规范词分析及英译》一文中研究指出基于汉语立法文本中禁止性规范词的法理、语言功能分析,结合英语立法文本中的禁止性规范词表达特点,归纳、分析了汉语立法文本中禁止性规范词的具体表达形式及英译。(本文来源于《叁峡论坛(叁峡文学.理论版)》期刊2012年06期)
关怡楠[7](2012)在《法律文本中“应当”、“可以”等规范词研究——以《中华人民共和国行政强制法》为例》一文中研究指出本文以《中华人民共和国行政强制法》(以下简称为《行政强制法》)作为切入点,以实证分析的方法,通过研究《行政强制法》中"应当"、"可以"、"不得"、"有权"等关键词,来理清这几个词在立法文本中的涵义及其关系,使得我们能更好的在立法、执法与司法的层面上来理解我国法律当中的这些关键词,并进而提高我们立法、执法与司法的科学性。(本文来源于《商》期刊2012年19期)
徐庆勇[8](2011)在《中国法律中的“禁止性规范词”研究》一文中研究指出“一切法律规范都必须以作为‘法律语句’的语句形式表达出来,可以说语言之外不存在法律。只有通过语言,才能表述、记载、解释和发展法”。1“法律语言作为法律的载体,它是表述法律内容的语言。语言和法律之间是形式和内容之间的关系。法律内容决定其语言形式,一定的语言形式为表述一定的法律内容服务”。2从这一法哲学的逻辑起点出发,我们可以说,禁止性规范是禁止性规范表述语句表达的意义,禁止性规范表述语句是禁止性规范内容的表述形式。在中国法律语言词汇体系中,除了法律专业术语外,还存在一个法律常用词体系,禁止性规范词是这个体系中的一种。禁止性规范词粘连其他语词并组合形成了禁止性规范表述语句。禁止性规范词是组成禁止性规范表述语句用来对禁止性规范的行为模式做出直接限制的必不可少的语词。本文研究的目标就是从法律语言学的视角切入,用计算机语料库与统计量化的方法,梳理我国法律文本中的禁止性规范词使用现状、归纳总结使用规律、发现存在的问题并提出修改建议,从而为我国修法时代的立法语言规范化服务。全文包括绪论,第一章语料库与研究方法,第二章禁止性规范词的界定、确定与分类,第叁章禁止性规范词在语料库中的分布现状,第四章禁止性规范词在法律中的使用与立法建议,结论以及附录。绪论部分,首先对本文的研究缘起进行了介绍,引入并确定本文的研究对象“禁止性规范词”。然后在前人研究的基础上寻找理论上的支撑,并发现进一步研究的命题、科学研究方法,以考察禁止性规范词在法律文本中的运用现状及规律。最后,阐释了本文的研究进路与研究意义。第一章语料库与研究方法,是本文的研究亮点之一,也是本文耗费精力最多和下工夫最大的地方。语料的确定是本文研究对象提取的科学基础。本文将法律语料提取的范围确定在1949年10月1日至2011年1月1日全国人大及其常委会通过的237部法律,并建立一个未分词标注的计算机法律语料库和一个已分词标注的计算机法律语料库。本文将运用计算机语料库研究法、统计量化分析研究法、图表研究法、描述性研究法、交叉研究法(法学与语言学相结合研究法),来对237部法律中的禁止性规范词从宏观(总体使用频率与分布情况)与微观(具体在法律文本中的运用)两个层面进行研究。第二章禁止性规范词的界定、确定与分类,首先介绍禁止性法律规范的概念,并将禁止性规范词的内涵界定为:在禁止性法律规范中对法律规范承受者的行为模式起直接限制作用的词语,也就是在禁止性法律规范中放在行为动词前面并粘连其他词语组合形成禁止性法律规范表述语句来表述禁止性法律规范意义的词语;其次明确禁止性规范词的外延:将禁止性规范词的范围划定在了直接对行为模式做出禁止性规定的规范词,将那些通过规定否定性法律后果来间接威慑行为的惩罚性表述形式排除在外。禁止性规范词的确定,是在主要文献所论及的禁止性规范词基础上,通过计算机编程提取与人工核对方法,尽量科学客观穷尽性地从237部法律中选出的,共计15个。最后,分别按构词、规范语句的主语类型,对所选出的禁止性规范词进行了分类。第叁章禁止性规范词的在语料库中的分布现状,则主要考察15个禁止性规范词在237部法律中的词频统计与分布情况。本章中所需词频并不能简单地在法律语料库中利用计算机词频检索软件得出,还需通过在计算机词频统计的基础上进行人工核对,以剔除那些不是放在行为动词前用来直接对行为禁止的使用频率,即剔除那些“形”似而“神”不似的使用频率,最终统计得到15个禁止性词语作为禁止性规范词的使用频率:不得(2226)、禁止(576)、不受(176)、无权(29)、不能(23)、严禁(18)、不准(15)、不允许(4)、不应当(5)、不可(3)、不容(2)、不要(2)、不应(1)不许(1)、绝不允许(1)。本章将237部法律分为七大法律部门,并用图表对这七大法律部门中禁止性规范词的具体分布情况进行直观展示,最后在图表后,对频率不低于10次禁止性规范词的具体分布以及15个禁止性规范词在237部七大部门法的总体分布,予以适当地描述。第四章禁止性规范词在法律中的使用与立法建议,是本文的重要部分。本章首先将15个禁止性规范词按照词频进行分组,然后对高、中频禁止性规范词在法律文本中的运用进行考察:禁止性规范词在运用中不存在问题的,则基本上按照“现代汉语语义—法律意义—具体运用规律—词语辨析—惯用表达式”的路径进行阐述;禁止性规范词在运用中存在问题的,则基本上按照“现代汉语语义—法律意义—具体运用现状—存在的问题—修改建议”的路径进行阐述。最后对“低频禁止性规范词在法律文本中运用”予以考察,按照“现代汉语语义—法律意义—特殊运用法律语境—低频词的可替代性”的路径进行阐述。本章旨在摸清具体运用现状、归纳总结具体运用规律,发现存在的问题、提出立法修改建议。结论分两个层面进行。第一个层面是对运用现状和运用规律的总结:首先尽量科学客观穷尽性地选出了中国法律文本中15个禁止性规范词,将禁止性规范词分成了3类;然后按照词频由高到低排序,明晰了哪些禁止性规范词的使用频率高、哪些禁止性规范词的使用频率低、哪些法律偏好用哪些禁止性规范词;并总结出同类型禁止性规范词的禁止性强弱;最后汇总了所提取的禁止性规范词的惯用表达式。第二个层面总结性的提出了几条关于禁止性规范词运用的立法修改建议,将目前的15个禁止性规范词减少至11个。我国的立法应当保持立法语言的单义性与表述的统一性,应当通过规范立法技术,如借鉴《美国统一和标准法案起草规则》,制定《立法语言统一表述标准》,来形成立法表述上的统一与稳定,以提高我国立法的水平与质量。(本文来源于《中国政法大学》期刊2011-03-01)
张福有[9](2010)在《规范词谱传承《纪辽东》》一文中研究指出经拙斋考证,词的源头是隋炀帝的《纪辽东》二首:一辽东海北翦长鲸,风云万里清。方当销锋散马牛,旋师宴镐京。前歌后舞振军威,饮至解戎衣。判不徒行万里去,空道五原归。二秉旄仗节定辽东,俘馘变夷风。清歌凯捷丸都水,归宴洛阳宫。策功行赏不淹留,全军藉智谋。讵似南宫复道上,先封雍齿侯。(本文来源于《中华诗词》期刊2010年08期)
[10](2008)在《科技论文基本撰写规范—规范词与不规范词》一文中研究指出(本文来源于《中国公共卫生》期刊2008年10期)
规范词论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
规范法学向来重视对法律语词的意义分析,这其中又以对法律规范词的分析尤显重要,因为规范词往往通过对行为模态的设定而决定着法律规范的意义。通过界定"不得"的主要禁止性规范词的地位、辨析其音义以及将规范词"不得"与作为体标记的"不得"的严格区分,规范词"不得"的准确意义较为清晰地呈现出来,这对我们更好地理解法律的规范性指向并将法治建设推向深化颇有助益。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
规范词论文参考文献
[1].田天.基于问答社区的网络非规范词规范化技术研究[D].北京邮电大学.2018
[2].魏治勋,陈磊.法律规范词的语义与法律的规范性指向——以“不得”语词的考察为例[J].理论探索.2014
[3].张晖.关于建立面向应用的规范词异名库的若干理论探讨[J].中国科技术语.2013
[4].崔山佳.“幽夐”等应是规范词[J].汉字文化.2013
[5].尹延安.汉语立法文本中禁止性规范词分析及英译[J].西南农业大学学报(社会科学版).2012
[6].尹延安.汉语立法文本中禁止性规范词分析及英译[J].叁峡论坛(叁峡文学.理论版).2012
[7].关怡楠.法律文本中“应当”、“可以”等规范词研究——以《中华人民共和国行政强制法》为例[J].商.2012
[8].徐庆勇.中国法律中的“禁止性规范词”研究[D].中国政法大学.2011
[9].张福有.规范词谱传承《纪辽东》[J].中华诗词.2010
[10]..科技论文基本撰写规范—规范词与不规范词[J].中国公共卫生.2008