导读:本文包含了人物简历论文开题报告文献综述及选题提纲参考文献,主要关键词:人物简历,汉维机器翻译,模板库,命名实体
人物简历论文文献综述
王路路,斯拉吉艾合麦提·如则麦麦提,艾山·吾买尔,吐尔根·依布拉音,买合木提·买买提[1](2018)在《人物简历汉维机器翻译系统的设计与实现》一文中研究指出为解决将汉语人物简历翻译成维吾尔语版本所面临的高成本、低效率等问题,设计并实现了一种基于模板与词典相结合的人物简历汉维机器翻译系统。通过分析汉语简历的句子结构特点,泛化命名实体并自动创建汉语的简历模板,然后利用正则表达式建立汉维模板库并结合基于规则与词典的方法翻译命名实体,以获取维吾尔语的人物简历。实验结果表明,该系统在单语的情况下使用有限的模板和词典,BLUE值可达到0.38,与需要大规模双语语料训练的机器翻译系统相比具有较好的实际应用价值。(本文来源于《现代电子技术》期刊2018年24期)
王路路[2](2018)在《面向人物简历的汉维机器翻译研究》一文中研究指出目前,大多数维吾尔族群众存在严重的跨语言交流障碍,随着丝绸之路经济带核心区建设的推进,研究维吾尔语文翻译信息化是促进各民族间交流交往交融的必要保障。现有的汉维机器翻译系统对于特定领域不适用,因此本文围绕人物简历信息,研究了汉语-维吾尔语机器翻译以及影响翻译质量的关键问题。简历信息主要包含命名实体,而命名实体是机器翻译常见的未登录词问题,易造成翻译质量不佳。为了获取汉维命名实体等价对,首先需要开展维吾尔文命名实体识别研究,而现有的研究主要集中在单一实体并且方法相对传统,本文开展了不同方法实现维吾尔文命名实体识别研究;然后在此基础上获取汉维命名实体翻译等价对以实现基于模板的汉维机器翻译系统。首先,为了有效利用未标注语料库中的无监督语义和结构特征,本文以条件随机场为基本框架,提出了一种基于半监督学习的维吾尔文命名实体识别方法,通过引入词法特征、词典特征、以及无督学习特征,对比不同特征对命名实体识别的影响,并对模型进行优化。实验表明,CRF模型融合多种特征时维吾尔文命名实体识别的F值达到87.43%,说明词法特征和无监督学习特征的有机结合,可以大大减少人工选取特征的工作量,同时也可提高维吾尔文命名实体识别的性能。其次,传统的方法未考虑到从字符间充分学习维吾尔语的形态信息,因此本文提出了基于注意力向量表示的维吾尔文命名实体识别方法。首先,在词向量的基础上引入使用双向LSTM获取的字符级向量;然后使用注意力机制将词向量和字符级向量进行结合来动态学习文本的特征信息;将基于注意力机制的向量作为Bi-LSTM的输入向量;最后通过CRF模型标注命名实体。实验表明,对于形态丰富的维吾尔语来说,基于注意力向量表示的Bi-LSTM-CRF模型相比于CRF模型在命名实体识别任务上性能更佳。最后,围绕人物简历信息,分析汉语的人物简历的句子结构,构建了汉维双语命名实体翻译等价对库和汉维人物简历信息的模板库,设计并实现了基于词典与模板相结合的人物简历汉维机器翻译系统。实验表明,该系统相比于依赖于大规模双语语料的机器翻译系统具有较好的实际应用价值。(本文来源于《新疆大学》期刊2018-06-30)
赵素娟[3](2010)在《基于互联网的人物简历问答系统的研究与设计》一文中研究指出自20世纪90年代以来,互联网快速渗透到人们的生活和工作中,互联网上的信息变得越来越多,越来越难于管理。如何从这些海量信息中快速准确的获取人们所需要的信息成为了一个迫切需要解决的问题。虽然现在的搜索引擎,例如百度、谷歌、雅虎等,在网上信息检索方面已经取得了很大的成功,但是这些搜索引擎是被设计用关键词组合来描述问题,这导致了用户有时不能够准确的表示自己的需求。另外,这些搜索引擎返回的是大量的与查询关键词相关的网页列表,在这些网页列表里往往只有少数信息是用户实际需要的。传统搜索引擎在这两方面的不足已经引起了信息技术研究者的重视,目前基于自然语言问答方式的搜索引擎成为了下一代搜索引擎的重要发展趋势。自动问答技术曾经是自然语言处理领域中一个名噪一时的研究热点,它综合使用了自然语言处理等许多技术。传统的问答系统的知识库一般都是基于固定的文档集合,但是现在互联网上的大量网络资源为问答系统的研究提供了一种新的良好的知识来源,网络资源一般都是自由文本。如今,开放领域问答系统的研究和开发已经有很多,其中涉及到人物、时间、地点、历史等重大事件和专业技术领域,开放领域的问答系统在逻辑上是多个受限领域问答系统的组合。因此,受限领域问答系统的理论研究和应用开发在一定程度上推动了开放领域问答系统研究的发展。本文就是针对人物简历这一受限领域问答系统的理论研究和设计,本文提出并设计了一个基于人物简历的问答系统,这是一个受限领域的问答系统。利用缩小问题的覆盖面的方法,能够达到提高系统准确性的目的。在问答系统研究中,开放领域问答系统由于涉及面广泛而很难达到较高的准确率,那么为了达到提高问答系统的准确性的目的,一个最简单的方法就是对问题的覆盖面进行限制。传统问答系统的知识库一般都是基于固定的文档集合,这有时候会不能满足用户各种各样的需求,如果能将以自由文本形式存在的丰富的网络资源和问答系统相结合,则可以解决问答系统知识瓶颈及搜索引擎返回信息过多的问题。因此基于网络的问答系统应运而生。本文的人物简历问答系统就是基于互联网的问答系统。首先,本文从问答系统的定义出发,分析了目前问答系统国内外研究的现状,明确了问答系统的发展轨迹和技术特色;其次,本文对问答系统的一般通用结构进行了分析,确定了问答系统至少要包括叁个功能模块:问题分析模块、信息检索模块、答案抽取模块;最后,本文在问答系统一般结构的基础上,对人物简历问答系统进行了结构设计和数据库设计,确立了人物简历问答系统的基本结构,并且以人物姓名的提问方式简化了问题分析模块,最终得出了人物简历问答系统中的数据流程、人物简历模板、数据表以及系统E-R模型。(本文来源于《东北财经大学》期刊2010-12-01)
秦勇[4](2010)在《做好人物报道应避免“简历式”》一文中研究指出抚顺电视台自2009年2月起,在《抚顺新闻》节目中开设了"抚顺好人"栏目。该栏目以人物为主线,讲述发生在这些平凡好人身上的新闻故事。在播发的诸多稿件中有成(本文来源于《摇篮》期刊2010年03期)
邢欣来[5](2009)在《人物简历问答系统的研究与实现》一文中研究指出当前的搜索引擎主要基于字符串匹配的方式,用户只能通过输入关键词进行搜索,这种方式不能准确获取用户所需信息,而基于自然语言问答方式的搜索引擎可以弥补前者的不足,成为下一代搜索引擎的重要发展趋势。如今,开放领域问答系统的研究已经有很多,其中涉及到人物、时间、地点、历史重要事件和专业技术等领域,并且面向这些领域的受限领域问答系统的理论研究和应用开发在一定程度上推动了开放领域问答系统研究的发展。本文针对人物简历这一受限领域问答系统的答案抽取方案开展了研究,并实现了原型系统,其主要包括一下几部分工作:首先,分析人物简历问答系统的研究现状、相关概念和实现技术,以及它的应用需求和文本特征。其次,提出了基于频繁子树挖掘的答案抽取方案。该方案通过语法分析工具将样本语料库中的答案文本转化为上下文无关语法树,并使用TreeMiner频繁子树挖掘算法,从中挖掘频繁模式生成答案模板集。通过计算候选答案的上下午无关语法树与答案模板集合中模板的匹配度,据此确定答案。然后通过对比基于频繁子树挖掘和基于频繁序列挖掘两种答案抽取方案的对比实验,证明了基于频繁子树挖掘的答案抽取方案的良好效果。随后,设计并实现了人物简历问答原型系统。设计主要包括:人物简历问答系统的数据流程设计,系统功能模块设计以及主要功能模块的相关数据结构设计。系统实现主要包括:使用HtmlParser页面解析工具对网页中人物条目及相关文本的自动抽取;使用StanfrodParser语法分析工具完成句法树的分析和TreeMiner频繁子树挖掘算法实现人物简历答案的抽取;展示该原型系统的功能界面,并分析系统的性能及其应用前景。最后,本文对研究工作进行了总结,提出了今后进一步的研究方向。(本文来源于《重庆大学》期刊2009-04-01)
郝天永,曹存根[6](2005)在《基于PADL的古代人物简历知识获取》一文中研究指出领域文本知识获取是目前人工智能中的一个关键问题。本文探讨如何从人物简介中获取人物知识。由于自然语言技术目前尚不足支持自动的知识获取,某种形式的人机交互或半自动方法是一种可行的折衷方案。本文在总结人物知识描述的特点基础上,提出了一种中间标记语言,它是自然语言到目标知识表示语言的过渡桥梁。同时,我们还介绍使用该方法在宗教古代人物知识在取中的应用。(本文来源于《计算机科学》期刊2005年03期)
郭思勉,秦永椿[7](1991)在《九名苏联新当权人物简历》一文中研究指出苏政局剧变后,当权人物变化很大。除人们熟悉的戈尔巴乔夫和叶利钦外,现将九名新当权人物的简历介绍如下:努尔苏丹·阿比谢耶维奇·纳扎尔巴耶夫现职:哈萨克共和国总统。出生时间:1940年。民族:哈萨克。家庭出身:农民。(本文来源于《和平与发展》期刊1991年04期)
人物简历论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目前,大多数维吾尔族群众存在严重的跨语言交流障碍,随着丝绸之路经济带核心区建设的推进,研究维吾尔语文翻译信息化是促进各民族间交流交往交融的必要保障。现有的汉维机器翻译系统对于特定领域不适用,因此本文围绕人物简历信息,研究了汉语-维吾尔语机器翻译以及影响翻译质量的关键问题。简历信息主要包含命名实体,而命名实体是机器翻译常见的未登录词问题,易造成翻译质量不佳。为了获取汉维命名实体等价对,首先需要开展维吾尔文命名实体识别研究,而现有的研究主要集中在单一实体并且方法相对传统,本文开展了不同方法实现维吾尔文命名实体识别研究;然后在此基础上获取汉维命名实体翻译等价对以实现基于模板的汉维机器翻译系统。首先,为了有效利用未标注语料库中的无监督语义和结构特征,本文以条件随机场为基本框架,提出了一种基于半监督学习的维吾尔文命名实体识别方法,通过引入词法特征、词典特征、以及无督学习特征,对比不同特征对命名实体识别的影响,并对模型进行优化。实验表明,CRF模型融合多种特征时维吾尔文命名实体识别的F值达到87.43%,说明词法特征和无监督学习特征的有机结合,可以大大减少人工选取特征的工作量,同时也可提高维吾尔文命名实体识别的性能。其次,传统的方法未考虑到从字符间充分学习维吾尔语的形态信息,因此本文提出了基于注意力向量表示的维吾尔文命名实体识别方法。首先,在词向量的基础上引入使用双向LSTM获取的字符级向量;然后使用注意力机制将词向量和字符级向量进行结合来动态学习文本的特征信息;将基于注意力机制的向量作为Bi-LSTM的输入向量;最后通过CRF模型标注命名实体。实验表明,对于形态丰富的维吾尔语来说,基于注意力向量表示的Bi-LSTM-CRF模型相比于CRF模型在命名实体识别任务上性能更佳。最后,围绕人物简历信息,分析汉语的人物简历的句子结构,构建了汉维双语命名实体翻译等价对库和汉维人物简历信息的模板库,设计并实现了基于词典与模板相结合的人物简历汉维机器翻译系统。实验表明,该系统相比于依赖于大规模双语语料的机器翻译系统具有较好的实际应用价值。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
人物简历论文参考文献
[1].王路路,斯拉吉艾合麦提·如则麦麦提,艾山·吾买尔,吐尔根·依布拉音,买合木提·买买提.人物简历汉维机器翻译系统的设计与实现[J].现代电子技术.2018
[2].王路路.面向人物简历的汉维机器翻译研究[D].新疆大学.2018
[3].赵素娟.基于互联网的人物简历问答系统的研究与设计[D].东北财经大学.2010
[4].秦勇.做好人物报道应避免“简历式”[J].摇篮.2010
[5].邢欣来.人物简历问答系统的研究与实现[D].重庆大学.2009
[6].郝天永,曹存根.基于PADL的古代人物简历知识获取[J].计算机科学.2005
[7].郭思勉,秦永椿.九名苏联新当权人物简历[J].和平与发展.1991