导读:本文包含了语言相似度论文开题报告文献综述及选题提纲参考文献,主要关键词:资源贫乏型语言,文本相似度,双语向量空间映射,多级框架
语言相似度论文文献综述
刘一丁,陈晓琳,尹晓阳,刘功申[1](2019)在《资源贫乏型语言间文本相似度计算方法》一文中研究指出文本相似度计算是自然语言处理领域的研究热点和难点。自2013年"一带一路"倡议提出以来,我国急需小语种国家和地区的商业情报信息。选取中文和藏文进行比较,并采用基于多级双语向量空间映射技术的文本相似度算法计算藏汉文本相似度。首先,对文本进行预处理,并对中文文本和藏文文本进行分词;然后,利用多级双语向量空间映射框架,将藏文词向量和中文词向量映射到同一抽象的语义空间下,词间相似度则由映射后的词向量计算得出;最后,计算得出基于词间相似度的文本相似度。利用已训练完毕的汉藏词向量得到最佳多级框架,再选择6个类别的中文和藏文新闻作为试验数据,配以映射后的汉藏词向量计算汉藏文本相似度。试验结果表明,该方法可通过相似度结果有效区分同类别和异类别新闻。(本文来源于《指挥信息系统与技术》期刊2019年04期)
康世泽,吉立新,刘树新,丁悦航[2](2019)在《一种基于实体描述和知识向量相似度的跨语言实体对齐模型》一文中研究指出跨语言实体对齐旨在找到不同语言知识图谱中指向现实世界同一事物的实体.传统的跨语言实体对齐方法通常仅依靠知识图谱内部的结构信息,但实际上一些知识图谱提供的实体描述信息也可以被利用.本文提出了一种结合知识图谱的内部结构和实体描述信息共同进行跨语言实体对齐的模型.该模型首先通过训练基于知识图谱结构信息的知识向量找到可能被对齐的实体对,再结合实体描述信息利用改进后的共享参数模型选出最终的对齐实体,最后通过迭代对齐的方法重复前两个步骤找到更多的对齐实体直到训练结束.实验结果表明,与基准算法相比,本文所提模型在跨语言实体对齐任务上可以取得相对不错的结果.(本文来源于《电子学报》期刊2019年09期)
蔡梦月,孙鲁云[3](2019)在《语言相似度对中国对外直接投资的影响》一文中研究指出语言是推动"一带一路"建设的重要依托。研究基于中国与"一带一路"沿线62个国家的面板数据,运用扩展的引力模型,考察了语言相似度对中国对外直接投资的影响。研究表明,语言因素是影响中国对"一带一路"沿线国家直接投资的重要因素。语言相似度对中国对外直接投资存在着显着的正向影响,但这种正向影响在逐年减弱。此外,语言相似度对中国对外直接投资的影响还存在显着的门槛效应。当语言相似度低于门槛值0.05时,语言因素对中国OFDI的作用不显着,当语言相似度跨过门槛值0.05之后,语言因素的作用变得显着。(本文来源于《现代语文》期刊2019年06期)
徐聪,潘小东[4](2019)在《基于正态云相似度的语言型多属性群决策方法》一文中研究指出在分析已有正态云模型相似性度量的不足的基础上,综合考虑正态云的形状相似度和位置相似度,提出了一种新的正态云相似性度量方法,并对其性质进行了证明。与已有方法相比,该方法具有很强的区分性。将提出的正态云相似性度量方法应用于语言型多属性群决策中,首先依据正态分布规律将语言变量转化为正态云;其次通过云加权算术平均算子CWAA实现信息集结;最后依据VIKOR排序方法,计算方案属性与最优云、最差云的综合相似度,以实现方案排序。通过算例分析了所提方法的可行性和有效性。(本文来源于《计算机科学》期刊2019年06期)
李霞,刘承标,章友豪,蒋盛益[5](2019)在《基于局部和全局语义融合的跨语言句子语义相似度计算模型》一文中研究指出跨语言句子语义相似度计算旨在计算不同语言句子之间的语义相似程度。近年来,前人提出了基于神经网络的跨语言句子语义相似度模型,这些模型多数使用卷积神经网络来捕获文本的局部语义信息,缺少对句子中远距离单词之间语义相关信息的获取。该文提出一种融合门控卷积神经网络和自注意力机制的神经网络结构,用于获取跨语言文本句子中的局部和全局语义相关关系,从而得到文本的综合语义表示。在SemEval-2017多个数据集上的实验结果表明,该文提出的模型能够从多个方面捕捉句子间的语义相似性,结果优于基准方法中基于纯神经网络的模型方法。(本文来源于《中文信息学报》期刊2019年06期)
范建平,刘胜男,吴美琴[6](2019)在《基于VIKOR和加权相似度的单值中智语言多属性决策方法》一文中研究指出由于在不精确环境下仅考虑方案与正理想解的距离造成信息不能被完全利用,同时考虑正理想解和负理想解对方案的影响,文章提出相对VIKOR方法,旨在通过相对群体效用及相对个体遗憾确定一个相对最佳妥协解。同时通过求解最大化相对群体效用的条件约束问题确定权重值。提出单值中智语言加权cosine相似度公式,根据方案与相对最佳妥协解的相似度确定一组全排序。最后以企业对主导设计的选择问题为例验证了方法的可行性。(本文来源于《统计与决策》期刊2019年09期)
曹仪铭,崔慧,车璐,邹丽[7](2019)在《一种基于模糊语言概念格的相似度推理》一文中研究指出针对具有模糊语言值不确定性信息的决策问题,提出一种基于模糊语言概念格的相似度推理方法.在模糊语言决策形式背景下,给出语言模糊集之间的相似度以及加权相似度,讨论其相关性质,构建模糊语言概念格,得到在模糊语言决策形式背景下的规则集,建立模糊语言概念格相似度推理应用模型.通过疾病诊断实例说明该方法的有效性和实用性.(本文来源于《通化师范学院学报》期刊2019年04期)
左权[8](2018)在《基于深度学习的跨语言相似度评估技术研究》一文中研究指出传统的跨语言相似度评估技术大都依赖语言学和语用学的相关理论,这也与“自然语言”天然的特征有着必然的联系。近年来,深度学习技术的兴起不断推动图像识别、语音识别和自然语言处理等多个人工智能研究领域的发展。对此,本文研究了将深度学习技术应用到中英文跨语言文本相似度计算领域,主要包括词语层级的研究和句子层级的研究。词语层级的研究是将词语作为文本单元,进行词向量表示学习和双语词嵌入模型的构建。通过该模型可以生成双语共享的词嵌入表示,利用词与词之间的空间距离来度量它们之间的语义相似度。基于词向量相关理论和Skip-Gram模型,本文首先在人工构造的伪双语语料上进行词向量训练。其次,为了尽可能使生成的词嵌入空间完备,本文还使用单语语料作为补充以学习额外的词嵌入知识。此外,以双语词嵌入模型为基础,本文还尝试将词性信息、文本的主题信息和文本的TF-IDF信息分别与双语词表示相结合构建了叁种算法,这叁种算法均可用于跨语言文本相似度计算。通过这种组合可以克服原有的方法在文本语义表征方面的缺陷。句子层级的研究是将句子作为文本单元,通过将词语的语义信息和每个词的上下文信息融合起来,将整个句子表征为一个向量进行跨语言文本相似度的计算。对此,本文提出了句子层级的跨语言相似度评估框架SCLSE。该框架是以词嵌入作为底层向量表示,通过融合多种神经网络结构用于句子的语义表示学习,最后输出句子的相似度得分。本文还通过将短文本分割成段落,将段落看作长句子作为序列输入,实现了更大规模上的相似度迭代计算。就上述两个研究点,本文分别设置了不同的对比实验,用于验证在不同的文本单元粒度下,双语词嵌入模型和SCLSE框架在跨语言文本相似度评估任务上的有效性及应用价值。(本文来源于《哈尔滨工程大学》期刊2018-06-01)
田俊峰[9](2018)在《多语言文本语义相似度的计算及其应用研究》一文中研究指出文本语义相似度(Semantic Textual Similarity,STS)用于衡量自然语言文本间语义的相似程度,是自然语言理解的基础,并且被广泛应用于其他自然语言处理任务中,如问答系统中的相似问题检索、翻译系统的质量评估等。目前,文本语义相似度的研究存在以下两个问题:(1)研究方法主要使用特征工程结合机器学习算法来构建模型,特征的设计和抽取依赖专家领域知识,模型的性能还不够高;(2)研究对象集中在英语文本,对于缺乏标注数据的低资源语言,一般首先将其翻译成资源丰富语言如英语,但是由于误差传播,翻译系统产生的错误会传播并影响文本语义相似度的评估。针对以上问题,本文对多语言文本语义相似度的计算进行研究并且将其应用在论证推理任务中,研究内容包括:1.多语言文本语义相似度的计算为了提升传统方法的性能,本文结合深度学习方法构建集成模型,并且结合翻译系统在多种语言上进行评估。这部分工作应用在2017年SemEval竞赛(国际语义评测竞赛)的多语言文本语义相似度任务中并取得了第一名的成绩,相关论文发表在2017年SemEval会议上。2.低资源语言文本语义相似度的计算为了解除低资源语言对翻译系统的依赖,同时充分利用资源丰富语言的标注数据,本文提出深度多任务学习模型,通过同时学习低资源语言和资源丰富语言的任务来辅助低资源语言文本语义相似度得到良好的特征表示。这部分工作发表在2018年ECIR会议上。3.语义匹配在论证推理中的应用前面两个工作对文本语义相似度的计算进行了研究,第叁个研究工作将文本语义相似度的核心语义匹配应用在论证推理任务中。为了匹配给定的前提结论和候选论据,本文提出基于注意力机制的神经网络模型。这部分工作应用在2018年SemEval竞赛的论证推理任务中并取得第叁名的成绩,相关论文发表在2018年SemEval会议上。为了验证以上模型的有效性,本文进行了大量的定量和定性实验。实验结果表明,本文提出的集成计算模型和深度多任务学习模型能够有效评估多语言和低资源语言的语义相似度。此外,语义匹配在论证推理中取得了良好的应用。(本文来源于《华东师范大学》期刊2018-04-01)
崔晓松,王颖,孟佳,邹丽[10](2018)在《基于语言值相似度推理的网络商家自评价方法》一文中研究指出为更合理的表示不确定性知识,在格蕴涵代数的基础上,运用不同程度的语气词表达一个模糊命题的真值程度,建立一个基于2n元语言值格值一阶逻辑的知识表示模型。定义语言值相似度,提出语言值格值一阶逻辑中的语言值相似度推理方法。建立一个网络商家自评价系统,并以实例表明该方法能够表达和处理该自评价系统中的不确定性知识,有效帮助网络店主进行自我评价。(本文来源于《山东大学学报(工学版)》期刊2018年01期)
语言相似度论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
跨语言实体对齐旨在找到不同语言知识图谱中指向现实世界同一事物的实体.传统的跨语言实体对齐方法通常仅依靠知识图谱内部的结构信息,但实际上一些知识图谱提供的实体描述信息也可以被利用.本文提出了一种结合知识图谱的内部结构和实体描述信息共同进行跨语言实体对齐的模型.该模型首先通过训练基于知识图谱结构信息的知识向量找到可能被对齐的实体对,再结合实体描述信息利用改进后的共享参数模型选出最终的对齐实体,最后通过迭代对齐的方法重复前两个步骤找到更多的对齐实体直到训练结束.实验结果表明,与基准算法相比,本文所提模型在跨语言实体对齐任务上可以取得相对不错的结果.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语言相似度论文参考文献
[1].刘一丁,陈晓琳,尹晓阳,刘功申.资源贫乏型语言间文本相似度计算方法[J].指挥信息系统与技术.2019
[2].康世泽,吉立新,刘树新,丁悦航.一种基于实体描述和知识向量相似度的跨语言实体对齐模型[J].电子学报.2019
[3].蔡梦月,孙鲁云.语言相似度对中国对外直接投资的影响[J].现代语文.2019
[4].徐聪,潘小东.基于正态云相似度的语言型多属性群决策方法[J].计算机科学.2019
[5].李霞,刘承标,章友豪,蒋盛益.基于局部和全局语义融合的跨语言句子语义相似度计算模型[J].中文信息学报.2019
[6].范建平,刘胜男,吴美琴.基于VIKOR和加权相似度的单值中智语言多属性决策方法[J].统计与决策.2019
[7].曹仪铭,崔慧,车璐,邹丽.一种基于模糊语言概念格的相似度推理[J].通化师范学院学报.2019
[8].左权.基于深度学习的跨语言相似度评估技术研究[D].哈尔滨工程大学.2018
[9].田俊峰.多语言文本语义相似度的计算及其应用研究[D].华东师范大学.2018
[10].崔晓松,王颖,孟佳,邹丽.基于语言值相似度推理的网络商家自评价方法[J].山东大学学报(工学版).2018