距离相似度论文-郑明明,林志毅

距离相似度论文-郑明明,林志毅

导读:本文包含了距离相似度论文开题报告文献综述及选题提纲参考文献,主要关键词:形状匹配,双调和距离,拉普拉斯-贝尔特拉米算子,形状相似度

距离相似度论文文献综述

郑明明,林志毅[1](2019)在《基于双调合距离的叁维形状相似度计算方法》一文中研究指出基于双调和距离的等距不变性,提出一种叁维形状的相似性度量方法。给出双调和距离、形式化表达和离散计算的定义,并对形状的双调和距离矩阵进行奇异值分解。提取双调和距离矩阵的特征值作为形状描述符,将一对形状特征值的余弦距离作为形状相似度。通过TOSCA2010数据库上的实验结果表明,与FMPS方法、SHED方法相比,该方法能够较好地兼顾时间耗费度和形状匹配度。(本文来源于《计算机工程》期刊2019年10期)

尹欢一,文志诚,马正见[2](2019)在《一种基于皮尔森相似度和距离权重的改进KNN算法》一文中研究指出KNN算法中各样本特征被视为等值权重,特征之间的关联因素没有考虑在分类算法中。为了解决此问题,提出一种基于皮尔森相似度和距离权重的改进KNN算法,根据训练样本和待分类样本计算皮尔森相似度和距离权重来判定特征和类别的相关度,且提出一种贡献率类别的判定方法。仿真结果表明,与KNN算法相比,提高了算法的分类精确度。(本文来源于《电脑知识与技术》期刊2019年27期)

马慧芳,刘文,李志欣,蔺想红[3](2019)在《融合耦合距离区分度和强类别特征的短文本相似度计算方法》一文中研究指出短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法.一方面,在整个短文本语料库中利用两个共现词之间的距离计算词项共现距离相关度,并以此来对词项加权从而捕获词项间内联和外联关系,得到短文本的耦合距离区分度相似度;另一方面,基于少量带类别标签的监督数据提取每类中强类别区分能力的特征项作为强类别特征集合,并利用词项的上下文来对强类别特征语义消歧,然后基于文本间包含相同类别的强类别特征数量来衡量文本间的相似度.最后,本文结合耦合距离区分度和强类别特征来衡量短文本的相似度.经实验证明本文提出的方法能够提高短文本相似度计算的准确率.(本文来源于《电子学报》期刊2019年06期)

徐鑫鑫[4](2019)在《基于WMD距离的文本相似度算法研究》一文中研究指出随着AI技术的迅速崛起,人工智能和随之而来的海量文本数据对自然语言处理也提出了更高的要求。文本相似度作为自然语言处理领域的一大基础任务,在搜索引擎、QA系统、机器翻译、文本分类、拼写纠错等领域有广泛的应用。文本作为承载语义信息的一种重要方式,传统的文本表示采用向量空间模型来表达语义信息,这种方式未考虑到特征词的顺序以及上下文语义理解,造成高维稀疏以及计算效率低的问题。WMD距离算法利用word2vec中的语义信息,实现高度语义共现精确度,并能挖掘出独立词之间的语义相关性。因此本文的研究工作基于WMD距离算法展开,在WMD距离算法的基础上充分挖掘文本语义中有价值的特征项以及结合知识词典中的语言学知识构架和句法依存关系,提出了两种改进算法。本文的主要工作有:1.本文基于WMD距离算法存在过于单一的词频权重无法有效提取文本特征及利用语义信息的问题,提出了WMD-JCS(Word Mover’s DistanceJoint Character and Sentence)算法。该改进算法将原始的词频权重代替为使用TF-IDF系数、词语词性以及出现的物理位置作为新的文本特征项,并将这些特征项以合理的数学计算公式加入算法中;其次将训练好的词向量以无监督方式构造句子的句向量,以充分考虑语义的上下文环境;最后将筛选出的关键词的词向量和句向量参与计算改进后的距离公式。实验表明,该改进算法与WMD距离算法相比,可以有效提高文本相似度的准确度。2.基于上述第一种改进的WMD-JCS算法,本文提出了另一种改进算法WMD-WSA(Word Mover’s Distance-Word Sense Analysis)。由于基于深度学习的计算方法的语义可解释性差以及WMD-JCS算法存在无法融合深层语义相关性信息的问题,该算法首先基于HowNet常识性知识库和句法依存关系从语言学的角度更深层次地挖掘词汇的语义信息,以此计算词语和句子间的相似度;接着将相似度转化为词句间的转移代价,对距离公式进行改进。实验表明,该算法取得了更高的准确率、召回率和F1值,进一步提升文本相似度计算精度。(本文来源于《太原理工大学》期刊2019-05-01)

吴文学,谭佳德[5](2018)在《一种新的区间直觉犹豫模糊集的距离及相似度》一文中研究指出在通过具体实例说明已有的区间直觉犹豫模糊集的距离与相似度定义仅仅只考虑区间直觉犹豫模糊数的左右端点值差异,没有考虑区间直觉犹豫模糊数的个数差异的不足后,引入区间直觉犹豫模糊集犹豫度的概念,提出一种新的区间直觉犹豫模糊集的距离及相似度定义,并理论上分析了新定义的良好性质.通过求解一个多属性决策问题的例子,对所提出的距离测量方法与已有的距离测量方法进行比较,证明了所提出的距离测量方法的合理性和有效性.(本文来源于《宜宾学院学报》期刊2018年12期)

刘文,马慧芳,脱婷,陈海波[6](2018)在《融合共现距离和区分度的短文本相似度计算方法》一文中研究指出针对短文本内容简短、特征稀疏等特点,提出一种融合共现距离和区分度的短文本相似度计算方法。一方面,该方法在整个短文本语料库中利用两个共现词之间距离计算它们的共现距离相关度。另一方面通过计算共现区分度来提高距离相关度的准确度,然后对每个文本中词项进行相关性加权,最后通过词项的权重和词项之间的共现距离相关度计算两个文本的相似度。实验结果表明,本文提出的方法能够提高短文本相似度计算的准确率。(本文来源于《计算机工程与科学》期刊2018年07期)

张建雄[7](2017)在《基于编辑距离的C代码相似度度量算法研究》一文中研究指出代码抄袭现象非常普遍,在C语言课程作业中表现尤其严重,代码抄袭检测给教师带来了繁重的工作负担,降低了教学质量。如何利用计算机自动地、准确地检测代码抄袭是亟待解决的问题。分析大量C语言课程作业源代码内部逻辑结构,提出基于结构树的代码结构比较算法,并以此为数据源对算法进行了实验验证,发现结构相似的代码之间抄袭概率较大。研究C语言初学者常用的代码抄袭方式,发现最常用的有四种:添加、删除、修改注释;改变标识符名称或者数据类型;改变函数定义位置;增加冗余代码。针对这四种常用抄袭方式,提出了四种对应的格式化算法:注释屏蔽算法;标识符格式化算法;代码分割算法;冗余代码检查算法。格式化算法主要作用是消除对应抄袭方式所带来的代码差异,方便代码相似度度量算法计算代码之间的相似度。结合基于结构树的代码结构比较算法和代码格式化算法,提出了一种基于编辑距离的C代码相似度度量算法。以C语言初学者提交的课程作业源代码为数据源。实验结果表明,基于编辑距离的C代码相似度度量算法在上述四种抄袭方式检测中具有较高的准确性。最后,在Linux环境下,采用C语言和Php语言,以基于编辑距离的C代码相似度度量算法为核心,设计并实现了一套C代码抄袭检测系统。检测结果以Json格式保存并显示在Html页面上,该系统还具有查看历史检测、查看源代码、比对代码差异功能,可用作教学辅助工具帮助教师自动检测代码抄袭。(本文来源于《华中科技大学》期刊2017-05-01)

汪军,朱建军,刘小弟[8](2017)在《兼顾形状-距离的正态云模型综合相似度测算》一文中研究指出研究了正态云模型相似度的测算方法.提出了正态云模型的形状相似度和距离相似度概念,建立了云模型综合相似度测算框架.结合云模型的数字特征,给出了形状相似度计算公式.研究了云模型距离对相似度的影响关系和数学性质,提出了基于距离的相似度测算定义,并研究了便捷的计算方法.算例说明了算法的可行性.(本文来源于《系统工程理论与实践》期刊2017年03期)

杜刚,张善文[9](2016)在《相似度距离耦合角度径向变换的图像配准算法》一文中研究指出目的为了解决当前图像配准算法因利用l1距离或l2距离相似度测量手段来完成图像特征点匹配,使其忽略了相位信息,难以有效消除高斯噪声的影响,使其配准精度与效率不佳不足的问题。方法提出最优相似度距离耦合角度径向变换的抗噪图像配准算法。首先引入角度径向变换,以降低算法复杂度,快速提取图像的特征点。然后联合图像的幅度和相位信息,基于欧式距离测度,定义最优相似度距离测量模型,通过求解其全局最小值,对特征点完成匹配,提高算法的抗噪性能。最后将图像分割为内点与外点,择取6个内点,通过计算其变换矩的几何配准误差,改进随机样本一致策略,对匹配进行提纯,消除误配。结果仿真实验结果显示,与当前基于l1距离或l2距离相似度测量的图像配准技术相比,该算法具有更强的抗高斯噪声性能和更高的匹配精度,且算法时耗最短。结论所提算法能够精确完成图像特征配准。(本文来源于《包装工程》期刊2016年19期)

邵清,叶琨[10](2016)在《基于编辑距离和相似度改进的汉字字符串匹配》一文中研究指出为解决中文字符串匹配精度较低的问题,提出了一种基于编辑距离和相似度改进的汉字字符串近似匹配算法,针对汉字字符串特点,使用汉字拼音和五笔编码计算;通过改进动态规划算法,能够有效提高编辑距离的计算准确度以及执行效率;再引入考虑交换问题的归一化算法,以语义编辑距离与长句长度的比值作为归一化结果,以此来提高近似匹配算法的准确度。实验结果表明,改进后算法计算的相似度质量要优于改进前的算法结果,且对提高算法效率和查全率、查准率和时间性能等指标均有明显改善,证明该算法的可行性和有效性。(本文来源于《电子科技》期刊2016年09期)

距离相似度论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

KNN算法中各样本特征被视为等值权重,特征之间的关联因素没有考虑在分类算法中。为了解决此问题,提出一种基于皮尔森相似度和距离权重的改进KNN算法,根据训练样本和待分类样本计算皮尔森相似度和距离权重来判定特征和类别的相关度,且提出一种贡献率类别的判定方法。仿真结果表明,与KNN算法相比,提高了算法的分类精确度。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

距离相似度论文参考文献

[1].郑明明,林志毅.基于双调合距离的叁维形状相似度计算方法[J].计算机工程.2019

[2].尹欢一,文志诚,马正见.一种基于皮尔森相似度和距离权重的改进KNN算法[J].电脑知识与技术.2019

[3].马慧芳,刘文,李志欣,蔺想红.融合耦合距离区分度和强类别特征的短文本相似度计算方法[J].电子学报.2019

[4].徐鑫鑫.基于WMD距离的文本相似度算法研究[D].太原理工大学.2019

[5].吴文学,谭佳德.一种新的区间直觉犹豫模糊集的距离及相似度[J].宜宾学院学报.2018

[6].刘文,马慧芳,脱婷,陈海波.融合共现距离和区分度的短文本相似度计算方法[J].计算机工程与科学.2018

[7].张建雄.基于编辑距离的C代码相似度度量算法研究[D].华中科技大学.2017

[8].汪军,朱建军,刘小弟.兼顾形状-距离的正态云模型综合相似度测算[J].系统工程理论与实践.2017

[9].杜刚,张善文.相似度距离耦合角度径向变换的图像配准算法[J].包装工程.2016

[10].邵清,叶琨.基于编辑距离和相似度改进的汉字字符串匹配[J].电子科技.2016

标签:;  ;  ;  ;  

距离相似度论文-郑明明,林志毅
下载Doc文档

猜你喜欢