导读:本文包含了距离度量学习论文开题报告文献综述及选题提纲参考文献,主要关键词:距离度量学习,机器学习,距离矩阵,马氏距离
距离度量学习论文文献综述
许小媛,黄黎[1](2019)在《距离度量学习算法的精确性研究》一文中研究指出距离度量学习是机器学习领域较为活跃的研究课题之一,文中利用UCI(加州大学欧文分校)数据库的数据对度量学习算法进行比较研究。为了寻找一种可靠的没有明确定义标志的算法,选择四种算法在UCI的六个数据集上对距离矩阵进行比较。每个样本数据集的性质(尺寸和维度)是不同的,因此算法的结果也不同。编码相似度算法在大多数情况下表现良好。在未来的实际应用领域,对于提高无标记数据和相似集的距离度量学习算法的精确性提供了研究基础。(本文来源于《现代电子技术》期刊2019年21期)
韦忠亮,张顺香,梁兴柱,许光宇[2](2019)在《基于深度学习和距离度量的行人再识别研究》一文中研究指出行人再识别研究的内容是从一个视角选取目标行人,在非重迭视角的大量数据集中,识别出相同的行人。客观存在的多种因素会对识别的匹配率造成影响,研究内容是在雾霾天气下的行人再识别问题。针对雾霾天气会对所获取的图像产生诸如特征提取困难等问题,先利用基于深度学习的去雾算法进行图片预处理,然后使用局部最大特征出现算法以及距离度量学习的算法对图像进行特征提取和距离计算。在改进的VIPeR数据集上进行实验,结果表明,该方法提升行人再识别的匹配率。(本文来源于《阜阳师范学院学报(自然科学版)》期刊2019年02期)
王旭初,翟随强,牛彦敏,葛永新[3](2019)在《结合候选区域距离度量学习与CNN分类回归联合的左心室检测》一文中研究指出心脏MRI左心室自动检测在心脏疾病计算机辅助诊断中具有重要价值,针对左心室候选区域与周边组织分布复杂而导致区分度低的问题,提出结合候选区域2级距离度量学习与CNN分类回归联合学习的左心室检测方法.在候选区域生成阶段,利用超像素产生初始区域并合并为中间区域,设计有监督的2级距离度量学习算法,融合中间区域来构建目标候选区域;在检测阶段,以CNN分类与回归联合学习的方式定位候选区域,并设计难例样本挖掘策略对模型进行微调,以缓解样本不均衡问题.将该方法与扩展的4种变体方法(改变或舍弃部分模块)在公开心脏图谱数据集(CAP)上进行了实验,结果表明该方法中各模块设置具有合理性;与FastR-CNN和基于SSAE方法的检测结果相比,该方法取得了较高的检测精度.(本文来源于《计算机辅助设计与图形学学报》期刊2019年03期)
文俊浩,戴大文,余俊良,高旻,张宜浩[4](2018)在《融合矩阵分解与距离度量学习的社会化推荐算法》一文中研究指出为解决传统推荐系统中存在的冷启动难题,基于距离反映偏好的假设提出了一种融合矩阵分解与距离度量学习的社会化推荐算法。该算法同时对样本和距离度量进行训练,在满足距离约束的前提下更新距离度量和用户与项目的坐标,并将用户与项目嵌入到统一的低维空间,利用用户与项目之间的距离生成推荐结果。基于豆瓣和Epinions数据集的对比实验结果验证了该方法可有效提高推荐系统的可解释性和精确度,明显优于基于矩阵分解的推荐方法。研究结果表明,所提方法缓解了传统推荐系统中存在的冷启动问题,为推荐系统的研究提供了另一种可供参考的研究思路。(本文来源于《计算机科学》期刊2018年10期)
张婷,高颖,王东,吕炎,董军宇[5](2018)在《基于距离度量学习的棉花品级分类方法研究》一文中研究指出由于人工定级的方法存在如效率低、主观性强等诸多弊端,本文提出了1种经济有效的棉花品级分类方法。使用主成分分析法对数据集进行预处理,从而降低特征向量的维度;使用大边界k近邻算法学习得到1个马氏距离度量矩阵,从而实现对棉花图像的分析、特征提取等操作,使用距离度量学习、机器学习的技术来模拟人类的视觉感知;训练k近邻分类器,从而实现棉花品级的自动分类。通过试验证明了本文提出的方法可以有效现实棉花品级分类。(本文来源于《中国棉花》期刊2018年08期)
仰迪,白延琴,李倩[6](2018)在《半监督距离度量学习的内蕴加速投影梯度算法》一文中研究指出考虑求解一类半监督距离度量学习问题.由于样本集(数据库)的规模与复杂性的激增,在考虑距离度量学习问题时,必须考虑学习来的距离度量矩阵具有稀疏性的特点.因此,在现有的距离度量学习模型中,增加了学习矩阵的稀疏约束.为了便于模型求解,稀疏约束应用了Frobenius范数约束.进一步,通过罚函数方法将Frobenius范数约束罚到目标函数,使得具有稀疏约束的模型转化成无约束优化问题.为了求解问题,提出了正定矩阵群上加速投影梯度算法,克服了矩阵群上不能直接进行线性组合的困难,并分析了算法的收敛性.最后通过UCI数据库的分类问题的例子,进行了数值实验,数值实验的结果说明了学习矩阵的稀疏性以及加速投影梯度算法的有效性.(本文来源于《运筹学学报》期刊2018年02期)
倪壮[7](2018)在《基于距离度量学习的医疗数据挖掘研究与应用》一文中研究指出随着医疗可穿戴设备等智能科技设备地涌现和普及,医疗健康数据爆发性增长,人类不断重视自身的健康,从更智能化的角度关注自己的身体状况,却又不可避免被重大疾病所困扰。人工智能和大数据技术在医疗健康领域研究蓬勃发展,为海量健康数据的充分使用提供了新的思路和方法,更为人类享受更好的医疗健康服务和免受疾病困扰提供无限可能。癌症、心血管疾病等不仅对人类身体带来伤害,更是给心理蒙上沉重的阴影,故借助数据挖掘技术进行疾病早期诊断预防是十分必要的。因此,本文将基于医疗健康体检数据,提出基于余弦度量和大边界近邻度量LMNN算法的局部簇距离度量学习COS-SUBLMNN算法,提高分类器精度,并构造疾病早期筛查和高危人群识别模型,融合患者的诊断反馈,最终实现疾病诊断系统的设计。论文主要研究距离度量学习算法、癌症早期筛查模型、模型优化评估和疾病风险诊断系统。首先,融合余弦度量和LMNN提出能够改善分类器性能的COS-SUBLMNN算法。接着提出适用于医疗健康体检数据的预处理和特征选择方案。然后,以癌症早期筛查为应用场景,LMNN建立模型,并与传统数据挖掘算法对比,选择合适评价指标验证距离度量学习算法的优势性。最后,本文以COS-SUBLMNN距离度量学习算法为核心,根据模型效果反馈不断优化算法性能,最终实现疾病风险诊断系统,并以癌症和心血管疾病加以验证。论文设计并完成了基于距离度量学习算法的疾病风险诊断系统和验证了改进算法COS-SUBLMNN性能的优势性。验证了包含距离度量思想的支持向量机和距离度量学习算法LMNN对癌症的预测比RF和ANN表现更好。与KNN和LMNN算法对比,本文提出的COS-SUBLMNN算法在癌症和心血管疾病诊断中效果更好,实现了利用距离度量学习算法对重大疾病诊断和患病高危人群识别的目的。本文研究成果在医疗健康数据挖掘领域具有现实意义。(本文来源于《北京邮电大学》期刊2018-03-14)
王冬[8](2018)在《标号噪声下鲁棒的距离度量学习及其应用研究》一文中研究指出距离度量学习(度量学习),是最常用的机器学习算法之一,它广泛应用于对象识别,人脸验证和图像检索等问题。常用的度量学习算法通常是学习一个映射函数将数据投影到一个新的度量空间,使其具有某些希望的性质,如:希望属于同类或语义相关性较强的图像在新的度量空间中距离更接近,而不同类及语义相关性较弱的图像之间相互远离。尽管度量学习在大量应用问题上取得了成功,但是现有工作大多基于“数据标号干净”这一假设展开。然而在现实场景特别是使用互联网获取数据时,会遇到很多标注错误的数据。当数据中包含一定量标号噪声时,度量学习通常会受到严重影响:首先是训练难度增加,优化过程需要更多步迭代甚至难以收敛。其次,它会误导训练过程,使得非同类样本被拉近,而同类样本被拉远,最终导致模型精度严重下降。本文工作聚焦于设计鲁棒于标号噪声的度量学习,以解决现实的应用问题;具体地,本文的主要贡献和创新点总结如下:(1)针对标号带噪数据提出了一种有效的数据预处理方法,包括一种无监督的特征提取网络C-SVDDNet和一种基于神经网络的标号去噪算法LDAE。(2)提出了一种基于隐变量的鲁棒于标号噪声的度量学习,在建模中将带噪标号当作观测变量,而将数据的真实标号当作隐变量;同时提出了一种基于EM算法的参数估计方法,将估计隐变量与估计模型参数交替进行。在真实标号已知时模型参数与观测标号条件独立,这样能够有效地降低标号噪声对度量学习的影响。(3)提出了一种新的基于变分贝叶斯的鲁棒度量学习—贝叶斯NCA,它是传统的NCA模型在贝叶斯框架下的扩展。本方法在建模中使用图结构的似然函数,这比以往的基于样本对约束的度量学习能够更好的利用数据的结构信息;同时为了提高优化效率,本方法中还提出了一种定曲率的变分下界,能够大大降低训练复杂度。(4)提出了贝叶斯大间隔度量学习—贝叶斯LMNN,它是传统LMNN模型在贝叶斯框架下的扩展,同时在优化中使用了随机变分法进行参数估计。更重要的是,我们能够从理论上证明此方法对于标号噪声的鲁棒性、泛化性误差和样本复杂度。与标准LMNN模型相比,本方法在理论上能够较小的受到标号噪声的影响同时具有更小的泛化性误差。(本文来源于《南京航空航天大学》期刊2018-01-01)
张福星[9](2017)在《基于距离度量学习算法用于行人再识别的研究》一文中研究指出随着监控设备成本的降低,视频监控系统在许多领域都得到了大量的应用。通过人工的方式对海量的监控图像进行观察和处理的工作变得越来越繁重,因此计算机视觉技术应运而生,通过计算机对监控图像进行处理从而取代人工的方式,使得人们的工作效率得到极大的提升。其中,行人再识别是计算机视觉领域里一个非常重要的技术。行人再识别指的是在非重迭视域多摄像机监控系统中,匹配不同监控画面中的目标行人。该技术为公安提供有用的线索、帮助寻找在公共场所跟家人分开走丢的小孩、非重迭多摄像机系统中的行人跟踪等智能监控领域都有着广泛的应用。但是在不同的监控摄像头下,行人图像受到光照、视角和行人姿态等变化的影响,在视觉上容易形成很大的外观差异,使得行人再识别问题遇到了很大的挑战。在面对这些挑战,如何去建立一个特有的,健壮的代表特征来描述在各种变化环境下的行人外观,以及如何去得到一个有效的距离度量学习算法。本文针对基于距离度量学习的行人再识别问题进行了研究与讨论,主要研究成果包括以下几个方面:(1)针对当前的行人再识别在度量学习上采用马氏距离相似度函数,而该相似度函数的计算过程只跟特征差分空间有关,而一对行人图像中每个独立个体的外观特征没有得到重视。本文提出了通过学习一个双向关系相似度函数(Bidirectional Relationship Similarity Function,BRSF),来计算一对行人图像的相似度。BRSF不但描述了一对行人图像特征的互相关关系,而且还关联了一对行人图像特征的自相关关系。本文利用KISSME(Keep It Simple And Straightforward Metric)算法的思想进行相似度函数学习,把一对样本图像特征的自相关关系和互相关关系用高斯分布来表示,通过把最终高斯分布的比值转换为BRSF的形式,得到一个对背景、视角、姿势的变化具有鲁棒性的相似度函数。实验结果表明,本文算法与已存在的行人再识别算法相比较,行人再识别率得到了显着的提升。(2)针对行人图像受光照、视角和行人姿态等的变化影响,以及行人图像特征在原始特征空间的线性不可分,这样学习得到度量矩阵,进而得到表示样本之间相似度函数不能准确地表示样本之间的相似性和差异性,从而导致识别效果较差。本文提出了一种在核空间学习稠密水平条带特征的行人再识别算法。算法首先通过自顶向下的滑动水平条带提取每个水平条带的颜色特征和纹理特征,然后融合行人图像的多种特征,映射到核空间,最后在核空间里学习得到一个对背景、视角、姿势的变化具有鲁棒性的相似度函数,通过比较相似度来对行人进行再识别。实验结果表明,本文算法与已有的行人再识别算法相比,得到更具有区分性的行人图像特征和更有效的相似度函数,行人再识别率得到了显着的提升。(本文来源于《浙江理工大学》期刊2017-12-20)
唐川[10](2017)在《距离度量学习在多示例多标记学习中的应用研究》一文中研究指出多示例多标记学习(MIMLL,Multi-Instance Multi-Label Learning)是机器学习的一个重要分支。MIML学习框架中,一个样本由多个示例即特征向量表示,并同时与多个标记相关联。因为自身的结构复杂和多语义特性,图像和文本的分类和近邻搜索问题可以归结为MIML学习问题。传统的MIML算法使用豪斯多夫距离(Hausdorff distance)来度量样本在特征空间的距离,无法反映出样本间的语义相关性。而距离度量学习通过利用样本的标记信息来优化样本间距离,达到距离度量的语义一致。本文在MIML学习架构下,通过距离度量学习优化样本的分类和搜索算法,主要贡献如下:提出了一种基于聚类策略的MIML距离度量学习算法,该算法在学习过程中引入了聚类思想与标记相关性,在简化了距离度量学习复杂度的同时探索了标记与示例之间的关系;设计了一种联合距离度量学习和k-最近邻技术的MIML分类算法,利用学习得到的距离度量计算样本近邻充分考虑了语义一致性,提高了分类算法的性能;设计了一种联合距离度量学习和锚图哈希(AGH,Anchor Graph Hashing)技术的MIML哈希算法,利用学习得到的距离度量构建样本与锚点的邻接矩阵,充分考虑语义一致性,提高了哈希算法性能;实验验证了本文提出的分类及哈希算法的有效性。(本文来源于《南京邮电大学》期刊2017-10-26)
距离度量学习论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
行人再识别研究的内容是从一个视角选取目标行人,在非重迭视角的大量数据集中,识别出相同的行人。客观存在的多种因素会对识别的匹配率造成影响,研究内容是在雾霾天气下的行人再识别问题。针对雾霾天气会对所获取的图像产生诸如特征提取困难等问题,先利用基于深度学习的去雾算法进行图片预处理,然后使用局部最大特征出现算法以及距离度量学习的算法对图像进行特征提取和距离计算。在改进的VIPeR数据集上进行实验,结果表明,该方法提升行人再识别的匹配率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
距离度量学习论文参考文献
[1].许小媛,黄黎.距离度量学习算法的精确性研究[J].现代电子技术.2019
[2].韦忠亮,张顺香,梁兴柱,许光宇.基于深度学习和距离度量的行人再识别研究[J].阜阳师范学院学报(自然科学版).2019
[3].王旭初,翟随强,牛彦敏,葛永新.结合候选区域距离度量学习与CNN分类回归联合的左心室检测[J].计算机辅助设计与图形学学报.2019
[4].文俊浩,戴大文,余俊良,高旻,张宜浩.融合矩阵分解与距离度量学习的社会化推荐算法[J].计算机科学.2018
[5].张婷,高颖,王东,吕炎,董军宇.基于距离度量学习的棉花品级分类方法研究[J].中国棉花.2018
[6].仰迪,白延琴,李倩.半监督距离度量学习的内蕴加速投影梯度算法[J].运筹学学报.2018
[7].倪壮.基于距离度量学习的医疗数据挖掘研究与应用[D].北京邮电大学.2018
[8].王冬.标号噪声下鲁棒的距离度量学习及其应用研究[D].南京航空航天大学.2018
[9].张福星.基于距离度量学习算法用于行人再识别的研究[D].浙江理工大学.2017
[10].唐川.距离度量学习在多示例多标记学习中的应用研究[D].南京邮电大学.2017