导读:本文包含了样本匹配论文开题报告文献综述及选题提纲参考文献,主要关键词:抽样系统,近似查询处理,分层抽样,优化问题
样本匹配论文文献综述
邬志罡,荆一楠,何震瀛,王晓阳[1](2019)在《基于用户查询与样本间匹配度评估的分层抽样策略》一文中研究指出在数据探索性分析场景下,用户倾向于借助抽样系统获取近似查询结果来换取更快的查询速度。现有的抽样系统通常假设用户的历史查询记录能很好地表征未来的查询情况,从而针对特定的查询特征生成特定的抽样策略。然而,在现实场景中,用户探索意图变化丰富,用户查询特征的稳定性假设通常无法得到保证。为解决上述问题,提出一种评估任意用户查询与样本间匹配度的方法。离线训练生成多份样本集,并在应对具体查询时自动选取最匹配样本集进行近似结果计算。离线样本集的生成是以在所有可能的用户查询上的预期匹配度损失总和最小作为训练目标。实验结果表明,在真实数据集上,该抽样系统与现有方法相比,将近似结果的精确度提高了26.3%。(本文来源于《计算机应用与软件》期刊2019年08期)
应夏洋,翁原驰,王伟绅,秦凯,许志伟[2](2019)在《机器人辅助胰腺手术治疗胰头实性假乳头瘤的可行性分析:单中心样本的倾向性评分匹配研究》一文中研究指出目的评估应用机器人辅助胰腺手术治疗胰头部实性假乳头瘤(solid pseudopapillary tumor,SPT)的可行性和价值。方法回顾性分析89例胰头SPT患者的手术及随访资料,其中48例使用开放手术治疗,41例采用机器人辅助胰腺手术治疗。收集两组患者的临床资料,采用倾向评分匹配(propensity score matching,PSM)对2种方法的中长期疗效进行比较和分析。结果 89例患者中,55例采取胰十二指肠切除术,24例采取保留十二指肠的胰腺切除术,10例为胰腺肿块剜除术。不论何种术式,与开放手术比较,机器人辅助手术的术中出血量减少,围手术期恢复更快,且术后住院天数更短(均P <0. 05)。两种手术方式的术后胰瘘发生率、其他并发症发生率以及患者治疗费用方面比较,差异均无统计学意义(均P> 0. 05)。结论机器人辅助胰腺手术治疗胰头SPT是一种安全、有效的手术方式,可以减少术中出血量及输血需求,加速患者围手术期康复,且并不增加胰瘘或其他主要并发症的发生率。(本文来源于《实用肿瘤杂志》期刊2019年04期)
杨晓妹,刘文龙[3](2019)在《财政R&D补贴、税收优惠激励制造业企业实质性创新了吗?——基于倾向得分匹配及样本分位数回归的研究》一文中研究指出财政R&D补贴和税收优惠对创新异质性企业的影响效应,还需从分层角度进行细化和深入研究。基于中国制造业企业样本数据,采用倾向得分匹配及分位数回归分析方法,分别从整体、产权性质和创新分层叁个维度系统评估财政R&D补贴、税收优惠对制造业企业实质性创新的影响。结果表明,财政R&D补贴和税收优惠总体上促进了我国制造业企业的实质性创新活动,但两者的作用效果存在差异,财政R&D补贴的激励效果明显优于税收优惠政策;与国有企业相比,非国有企业实质性创新行为对财政R&D补贴和税收优惠的刺激反馈更加灵敏,而基于制度安排的国有企业与政府政治联系紧密,弱化了财税政策效果,国有企业更偏向于"寻扶持"的策略性创新;从分层视角来看,具有"排他性"的财政R&D补贴对创新异质性企业的影响呈"单调递增"趋势,激励效果十分明显,而税收优惠的作用却呈"单调递减"趋势,激励效果明显弱于财政R&D补贴。(本文来源于《产经评论》期刊2019年03期)
钱勇[4](2019)在《基于知识的战场数据样本标签匹配方法研究》一文中研究指出多军种的协同作战已成为了当今信息化作战的主要形式,面对复杂的作战体系,指挥员全面准确地理解战场态势是做出正确决策的基础,在态势评估工作中占据重要的地位。战场数据样本标签作为战场样本数据的提炼与概括,承载了战场样本数据的重要信息。因此,对战场数据样本标签匹配工作的研究在战场态势认知领域起到了愈发重要的作用。本文为实现标签匹配的目标,建立了一种战场数据样本标签框架,并赋予战场数据样本标签数值化定义,采用梯度提升树(GBDT)算法实现了战场数据样本的标签匹配。本文首先介绍了国内外学者在标签匹配和态势认知领域的主要工作和目前本体领域的研究进展,并阐述了机器学习中回归算法的基本原理和理论。然后,本文根据实际战场的特征和特点,设计了一种基于本体的态势知识库的设计框架,包括态势本体的构建和基于本体的态势知识库构建两部分。态势本体的构建过程包括对战场态势要素的抽象概念进行描述和确定构建本体的方法。基于本体的知识库构建过程包括确定态势概念的分类、对态势概念属性的阐释、加入兵棋推演规则以逻辑和产生式表示方法对态势规则库进行构建叁个部分。同时,本文针对任务、资源、能力和战局四方面构建了四种势标签框架并详细解释其功能与含义。其中,任务势标签对作战任务信息进行定性描述,资源势标签与能力势标签对战场资源和作战能力进行定量描述,战局势标签对整体战场局势进行描述。进而,针对战场数据样本标签包含信息多、关联性强等特点,本文选取GBDT算法实现标签匹配过程。对于未知战场数据样本,首先进行初步的数据筛选,利用GBDT多元分类算法实现任务势标签的匹配;对于资源势标签与能力势标签,因为标签数据是连续的实数值,因此采用GBDT算法进行回归,得到匹配结果,通过人工添加战局势标签,完成四种态势标签的匹配工作,设计出战场数据样本标签的匹配模型。最后,本文根据上述方法和模型,利用兵棋推演平台数据进行了标签匹配的验证实验。对于任务和能力势标签分别计算标签匹配与实际标签结果的正确率和接近度,依据标签匹配结果自动添加知识库中的相似标签。最终,通过展示其对应的战场数据样本中的全部标签,证明本文提出的基于知识和GBDT算法的匹配模型具有可行性和实际使用价值。(本文来源于《南京大学》期刊2019-04-30)
蒋留兵,周小龙,姜风伟,车俐[5](2019)在《基于改进匹配网络的单样本学习》一文中研究指出当前深度学习是基于大量标注数据样本通过多层网络实现模型自动识别。然而,在很多特殊场景下,难以获取大量标注样本数据,小样本物体识别仍是深度学习下关键性的难题。针对这一问题,首先利用4层深度卷积神经网络(deep convolution neural network,DCNN)提取训练样本和测试样本的高层语义特征,然后基于改进的匹配网络分别采用双向LSTM和attLSTM算法对训练样本和测试样本深入提取更加关键和有用特征并进行编码,最后在平方欧氏距离上利用softmax非线性分类器对测试样本进行分类识别。实验通过Omniglot数据集对提出的改进模型进行测试,取得了非常好的效果。改进的模型即使在最复杂的20-way 1-shot情况下,依然能够达到93.2%的识别率,Vinyals的原创匹配网络模型在20-way 1-shot的情况下只能达到88.2%的识别率,与原创匹配网络模型相比,改进的模型在类别数更多而样本数较少的复杂场景下具有更好的识别效果。(本文来源于《系统工程与电子技术》期刊2019年06期)
柳青林[6](2018)在《基于小样本学习的目标匹配研究》一文中研究指出目标匹配是计算机视觉领域的一个基本问题,其主要任务是对待检测图像中的目标实现匹配和定位。目标匹配技术被广泛的应用在航空航天、国防建设、医药卫生等很多领域中。在实际的目标匹配场景中,由于摄像机视角、摄像机成像素质、光照条件、目标形变、目标遮挡等条件变化的影响,给目标匹配定位算法带来了极大挑战;同时很多场景中无法获取丰富的目标数据,这就给目标匹配算法提出了需要从少量目标数据中提取足够有效信息的需求。针对这些情况,本文对基于小样本学习的目标匹配算法进行了深入的研究,并做了以下工作:阐述了目标匹配算法的主要定义,概括介绍了目标匹配算法的主要流程,对目前主流的目标匹配算法的原理和优缺点进行分析。对目前小样本的学习的几个主流方法进行介绍,分析了这些算法的使用场景。结合现有目标匹配算法和基于小样本学习的方法,本文从不同角度出发提出两种新的基于小样本学习的目标匹配算法,并通过实验对提出的算法的有效性进行验证。结合孪生网络和特征模板匹配构建了一种新的目标匹配算法。孪生网络是一种在已有数据上完成训练,不需要重新训练即可在新的数据上准确地分辨目标之间相似性的模型,可以对小样本数据进行很好地分类。针对基于特征模板的目标匹配算法在小样本场景容易误匹配的情况,引入孪生网络对待匹配区域图像和目标的进行相似度衡量,提出一种多参考图张量对区域特征张量卷积并求解最大值和的方法,选取最为相似的区域,取得较为精确的目标匹配定位结果。然后在相关数据集上进行实验验证算法的有效性。利用迁移学习方法将目标检测模型应用到目标匹配定位任务上。迁移学习是利用相关领域大数据训练的模型参数来帮助本领域的模型训练,从而使模型可以从小样本中学习到有效信息的方法。算法利用YOLOv2算法模型参数,对网络结构和损失函数进行修改,将目标检测模型通过迁移学习的方法改为一种新的目标匹配定位模型。在训练时通过使用空间变换网络进行快速数据增广增强算法对简单空间变换的鲁棒性。针对原始算法对小目标匹配定位不准确的缺点,提出一种局部放大策略,优化预测结果。通过在相关数据集上实验测试算法性能,验证算法在各个场景的有效性。(本文来源于《西安电子科技大学》期刊2018-06-01)
李晓[7](2018)在《基于样本选择理论对匹配法及双重差分匹配法偏差的比较研究》一文中研究指出匹配法和双重差分匹配法是政策评估领域中利用预处理值和协变量纠正选择偏差的两大普遍运用的方法。本文主要依据样本选择理论研究匹配法及双重差分匹配法评估处理效应时产生的选择偏差。对此,本文在上述理论框架下基于动态收益方程和就业培训项目的自我选择机制来构造样本选择模型分别研究非随机分配情形下两者产生的选择偏差及其影响机理。模型中引入了协变量的非参数结构用以捕获协变量效应,并增加了个体和时间的交互效应这一维度,并通过蒙特卡洛(Monte Carlo)模拟量化分析两者的评估性能,最后本文通过就业培训项目的实际案例分析进一步予以论证。理论结果发现,在有限信息条件下,匹配法和双重差分匹配法的偏差均为负,均低估了项目的处理效应,但匹配法的性能依然凌驾于双重差分匹配法之上;在完全信息条件下匹配法和双重差分匹配法的偏差可正可负,当距离处理期较远时,两者偏差均为负,且逐步逼近于0,此时匹配法的估计量达到了一致性,称其处理效应估计量为无偏估计量,即匹配法性能优于双重差分匹配法;当靠近处理期时,两者偏差均为正,此时双重差分匹配法的估计量可达到一致性,其处理效应估计量则为无偏估计量,即双重差分匹配法性能优于匹配法。(本文来源于《华侨大学》期刊2018-05-22)
朱永成,潘继飞,金天祥,沈家煌,刘鑫[8](2018)在《基于小样本脉冲序列匹配的重点雷达目标快速识别》一文中研究指出针对雷达对抗侦察系统如何快速有效识别出重点雷达电子目标的问题,提出了利用雷达小样本脉冲序列模板从接收到的复杂混合脉冲序列中抽取重点雷达信号的思路,并实现了该算法,克服了目前雷达对抗侦察信号处理流程僵化、识别速度与识别正确率受信号分选算法限制的缺陷。在此基础上,提出了多目标并行理论分析与计算机仿真实验,进一步验证了该方法能够在密集雷达脉冲流中快速、准确识别出重点雷达电子目标。(本文来源于《火力与指挥控制》期刊2018年05期)
牛成英,孙秋碧[9](2018)在《基于倾向值匹配的非随机样本不完全随机化方法》一文中研究指出采用随机抽样方法从目标总体中抽取一个随机样本作为辅助样本,利用目标总体已知的辅助信息,基于倾向值匹配方法对来自目标总体的非随机样本与辅助样本进行匹配,生成一个来自非随机样本的匹配样本,并对匹配样本随机性进行了理论论证和数值模拟验证,研究结果显示,该匹配样本与辅助样本具有相同随机性,说明利用倾向值匹配方法可以对非随机样本进行不完全随机化.(本文来源于《系统科学与数学》期刊2018年05期)
孙维东[10](2018)在《基于样本分布匹配的极化SAR数据迁移学习研究》一文中研究指出合成孔径雷达(Synthetic Aperture Radar,SAR)通过主动的发射和接收微波电磁波记录目标散射信息,全天时全天候的成像能力使其可以与光学传感器互补建立相对完善的对地观测体系。比之在单一极化态组合下获取数据的单极化SAR,全极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,PolSAR)更可进一步获取特定极化基下目标的完整后向散射信息,从而在对地物目标属性和参数的分析、提取、反演等工作中有着天然的优势。随着传感器硬件技术的飞速发展,近年来涌现出越来越多的机载、星载雷达系统,尤其是2016年我国自主研发的高分叁号雷达卫星成功升空,标志着SAR乃至极化SAR数据均有了稳定的国内数据源。然而,地物散射特性既是其自身尺寸、结构、介电性质等属性的综合体现,同时又受到微波频率、入射角度等成像参数的影响,相同或相似目标在不同影像上往往具有不一致的散射表现,导致了在实际应用中难以利用历史存档数据解决新数据任务的困境,尤其是散射信息更加丰富的极化SAR数据,受到的影响则更严重。雷达数据间相互割裂的现象大大降低了历史数据的可用性,减少了历史数据的使用价值。而另一方面,对新近数据中地物目标的标注工作需要进行实地调绘,不仅费时费力,还降低了时效性。作为机器学习与人工智能领域的研究热点之一,迁移学习旨在探索将某一领域积累的知识延伸应用到另一个与之相关的领域,其根本目的是解决旧领域数据在新领域任务中的适配问题。这就为提高历史数据利用效率、解决新近数据的监督信息依赖问题提供了可能性。因此,本文聚焦于在不同时间、空间或成像条件下获取的极化SAR数据的迁移学习问题,面向多种假设前提和应用条件尝试提高历史数据和新近数据间的样本分布匹配程度,实现跨域数据信息迁移。本文的主要工作包括:①从对极化数据基本统计分布形式的有效性验证出发,分析了基于Wishart分布的经典分类模型中存在的两个问题,并针对性提出解决方案,从而利用统计假设检验理论建立了基于Wishart分布的新模型,在获取代表性类别聚簇的同时有效降低了干扰样本的不利影响,提高了基于基本分布形式的分类模型表现,总结了保持Wishart分布合理性的前提条件和适用情况;②从对样本类别条件概率分布的匹配出发,开展了基于实例的迁移学习方法研究工作。为应对在稀少目标域标记样本情况下,基于实例的迁移学习方法无法工作的问题,结合统计假设检验理论和区域生长思想,给出了一种低代价的目标域标记样本集扩充方式,在一定程度上丰富了目标域标记样本多样性;在分析Bagging集成迁移算法问题的基础上,提出了新的基于实例的迁移方法,该方法通过引入Wishart分布过滤与目标域任务无关的源域样本,通过引入fallback分类器降低负迁移效应,最终以协同更新评判集和弱分类器的方式提高域间样本条件分布的匹配性,保持了地物识别结果的稳定性;③从对样本边际概率分布的匹配出发,系统梳理了从常规子空间学习到迁移子空间学习的理论思想转变过程,总结了在迁移学习背景下进行子空间学习的信息保持原则,提出了一种以源域监督信息和双域数据结构信息保持,以及域间边际分布匹配为目标的子空间学习准则,构建了新的基于特征表达的迁移学习模型。该模型利用基于Wishart假设检验测度的核映射函数,引入极化数据统计特性,实现域间样本边际分布的匹配,在无目标域标记样本的前提下完成了地物目标识别;④从对样本混合概率分布的匹配出发,分析了等维空间变换对多元复高斯分布、复Wishart分布以及由其建立的有限混合分布模型的影响和变换后概率密度函数的变化情况。在此基础上引入Bregman散度对域间样本分布的差异进行评估,给出了同时兼顾域内数据分布保持和域间数据混合分布匹配的等维迁移变换方法,最终利用极化基变换理论简化了目标函数求解难度并提高了域间迁移关系的可解释性,能够对包括地物识别、变化检测在内的多种处理任务提供支持。(本文来源于《武汉大学》期刊2018-05-01)
样本匹配论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目的评估应用机器人辅助胰腺手术治疗胰头部实性假乳头瘤(solid pseudopapillary tumor,SPT)的可行性和价值。方法回顾性分析89例胰头SPT患者的手术及随访资料,其中48例使用开放手术治疗,41例采用机器人辅助胰腺手术治疗。收集两组患者的临床资料,采用倾向评分匹配(propensity score matching,PSM)对2种方法的中长期疗效进行比较和分析。结果 89例患者中,55例采取胰十二指肠切除术,24例采取保留十二指肠的胰腺切除术,10例为胰腺肿块剜除术。不论何种术式,与开放手术比较,机器人辅助手术的术中出血量减少,围手术期恢复更快,且术后住院天数更短(均P <0. 05)。两种手术方式的术后胰瘘发生率、其他并发症发生率以及患者治疗费用方面比较,差异均无统计学意义(均P> 0. 05)。结论机器人辅助胰腺手术治疗胰头SPT是一种安全、有效的手术方式,可以减少术中出血量及输血需求,加速患者围手术期康复,且并不增加胰瘘或其他主要并发症的发生率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
样本匹配论文参考文献
[1].邬志罡,荆一楠,何震瀛,王晓阳.基于用户查询与样本间匹配度评估的分层抽样策略[J].计算机应用与软件.2019
[2].应夏洋,翁原驰,王伟绅,秦凯,许志伟.机器人辅助胰腺手术治疗胰头实性假乳头瘤的可行性分析:单中心样本的倾向性评分匹配研究[J].实用肿瘤杂志.2019
[3].杨晓妹,刘文龙.财政R&D补贴、税收优惠激励制造业企业实质性创新了吗?——基于倾向得分匹配及样本分位数回归的研究[J].产经评论.2019
[4].钱勇.基于知识的战场数据样本标签匹配方法研究[D].南京大学.2019
[5].蒋留兵,周小龙,姜风伟,车俐.基于改进匹配网络的单样本学习[J].系统工程与电子技术.2019
[6].柳青林.基于小样本学习的目标匹配研究[D].西安电子科技大学.2018
[7].李晓.基于样本选择理论对匹配法及双重差分匹配法偏差的比较研究[D].华侨大学.2018
[8].朱永成,潘继飞,金天祥,沈家煌,刘鑫.基于小样本脉冲序列匹配的重点雷达目标快速识别[J].火力与指挥控制.2018
[9].牛成英,孙秋碧.基于倾向值匹配的非随机样本不完全随机化方法[J].系统科学与数学.2018
[10].孙维东.基于样本分布匹配的极化SAR数据迁移学习研究[D].武汉大学.2018