导读:本文包含了标注模型论文开题报告文献综述及选题提纲参考文献,主要关键词:Pro,E,二次开发,叁维模型标注
标注模型论文文献综述
王连坤,武瑞,闫丽娟[1](2019)在《基于Pro/E的叁维模型标注的二次开发》一文中研究指出如何灵活而合理地实现设计信息与制造信息在叁维模型上的标识是目前叁维数字化研究的热点,而Pro/E叁维标注方面起步较晚,功能较弱。针对此现状,利用Pro/E的二次开发工具包Pro/Toolkit,对设计与制造信息在Pro/E中进行标注涉及的关键功能进行了二次开发,实现了信息在叁维模型中的组织、表达与显示,通过实际应用,满足了在Pro/E中以国标为准进行规范化标注的要求。(本文来源于《机电产品开发与创新》期刊2019年05期)
凌洪飞,欧石燕[2](2019)在《面向主题模型的主题自动语义标注研究综述》一文中研究指出【目的】对面向主题模型的主题自动语义标注方法进行总结与评述,以促进主题模型的发展与应用。【文献范围】在Web of Science和CNKI数据库中分别以"Topic Labeling OR Topic Labelling OR Topic Tagging ORTopicIndexing"和"主题模型AND(标注OR标签)"等检索式进行检索,通过手工筛选获得代表性文献57篇。【方法】对相关论文进行深入阅读与分析,以主题标注过程中主题标签的生成来源为线索,对已有方法进行分类与比较分析。【结果】面向主题模型的主题自动语义标注包括候选标签生成与排序两个主要步骤,根据候选标签的生成来源可分为依靠自身语料库和依靠外部语料库两类方法。【局限】目前该领域的研究还不是很丰富,分析与评述不够系统和全面。【结论】该领域的研究仍具有较大探索空间,面向社交媒体内容的主题语义标注是未来研究方向,可结合更丰富的知识库并采用深度学习技术进行改进提升。(本文来源于《数据分析与知识发现》期刊2019年09期)
孙安,于英香,罗永刚,孙逊[3](2019)在《序列标注模型中不同输入特征组合的集成学习与直推学习方法研究——以CCKS-2018电子病历命名实体识别任务为例》一文中研究指出[目的/意义]研究机器学习中集成学习与直推学习方法对电子病历命名实体识别任务的性能影响,为基于机器学习方法的文本信息抽取提供一种性能优化方法。[方法/过程]首先对CCKS-2018提供的电子病历文本进行分析,提取中文分词、词性标注、临床实体类别特征;然后在条件随机场CRF算法下,采用不同输入特征组合的方法构造"基学习器"进行投票集成;最后用直推学习方法对集成学习结果进行优化。[结果/结论]实验中集成学习获得总体效果F_1值86.93%均优于"基学习器"结果值,直推学习获得了模型的最佳泛化性能87.06%,同时多特征组合比单独字特征可以获得更好的"基学习器"。实验证明采用不同输入特征组合的集成学习和直推学习可以有效提升模型的泛化性能,该方法可以在其他相关机器学习与文本信息抽取领域中推广。(本文来源于《情报杂志》期刊2019年10期)
吕凡,胡伏原,张艳宁,夏振平,盛胜利[4](2019)在《面向图像自动语句标注的注意力反馈模型》一文中研究指出图像自动语句标注利用计算机自动生成描述图像内容的语句,在服务机器人等领域有广泛应用.许多学者已经提出了一些基于注意力机制的算法,但是注意力分散问题以及由注意力分散引起的生成语句错乱问题还未得到较好解决.在传统注意力机制的基础上引入注意力反馈机制,利用关注信息的图像特征指导文本生成,同时借助生成文本中的关注信息进一步修正图像中的关注区域,该过程不断强化图像和文本中的关键信息匹配、优化生成的语句.针对常用数据集Flickr8k, Flickr30k和MSCOCO的实验结果表明,该模型在一定程度上解决了注意力分散和语句顺序错乱问题,比其他基于注意力机制方法标注的关注区域更加准确,生成语句更加通顺.(本文来源于《计算机辅助设计与图形学学报》期刊2019年07期)
徐朝军,房小敏[5](2019)在《LDA模型在Web教育资源语义标注中的应用研究》一文中研究指出文章根据LDA模型,建立教学资源"文档—主题—关键词"叁层语义模型,并对资源文档进行语义主题建模,获取文档资源的语义主题和关键词,作为资源的语义标注,为用户提供检索服务。实验结果表明,文档LDA主题建模有利于从宏观上对教学资源进行目录分类,突出教学的重点、难点及相互关系,而对相同教学内容的教学主题资源进行LDA建模,可以挖掘资源内在的语义主题特征及细节性差异,最后的性能分析验证了LDA模型在大数据环境下的并行计算优势。研究中对教学资源的更多细节挖掘还有待继续,此外,在大规模数据集下应用性测试值得进一步深入探讨。(本文来源于《高等理科教育》期刊2019年03期)
张蕾[6](2019)在《基于主题模型的图像标注方法研究与应用》一文中研究指出由于大数据技术的高速发展,网络中的无标签图像展现出巨大的商业价值,如何快速筛选并使用这些无标签图像数据成为一个极具研究价值的问题。图像检索可以高效检索出需要的图像,而其在无标签图像数据的检索效果依赖于图像标注方法。在图像标注领域,由于图像的视觉内容和文本语义之间存在极大的差异,提出优秀的图像标注算法或改进现有图像标注模型依旧是一个十分具有挑战性的工作。本文围绕图像标注模型的改进、深度学习如何与传统图像标注模型结合展开研究,主要工作内容如下:(1)提出了基于主题融合和关联规则挖掘的图像标注方法,此方法是对基于LDA主题模型的图像标注方法的改进。LDA主题模型将图像视觉模态和文本模态的数据视为相互独立,并在此基础上生成对应模态的主题分布,因此图像不同模态的主题相互独立。为了增强图像视觉数据和文本数据的联系,在模型训练和图像标注阶段均进行不同模态的加权主题融合。基于LDA主题模型的图像标注以及其模型改进都没有考虑图像文本信息之间的关联对图像标注的影响,因此可利用图像文本信息的关联对主题模型的标注结果进行改善。利用改进的LDA图像标注方法获得初始标注词集,然后采用关联规则挖掘算法对初始标注词集进行挖掘找出图像的潜在标注词集。计算图像集所有文本标注词的词间相关性,然后将潜在标注词的词间相关性与基于改进LDA主题模型得到的标注词概率融合,对初始标注词集进行调整,从而改善图像标注的性能。(2)提出了融合卷积神经网络和主题模型的图像标注方法,此方法是深度学习与传统图像标注模型的结合。利用LDA主题模型对图像训练集的文本数据建模,生成图像训练集的潜在文本主题分布和文本主题标注词分布,对图像训练集文本数据的处理弥补了卷积神经网络分类训练集中文本数据维度大,分布稀疏的问题;卷积神经网络提取图像的高层视觉特征弥补了传统图像特征提取复杂和传递图像视觉信息有限的问题。为了提高图像低频文本主题的分类召回率,对卷积神经网络分类训练集中的高频文本主题进行平滑处理。然后利用图像的高层视觉特征和对应的潜在文本主题构建卷积神经网络分类器并进行图像文本主题多标签分类,获得图像的文本主题分布。该文本主题分布和LDA主题模型生成的文本主题标注词分布根据主题模型图像标注词概率的计算公式可得到图像标注词概率,从而确定图像的标注词集。在图像数据集中,将本文改进的图像标注方法与传统图像标注模型进行对比,本文改进的图像标注方法在召回率和准确率上都有一定的提高。将本文提出的结合深度学习和主题模型的图像标注方法与传统图像标注模型相比,该图像标注方法的性能远胜于传统图像标注方法;与当前较为先进的图像标注和基于深度学习的图像标注相比,该图像标注方法在准确率上表现略差,但在召回率有一定的提升。(本文来源于《江南大学》期刊2019-06-01)
李彦[7](2019)在《基于序列标注模型的事件抽取算法研究》一文中研究指出事件抽取是信息抽取领域重要的任务之一,其主要任务是从非结构化信息中抽取出结构化的事件信息。目前随着互联网的快速发展,互联网文本数据也呈现井喷式发展,因此抽取结构化事件信息有着极其重要的意义。事件抽取任务分为两个子任务:事件类型检测和事件论元抽取。传统方法将它们作为分类任务,主要分为串联和联合两种方式,依赖人工特征或深度学习来完成任务。本研究课题基于深度学习算法,以串联模型的方式,首次将两个子任务转换为两个序列标注任务,主要研究内容和研究成果如下:1)在事件类型检测任务中,提出一种基于先验知识和自注意力机制的序列标注模型。利用触发词先验知识来控制端到端模型的学习过程,提高模型的可解释性。先验知识帮助模型降低非触发词带来的噪声,增加候选触发词的权重。利用自注意力机制充分学习句子内部词语之间的相互依赖关系,解决串联模型事件触发词识别过程中不能充分利用事件论元信息的问题,进而提高了事件类型检测的准确性。2)在事件论元抽取任务中,设计一种基于自注意力机制的序列标注模型,根据已经检测出的事件触发词及对应的触发词信息,利用自注意力机制充分学习事件论元与触发词之间的关联程度,有效完成事件论元抽取任务。3)将事件类型检测任务拓展到金融领域。利用远程监督的方法,生成中文金融舆情事件数据集。然后在本研究课题所提出的事件类型检测模型中加入句子级注意力降噪机制,帮助模型学习更有效的远程监督标注数据信息,完成金融领域舆情事件类型检测。(本文来源于《北京邮电大学》期刊2019-05-31)
孙宁[8](2019)在《基于内容检索的叁维模型语义标注方法研究》一文中研究指出叁维模型作为继声音、图像、视频之后的第四种多媒体数据在互联网中的应用空间十分广泛,但由于高层语义与底层特征难以转换,导致叁维模型语义检索和标注过程中存在着语义鸿沟的问题。受国家自然科学基金(编号:61502094)与黑龙江省自然科学基金资助项目(编号:F2016002)资助,本论文以叁维模型进行快速识别与准确标注为目标,在综合对比了现有叁维模型语义标注方法的基础上,对提升语义标注的性能进行了探索研究。具体研究内容如下:(1)为了实现叁维模型的自动语义标注,本文设计并实现了一种基于近邻投票的叁维模型语义标注方法(Annotation Method of 3D Model Based on Neighbor Voting,AMNV)。该方法通过提取叁维模型的D2分布作为描述叁维模型外部形状特征,在k近邻方法的基础上利用EMD来计算标注目标与数据集之间的相似度距离,利用k个特征相似的近邻模型所包含的已知标签对待标注模型的标注结果进行标签传播,最终实现叁维模型的自动语义标注。(2)为了提升现有标注结果的多样性,本文提出了一种叁维模型语义标注多样性的优化方法(Diverse 3DModel Annotation,DMA)。在现有标注结果的基础上,对叁维模型的标注结果进行多样性优化。本文提出的方法利用了叁维模型标签与标签之间的语义相似度计算定义叁维模型多样性度量,通过综合考虑标注多样性与准确性,将低于标签相关性期望的标注结果重新排序,实现标注结果的多样性优化。(3)针对单纯依赖机器计算得出的标注结果可信度不高的问题,本文引进了人工查询相关反馈的叁维模型语义标注优化方法。该方法主要依靠用户对叁维模型的查询结果进行进一步的优化。通过用户主动查询相关标注结果并对结果进行二元置信度评分,实现现有标注结果与叁维模型真实语义的相关性优化,最终实现叁维模型标注结果的改善。为了满足现有叁维模型检索和使用的需求,本文设计并开发了一个基于内容检索的叁维模型语义标注系统。该系统在实现了叁维模型的自动语义标注的基础上,提供了基于文本检索和基于内容特征检索的叁维模型语义检索功能,另外还为用户提供了基于查询相关反馈的标注结果改善接口。通过本文提出方法的应用,该系统提高了叁维模型检索和管理的性能,使用户在检索和使用叁维模型时能够更加高效、便捷。(本文来源于《东北石油大学》期刊2019-05-20)
张蕾,蔡明[9](2019)在《融合卷积神经网络与主题模型的图像标注》一文中研究指出为降低图像文本数据的稀疏性和传统图像特征的局限性,提出一种融合卷积神经网络(CNN)和主题模型的图像标注算法。利用狄利克雷主题模型对图像训练集的文本数据进行建模,生成文本主题分布和文本主题标注词分布,以降低图像文本数据的维度和稀疏性。考虑到图像文本主题的稀疏分布,利用CNN提取图像的高层视觉特征,同时改进损失函数以重构CNN。利用图像的高层视觉特征和对应的多个文本主题构建多分类器,进行图像文本主题多标签分类学习,并获得图像的文本主题分布。最后,将该文本主题分布和主题模型生成的文本主题标注词分布融合计算出图像的标注词概率。由Corel5K和IAPR TC-12图像标注数据集的对比实验可知,本文方法有效提高了图像的标注性能。(本文来源于《激光与光电子学进展》期刊2019年20期)
赖港明[10](2019)在《基于词性标注和依存句法的词向量模型改进研究》一文中研究指出近年来,深度学习借助基于神经网络的词向量在自然语言处理领域大放异彩,席卷自然语言处理各项基础研究。词向量的质量直接影响上层自然语言处理任务的效果。而词向量模型则是训练词向量的核心,但目前诸多的词向量模型仍存在很多不足之处。这些不足之处包括:(1)网络结构问题。目前基于神经网络的词向量模型大多将上下文窗口中的词语同等对待,不考虑词语之间的依存关系;(2)信息丢失问题。固定的上下文窗口会对句子成分复杂的长句和复合句进行裁剪导致部分重要词汇的丢失;(3)未充分利用词性标注的词法结构信息和依存句法的句法结构信息。现有基于词性标注改进的研究大多仅使用词性关联修改词语在上下文中的权重,基于依存句法改进的研究大多没有考虑依存关系的差异;(4)二次采样和负采样技术过于简单。词频高的词语在进行二次采样和负采样时被同等对待,从而导致部分对预测目标词有较大影响的高频词丢失。(5)词性之间的相似度无法衡量。词性之间存在语义鸿沟,就目前所知,没有量化词性之间相似度的算法和数据集。针对基于神经网络的词向量模型所面临的多个问题,本文在现有工作的基础上,结合词性标注和依存句法分析,提出四种改进的词向量模型:(1)基于词性标注的CBOW+P模型。将词性信息整合到词向量的训练过程中,提出词性向量的概念以解决词性相似度难以衡量的问题。具体策略是使用词性向量相关系数和距离加权函数将词向量和词性向量统一训练,同时使用词性占比改进二次采样和负采样技术;(2)基于词性标注的CBOW+PW模型。在CBOW+P模型的基础上,进一步将词性向量相关系数细化到每一个词语中;(3)基于依存句法的CBOW+G模型。提出使用依存句法修正现行固定上下文窗口做法所导致的信息丢失问题。具体策略是使用依存关系权重衡量依存关系的差异,同时提出两种计算依存关系权重策略:预训练平均余弦距离策略和负采样平均余弦距离策略;(4)基于词性标注和依存句法的CBOW+G+P模型。融合CBOW+P模型和CBOW+G模型,同时利用词性标注信息和依存句法信息改进词向量模型。为了衡量词性向量的效果,本文构建了一个含有55组测试数据的词性类比数据集以及一种基于词性向量的句子表示方法。在词相似性、词类比和中文文本分类任务上的实验验证了本文所提出的四种模型的有效性,特别是组合模型(CBOW+G+P)的优异性,且时间复杂度与经典的CBOW模型处于同一量级。(本文来源于《华南理工大学》期刊2019-04-15)
标注模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
【目的】对面向主题模型的主题自动语义标注方法进行总结与评述,以促进主题模型的发展与应用。【文献范围】在Web of Science和CNKI数据库中分别以"Topic Labeling OR Topic Labelling OR Topic Tagging ORTopicIndexing"和"主题模型AND(标注OR标签)"等检索式进行检索,通过手工筛选获得代表性文献57篇。【方法】对相关论文进行深入阅读与分析,以主题标注过程中主题标签的生成来源为线索,对已有方法进行分类与比较分析。【结果】面向主题模型的主题自动语义标注包括候选标签生成与排序两个主要步骤,根据候选标签的生成来源可分为依靠自身语料库和依靠外部语料库两类方法。【局限】目前该领域的研究还不是很丰富,分析与评述不够系统和全面。【结论】该领域的研究仍具有较大探索空间,面向社交媒体内容的主题语义标注是未来研究方向,可结合更丰富的知识库并采用深度学习技术进行改进提升。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
标注模型论文参考文献
[1].王连坤,武瑞,闫丽娟.基于Pro/E的叁维模型标注的二次开发[J].机电产品开发与创新.2019
[2].凌洪飞,欧石燕.面向主题模型的主题自动语义标注研究综述[J].数据分析与知识发现.2019
[3].孙安,于英香,罗永刚,孙逊.序列标注模型中不同输入特征组合的集成学习与直推学习方法研究——以CCKS-2018电子病历命名实体识别任务为例[J].情报杂志.2019
[4].吕凡,胡伏原,张艳宁,夏振平,盛胜利.面向图像自动语句标注的注意力反馈模型[J].计算机辅助设计与图形学学报.2019
[5].徐朝军,房小敏.LDA模型在Web教育资源语义标注中的应用研究[J].高等理科教育.2019
[6].张蕾.基于主题模型的图像标注方法研究与应用[D].江南大学.2019
[7].李彦.基于序列标注模型的事件抽取算法研究[D].北京邮电大学.2019
[8].孙宁.基于内容检索的叁维模型语义标注方法研究[D].东北石油大学.2019
[9].张蕾,蔡明.融合卷积神经网络与主题模型的图像标注[J].激光与光电子学进展.2019
[10].赖港明.基于词性标注和依存句法的词向量模型改进研究[D].华南理工大学.2019