专利文本论文-艾楚涵,姜迪,吴建德

专利文本论文-艾楚涵,姜迪,吴建德

导读:本文包含了专利文本论文开题报告文献综述及选题提纲参考文献,主要关键词:关联规则,Apriori算法,LDA主题模型,专利

专利文本论文文献综述

艾楚涵,姜迪,吴建德[1](2019)在《基于主题模型和关联规则的专利文本数据挖掘研究》一文中研究指出如何从海量的专利信息中挖掘出不同专利之间隐含的关联关系是很多专利管理系统迫切需要解决的问题.本文从专利文本的摘要出发,提出一种基于Apriori和引入LDA主题模型的专利文本分析方法.首先,采用Apriori算法对数据降维,挖掘关键词和主题词之间的关联规则并根据规则绘制共享主题网络图,然后使用LDA主题模型对离散化的专利-主题词矩阵进一步线性降维,并将主题聚类,得到主题细分下的高频词主题,最后结合两种分析方法的结果对专利文本进一步挖掘分析.本文所使用的方法能够有效地挖掘出专利文本数据间的关联,可以为专利间的关联推荐提供思路和应用参考.(本文来源于《中北大学学报(自然科学版)》期刊2019年06期)

吴峥[2](2019)在《使用文本挖掘辅助专利分析》一文中研究指出本文针对文本挖掘中的中文分词、关键词抽取、共现关系抽取等方法,提出将其应用于专利分析以提高分析效率、增加分析深度的解决方案。在专利分析领域起到提质增效、节省人力、提升分析效果的作用。在专利信息数据库中,既包含申请号、申请日、分类号、申请人、申请人地址、专利法律状态等结构化数据,也包含说明书摘要、权利要求书和说明书这样不易直接参与专利分析的非结构化数据。自然语言处理(NLP)是近年来大数据(本文来源于《中国科技信息》期刊2019年17期)

陈潇,杨翘楚,王琪艳[3](2019)在《国际中药专利英语文本词句特点及翻译》一文中研究指出中药专利英语文本的翻译水平,在很大程度上影响了国际专利合作公约申请的顺利,同时也决定了后续维权的难易程度。在这种情况下,我国就应该充分重视国际中药专利英语本文翻译活动,并且能够结合中英文语言特点和中药相关知识,做好中药英语翻译工作。本文则先阐述了国际中药专利文本词句特点,接着从明确名称化结构的特点、使用客体作为主体、程式化翻译的套用、加强对长难句的分解与理解四个方面,综合全面的探讨了国际中药专利英文文本翻译的策略。我国中药行业在国际市场中本身就具有知识产权的优势,整个中药体系中含有较多的技术知识点。而随着我国各(本文来源于《知识文库》期刊2019年15期)

蔡榕,周长江,孙涛,王鹏,郭晏[4](2019)在《基于文本相似度的电力行业专利价值评估方法研究》一文中研究指出结合了现有的专利价值评估指标体系以及电力行业的专利发展现状,提出了基于文本相似度计算的电力行业专利价值评估方法,用以挖掘专利数据内部的、客观的信息。通过专利相似度和新颖度指标量化了专利的独特性和新颖程度,依此来评价电力行业的专利质量。(本文来源于《湖北农业科学》期刊2019年S1期)

王聪玲[5](2019)在《纽马克文本类型理论指导下的电子产品专利说明书英译汉翻译实践报告》一文中研究指出说明书是专利申请文件中的重要部分,高质量的专利说明书译文对专利申请的获批以及权利保护至关重要。各国科技创新不断进步,大量英文电子产品专利说明书需要翻译。然而由于缺乏电子方面的专业知识,译员在翻译该领域时花费时间较长且出错较多,因此,对电子产品专利说明书的汉译方法展开研究极为必要。本报告归纳了笔者在翻译电子产品专利说明书时遇到的困难,可归结为叁个层面:词汇层面,技术术语和专有名词的误译、半技术术语的不确定;句法层面,带有非谓语动词的长句晦涩难懂、被动句翻译的不确定和句间逻辑混乱;层面,整体不一致、不准确。鉴于专利说明书属于形式主导的表达型文本和内容主导的信息型文本,笔者以纽马克的语义翻译和交际翻译策略为指导对文本进行分析。语义翻译试图在第二语言的语义和句法结构允许的情况下,准确地表达原文的上下文意义,而交际翻译试图给读者产生一种尽可能接近原文读者的效果。最后根据该翻译策略提出了解决上述问题的方法,包括:查询专业词典,联系背景知识;切分非谓语动词,意译,调整句间逻辑结构;套译,增补或转换。(本文来源于《西安外国语大学》期刊2019-06-01)

王英瑜[6](2019)在《基于深度学习的专利文本分析方法研究》一文中研究指出随着现代科学技术和信息技术的发展,专利分析(Patent Analysis)在衡量技术竞争力,预测技术趋势等方面发挥着不可替代的作用,在工业、商业、法律、学术界等多个领域得到广泛的应用。在专利分析领域,高效提取专利特征,度量相似专利是一项具有挑战性的任务。鉴于深度学习(Deeplearning,DL)方法在文本分类、情感分析等自然语言处理(Natural language processing,NLP)领域表现出来的优势,本文提出了一种基于深度学习的专利文本挖掘方法,旨在挖掘、提取和量化专利文本特征,为专利检索、相似专利度量等专利分析任务提供高质量的专利特征数据。本文提出了一套较为系统的专利文本特征提取方法。首先,结合专利文本结构特点和专利文本外表特征,构造出一种用于本方法的专利文本结构化数据集;然后,利用概率统计模型——主题模型(Topic model)对专利文本潜在的语义结构进行提取、降维和聚类,并依据聚类结果构造用于深度学习的训练集;接着,构建卷积神经网络(Convolutional neural network,CNN)模型,通过有监督学习的方式,提取和组合专利文本不同维度的关键信息,将专利数据从文本信息映射成向量空间的量化数据(特征向量);最后,与另外四种专利文本量化表示模型或方法进行对比实验,度量五种专利特征表示方法在专利文本相似程度上的准确率。实验证明,本论文提出的专利文本特征提取方法表现最优。在此基础上,为了进一步提高模型语义表达和特征提取的能力,本文对卷积神经网络模型进行优化。使用多种预训练词向量模型、多层分类器等,以提高模型准确率和输出不同维度的特征向量。然后,构建并优化了基于文本处理的循环卷积神经网络(Recurrent and convolutional neural networks,RCNN),并且提出使用前K最大池化(K-max pooling)策略来进一步提高模型精度。最后通过实验,本文对优化后的几种模型在不同数据集、词向量模型上进行评估和分析。实验表明,前K最大池化在文本处理中表现更优。(本文来源于《北京邮电大学》期刊2019-05-31)

刘玉林,菅利荣[7](2019)在《基于文本挖掘和复杂网络的中美电商专利比较研究》一文中研究指出[目的/意义]中国和美国作为世界上最大的发展中国家和发达国家,在电商领域都取得了令人瞩目的成绩。通过对中美电商专利的比较能够深入了解中美在电商领域的技术发展和未来趋势。[方法/过程]提出一种基于文本挖掘和复杂网络的结合方法,包括中美电商专利关键词一致性判断,中美电商专利文档-词矩阵构造,中美电商专利余弦相似度关联矩阵构建,复杂网络分析等。[结果/结论]通过对701条美国电商专利和2 005条中国电商专利数据比较发现:a.美国电商专利研究领域聚焦性和技术性强,中国电商专利研究领域融合性和应用性强,中美电商专利研究有很强的互补性;b.中美电商专利有57个核心一致性关键词;c.从1 405 505对中美电商专利中寻找到380对高相似专利,可以为相关人员进行技术机会发现提供参考;d.复杂网络中以C388专利节点为例的中心网络,帮助其发现4个相关性社区。(本文来源于《情报杂志》期刊2019年06期)

杨玉瑛[8](2019)在《句法和词法视角下专利文本的翻译策略分析》一文中研究指出专利文献是技术信息的最有效载体。随着欧洲国家对知识产权的保护的重视,欧洲国家的申请人逐渐将目光投向了其他国家。目前德国企业在国外申请专利数量约占到了专利总数的叁分之二,通过巴黎公约途径或国际专利申请途径进入中国的德语专利申请逐年增多。而中国《专利法》及其实施细则要求专利申请文件统一使用中文,且在提交之后修改不能超出原始申请所记载的范围。因此,专利申请文件的翻译质量对于专利来说至关重要。专利文本特点鲜明:结构统一,表达严谨,描述简明准确,且兼具法律特征。专利文件翻译质量直接关系到能否最终获得专利权,因此精准严谨的申请文件的翻译就显得尤为重要。本文对选取的“具有球状和弹性挠曲的滑动面的旋转滑动轴承”这一专利进行深入分析,从结构、词和句法的角度论述译文与原文保持一致的必要性;针对文中结构、词句方面存在的不一致的现象,笔者从法律、语言差异、技术实施等角度解释原因,并最终得到结论:专利文本译文在一般情况下都能与原文保持一致,而译者对于译文的改动都具有技术、法律等方面的依据。(本文来源于《四川外国语大学》期刊2019-04-01)

艾楚涵,熊新,吴建德[9](2019)在《基于LDA主题模型的专利文本分析应用研究》一文中研究指出为了解决运用传统的专利文本分析方法中出现的分类粗糙、科学性不强等问题,提出使用基于Latent Dirichlet Allocation(LDA)主题模型的专利文本分析方法。以我国转基因玉米育种领域专利文本为研究对象,对专利文本主题进行划分。通过实验表明LDA主题模型对专利文本的划分和热门领域的分类准确、有效。并得出结论:对专利文本使用LDA主题模型建模可以实现对专利文本的分类,可以实现对热门领域主题分类、子领域细分,并对未来发展态势给出意见。(本文来源于《科技和产业》期刊2019年03期)

夏冰,李宝安,吕学强[10](2018)在《综合词位置和语义信息的专利文本相似度计算》一文中研究指出为解决传统文本相似度计算方法没有充分考虑专利文本结构特殊性以及计算文本相似度过程中往往忽略词汇间语义信息的问题,在传统方法的基础上,考虑词性以及专利文本的结构特征,将IPC分类号、标题、摘要、权利要求书作为主要研究对象,词在不同位置出现分别赋予不同的权重,通过word2vec将词表示成词向量的形式,通过词汇跟词汇之间的语义信息改进余弦相似度公式。实验结果表明,提出方法相比于传统文本相似度计算方法准确率和召回率有所提高,验证了其有效性。(本文来源于《计算机工程与设计》期刊2018年10期)

专利文本论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文针对文本挖掘中的中文分词、关键词抽取、共现关系抽取等方法,提出将其应用于专利分析以提高分析效率、增加分析深度的解决方案。在专利分析领域起到提质增效、节省人力、提升分析效果的作用。在专利信息数据库中,既包含申请号、申请日、分类号、申请人、申请人地址、专利法律状态等结构化数据,也包含说明书摘要、权利要求书和说明书这样不易直接参与专利分析的非结构化数据。自然语言处理(NLP)是近年来大数据

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

专利文本论文参考文献

[1].艾楚涵,姜迪,吴建德.基于主题模型和关联规则的专利文本数据挖掘研究[J].中北大学学报(自然科学版).2019

[2].吴峥.使用文本挖掘辅助专利分析[J].中国科技信息.2019

[3].陈潇,杨翘楚,王琪艳.国际中药专利英语文本词句特点及翻译[J].知识文库.2019

[4].蔡榕,周长江,孙涛,王鹏,郭晏.基于文本相似度的电力行业专利价值评估方法研究[J].湖北农业科学.2019

[5].王聪玲.纽马克文本类型理论指导下的电子产品专利说明书英译汉翻译实践报告[D].西安外国语大学.2019

[6].王英瑜.基于深度学习的专利文本分析方法研究[D].北京邮电大学.2019

[7].刘玉林,菅利荣.基于文本挖掘和复杂网络的中美电商专利比较研究[J].情报杂志.2019

[8].杨玉瑛.句法和词法视角下专利文本的翻译策略分析[D].四川外国语大学.2019

[9].艾楚涵,熊新,吴建德.基于LDA主题模型的专利文本分析应用研究[J].科技和产业.2019

[10].夏冰,李宝安,吕学强.综合词位置和语义信息的专利文本相似度计算[J].计算机工程与设计.2018

标签:;  ;  ;  ;  

专利文本论文-艾楚涵,姜迪,吴建德
下载Doc文档

猜你喜欢