实例抽取论文-孙义

实例抽取论文-孙义

导读:本文包含了实例抽取论文开题报告文献综述及选题提纲参考文献,主要关键词:专家抽取,商务类,评审委员会,招标投标

实例抽取论文文献综述

孙义[1](2018)在《中石油评审自动化专家抽取系统实例》一文中研究指出随着计算机网络技术、数据库技术、通信技术的发展,自动化的专家抽取系统崭露头角,逐渐开始被接受和使用。自动化抽取即借助信息技术和通信技术,根据一定的抽取规则,由系统自动生成候选专家名录,通过电话或短信等方式确定专家是否参与,最终形成参审专家名单。自动化抽取实现了评审专家的自动化和规范化管理,实现了专家抽选信息的保密存储和信息共享,同时也降低了人力的投入,一定程度上克服了人工抽取带来的弊端。(本文来源于《中国招标》期刊2018年24期)

凌绍伟[2](2015)在《基于中文开放链接数据的实例抽取技术研究》一文中研究指出知识库构建是语义网发展的重要环节,现在对知识库构建的研究越来越热门,为模式层添加实例的实例抽取技术也变得尤为重要,然而现有的实例抽取技术方法,一方面具有语言依赖的特点,如YAGO知识库,另一方面抽取到的实例-分类关系中分类数量太少,如DBpedia知识库。实例抽取的数据源分为无结构的网络资源和有结构的开放链接数据,无结构的网络资源包含有大量噪音数据,提取高质量实例难度较大,而有结构的开放链接数据包含有结构良好的数据,有利于抽取高质量的实例。另外,现有知识库的中文实例信息相对较少。总体来看,为了实现将来的复杂实例抽取,如何在中文开放链接数据中抽取出高质量的实例-分类关系是一个重要的研究问题。基于以上现状,本文对实例抽取技术进行了深入研究,并设计了一个基于中文开放链接数据的实例抽取方法,该方法的主要贡献如下:(1)提出了基于实体属性和分类属性的实例抽取算法,并在中文百科类站点数据中抽取了大量的高质量分类-实例关系叁元组。(2)提出的属性传递算法,为中文百科站点数据中的42,934个分类补全了高质量的分类属性。(3)对补全的分类属性和抽取的分类-实例关系叁元组做了准确率实验评估,两者的准确率分别高于88%和91%。与DBpedia、YAGO和BabelNet数据集比较,本文得到的数据有数量最多的中文分类-实例关系叁元组,并且具有更合适的粒度。(本文来源于《东南大学》期刊2015-01-01)

李文锦,王康健[3](2012)在《源代码中设计模式实例的抽取及验证方法研究》一文中研究指出从源码中抽取设计模式对于提高软件可理解性和可维护性、软件设计重用以及软件重构具有重要意义。面向Java语言提出了一种静态和动态分析相结合的源码中设计模式的抽取方法。具体地,研究了源码中设计模式抽取的静态结构分析过程,为了进一步提高设计模式实例抽取的准确率,对结构分析得到的创建型模式候选,使用创建对象的多重性分析方法进行验证,对结构分析得到的行为型模式候选,使用动态分析的方法进行验证,以区分结构相似但行为不同的模式的实例。最后实现了设计模式抽取工具并对开源软件中的模式实例进行抽取。通过实验数据,验证了设计模式实例抽取及验证方法的可行性及有效性。(本文来源于《计算机应用研究》期刊2012年11期)

郭剑毅,李真,余正涛,张志坤[4](2012)在《领域本体概念实例、属性和属性值的抽取及关系预测》一文中研究指出研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们叁者之间对应关系预测的问题.首先将概念实例、属性及属性值看作叁类实体,把概念实例、属性及属性值的抽取问题转化为命名实体识别问题,利用条件随机场建模进行命名实体识别;在此基础上定义实体间对应关系,对概念实例、属性及属性值叁者的对应关系做预测,把概念实例、属性与属性值叁者之间存在关系的向量标记为1,否则标记为0,利用支持向量机建模进行关系的预测.且以云南旅游景点概念实例、属性及属性值进行六组相关的实验.实验表明,在开放测试中协作分类器精确度达到84.4%、召回率达到82.7%及F值达到为83.6%,相比于词语共现F值提高了20个百分点.(本文来源于《南京大学学报(自然科学版)》期刊2012年04期)

许旭阳,李弼程,张先飞,韩永峰[5](2011)在《基于事件实例驱动的新闻文本事件抽取》一文中研究指出目前,事件抽取的流行方法是以事件元素或触发词进行驱动,但该方法容易导致正反例不平衡,且在语料库规模较小时存在一定的数据稀疏问题。提出了一种基于事件实例驱动的事件抽取方法。首先,从文档句子中抽取出刻画一个事件发生有代表性的特征,构成候选事件实例表示;其次,通过二元分类器对新闻文本中的事件实例与非事件实例进行分类;最后,对事件实例采用基于层次聚类的k-medoids算法完成事件抽取。该方法不仅克服了正反例失衡以及数据稀疏问题,而且解决了预先定义事件类别的局限性。实验结果验证了该方法的有效性,对比传统方法,事件抽取的准确率与召回率均获得了显着的提高。(本文来源于《计算机科学》期刊2011年08期)

尹津其[6](2009)在《基于WEB的数据抽取及应用实例》一文中研究指出基于WEB的数据抽取是当前相当热门的方向之一。本文对此作了一个比较全面的介绍,概括了基于WEB的数据抽取的主要概念和特点说明基于WEB的数据抽取所常用的技术。最后简单介绍了基于WEB数据抽取中的实际应用一例。(本文来源于《中国新技术新产品》期刊2009年19期)

梁浩,左万利,任斐,赫枫龄[7](2009)在《基于本体实例信息的深度网表单属性自动抽取》一文中研究指出Deep Web是隐藏在Surface Web之后的信息提供者,而且在Deep Web之中还隐藏着更大量的信息.目前,对Deep Web中的信息进行有效的获取的可行方法是通过Deep Web提供的查询接口对其进行访问.自动抽取查询接口中的属性并生成正确的查询条件是提升访问Deep Web能力的有效方法.查询接口中属性之间存在着不同的语义约束关系,如互斥和共存.为了生成有效的查询条件,必须发现并协调关键属性间的语义关系.为了解决些问题,提出一个基于本体技术并充分利用实例信息的表单属性自动抽取方法,在这一方法中使用WordNet来丰富抽取出的关键属性并发现表单中属性间的语义关系.在属性抽取过程中,每个属性被拓展生成一个备选属性集并且以树型数据结构存储,而且备选属性树可以有效的描述属性间的语义关系.在现实领域中的试验证明,这一框架结构可以自动的抽取Deep Web表单属性并有效的生成查询条件.(本文来源于《小型微型计算机系统》期刊2009年05期)

李炜[8](2008)在《数字信息组织的信息抽取在数字图书馆中的实例》一文中研究指出本文把信息抽取结合进数字图书馆的叁层架构体系,从数据挖掘、情报搜索以及专家系统叁个方法上出发,结合模板数据挖掘平台,情报自动搜集平台和图书馆大型知识库、数值库设计出了一套信息抽取在数字图书馆里应用的实例。同时,该模型整合进了数字图书馆中的数据库平台、情报咨询平台等服务平台。(本文来源于《浙江高校图书情报工作》期刊2008年06期)

方晓珊,盛焕烨[9](2002)在《中国人名识别中规则抽取的一种基于实例的方法(英文)》一文中研究指出基于规则的命名实体识别系统通常有很好的性能。但是书写规则是一项费时的工作,而且一些出现频率较低的规则容易被忽略。本文介绍一种从实例中获取词典-句法规则的学习方法。我们基于预定义的高频规则自动抽取低频规则并且手工确认新规则和识别出的人名。学到的规则可以加入基于规则的命名实体识别系统的规则库中以识别更多的人名。试验显示使用新规则后从Chinese Treebank中抽取到的人名数增加了14.3%。(本文来源于《第一届学生计算语言学研讨会论文集》期刊2002-08-01)

张绍华,徐林昊,杨文柱,薛文玲,李天柱[10](2001)在《基于样本实例的Web信息抽取》一文中研究指出主要研究了基于HTML文档的信息抽取 ,提出了一种基于样本实例的Web信息抽取的方法 .用户首先选定样本页面和预先定义模式 (基于O -R模型 ) ,然后对样本页面和其中的样本记录进行标记、学习 ,形成信息抽取规则 ,并存入知识库 ;利用知识库对其他同类页面自动抽取所需的信息 ,存入数据库中 .本方法可用于Web查询 ,也可用于信息集成的包装器 .(本文来源于《河北大学学报(自然科学版)》期刊2001年04期)

实例抽取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

知识库构建是语义网发展的重要环节,现在对知识库构建的研究越来越热门,为模式层添加实例的实例抽取技术也变得尤为重要,然而现有的实例抽取技术方法,一方面具有语言依赖的特点,如YAGO知识库,另一方面抽取到的实例-分类关系中分类数量太少,如DBpedia知识库。实例抽取的数据源分为无结构的网络资源和有结构的开放链接数据,无结构的网络资源包含有大量噪音数据,提取高质量实例难度较大,而有结构的开放链接数据包含有结构良好的数据,有利于抽取高质量的实例。另外,现有知识库的中文实例信息相对较少。总体来看,为了实现将来的复杂实例抽取,如何在中文开放链接数据中抽取出高质量的实例-分类关系是一个重要的研究问题。基于以上现状,本文对实例抽取技术进行了深入研究,并设计了一个基于中文开放链接数据的实例抽取方法,该方法的主要贡献如下:(1)提出了基于实体属性和分类属性的实例抽取算法,并在中文百科类站点数据中抽取了大量的高质量分类-实例关系叁元组。(2)提出的属性传递算法,为中文百科站点数据中的42,934个分类补全了高质量的分类属性。(3)对补全的分类属性和抽取的分类-实例关系叁元组做了准确率实验评估,两者的准确率分别高于88%和91%。与DBpedia、YAGO和BabelNet数据集比较,本文得到的数据有数量最多的中文分类-实例关系叁元组,并且具有更合适的粒度。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

实例抽取论文参考文献

[1].孙义.中石油评审自动化专家抽取系统实例[J].中国招标.2018

[2].凌绍伟.基于中文开放链接数据的实例抽取技术研究[D].东南大学.2015

[3].李文锦,王康健.源代码中设计模式实例的抽取及验证方法研究[J].计算机应用研究.2012

[4].郭剑毅,李真,余正涛,张志坤.领域本体概念实例、属性和属性值的抽取及关系预测[J].南京大学学报(自然科学版).2012

[5].许旭阳,李弼程,张先飞,韩永峰.基于事件实例驱动的新闻文本事件抽取[J].计算机科学.2011

[6].尹津其.基于WEB的数据抽取及应用实例[J].中国新技术新产品.2009

[7].梁浩,左万利,任斐,赫枫龄.基于本体实例信息的深度网表单属性自动抽取[J].小型微型计算机系统.2009

[8].李炜.数字信息组织的信息抽取在数字图书馆中的实例[J].浙江高校图书情报工作.2008

[9].方晓珊,盛焕烨.中国人名识别中规则抽取的一种基于实例的方法(英文)[C].第一届学生计算语言学研讨会论文集.2002

[10].张绍华,徐林昊,杨文柱,薛文玲,李天柱.基于样本实例的Web信息抽取[J].河北大学学报(自然科学版).2001

标签:;  ;  ;  ;  

实例抽取论文-孙义
下载Doc文档

猜你喜欢