导读:本文包含了自动标引与自动分类论文开题报告文献综述及选题提纲参考文献,主要关键词:UCL,信息技术,网页信息,自动分类
自动标引与自动分类论文文献综述
李丹阳[1](2013)在《基于UCL的网页信息自动分类及标引技术研究》一文中研究指出在信息技术的不断发展中,人们对信息服务的要求越来越高,特别是信息服务的质量以及个性化受到人们的广泛关注。本文笔者在UCL的基础上,对网页信息的自动分类和标引技术进行了分析和探讨,目的是为提高信息服务的质量和水平提供指导和借鉴,进而有效的提高信息服务的质量,推动信息技术的健康可持续发展,最终实现信息资源的合理整合,满足用户的个性化需求。(本文来源于《计算机光盘软件与应用》期刊2013年07期)
顾波[2](2009)在《中文图书自动标引与自动分类加权设计研究》一文中研究指出作为传统的手工查阅基础的人工标引分类是一项脑力劳动大、主观因素强、细之又细的工作,且周期长、成本高、效率低,不能满足信息成本指数增长、信息及时更新和数据制作标准化的要求。计算机技术的不断进步为分类自动标引提供了广阔发展空间,利用计算机提取主题词、分类号,将根本改变手工操作的落后状况,并将数据库的管理推向标准化、兼容化。(本文来源于《黑龙江史志》期刊2009年05期)
傅亮[3](2007)在《基于《军事信息资源分类法》标引经验的自动分类模式构想》一文中研究指出从目前数字图书馆的实际困难出发,提出一个依托《军事信息资源分类法》,挖掘人工标引经验,用之于自动分类的方案。(本文来源于《现代图书情报技术》期刊2007年11期)
[4](2007)在《基于知识库的中文信息自动标引及自动分类》一文中研究指出南京农业大学侯汉清教授承担的国家社科基金项目"基于知识库的网页自动标引和自动分类研究"(批准号为02BTQ012),近期结项,成果鉴定等级为良好。(本文来源于《江苏社会科学》期刊2007年06期)
何琳,侯汉清[5](2006)在《基于标引经验和机器学习相结合的多层自动分类》一文中研究指出由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度叁元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。(本文来源于《中国索引》期刊2006年01期)
薛春香,夏祖奇,侯汉清[6](2005)在《基于语料和基于标引经验的自动分类模式比较》一文中研究指出从原理、系统设计、知识库构建、分类算法、性能等方面对自动分类的两种模式———基于训练语料和基于人工标引经验———进行介绍和比较,这两种分类模式都具有一定的可行性。基于训练语料的自动分类模式完全依靠机器学习从训练集中发现类目的特征,数学论证充分,易于维护,比较适合于面向行业和主题的粗分类,但是过分强调了机器学习的效能,忽略了人工智力劳动成果的利用,训练过程和分类过程运算量,算法复杂;而基于标引经验的自动分类模式利用简单的统计学方法从书目数据库中挖掘人工标引经验,适用于面向体系分类法的详细分类,分类算法简单,运算量小,但过分依赖经验,缺乏有说服力的数学证明。知识库的完备性和合理性是影响两者分类效能的主要因素,是两者面临的共同问题。(本文来源于《南京农业大学学报(社会科学版)》期刊2005年04期)
何琳,侯汉清[7](2005)在《基于标引经验和机器学习相结合的多层自动分类》一文中研究指出由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡, 导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度叁元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。(本文来源于《2005年中国索引学会年会暨学术研讨会论文集》期刊2005-10-01)
邓茜,林红[8](2005)在《中文新闻信息自动分类标引的构想与实现》一文中研究指出《中文新闻信息分类》标准经过历时一年8个月的研制及反复检测论证,在2005年9月2日专家评审会上,标准审查委员会一致通过对《中文新闻信息分类》国家标准(送审稿)的审查,建议标准起草组尽快形成报批稿,上报国家标准化管理委员会作为推荐性国家标准发布实施。作为(本文来源于《中国传媒科技》期刊2005年09期)
薛春香,夏祖奇,侯汉清[9](2005)在《基于语料和基于标引经验的自动分类模式比较》一文中研究指出以传统文献分类体系为框架,构建知识库或分类器来实现信息的自动分类是信息加工自动化的一个发展方向。这种自动分类系统一般有两种模式:基于训练语料和基于人工标引经验。我实验室分别在这两种模式的基础上设计开发了两个不同的自动分类系统。本文将详细介绍这两个自动分类系统的结构、设计及其构建,然后分别从原理、知识库构建、分类算法等方面对这两者进行比较分析。(本文来源于《中国索引》期刊2005年01期)
薛春香,夏祖奇,侯汉清[10](2004)在《基于语料和基于标引经验的自动分类模式比较》一文中研究指出以传统文献分类法为框架,构建知识库或分类器来实现信息自动分类是信息加工自动化的一个发展方向。这种自动分类系统一般有两种模式:基于训练语料的和基于人工标引经验的。本文就这两种模式的自动分类系统(基于关联概念空间的自动标引和自动分类系统和基于《中图法》知识库的自动标引和自动分类系统)的结构、设计与构建作一详细介绍,然后分别从原理、知识库构建、分类算法、性能等方面对这两者进行简明扼要的比较,以此来探讨中文信息自动分类的发展方向。(本文来源于《NCIRCS2004第一届全国信息检索与内容安全学术会议论文集》期刊2004-11-01)
自动标引与自动分类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
作为传统的手工查阅基础的人工标引分类是一项脑力劳动大、主观因素强、细之又细的工作,且周期长、成本高、效率低,不能满足信息成本指数增长、信息及时更新和数据制作标准化的要求。计算机技术的不断进步为分类自动标引提供了广阔发展空间,利用计算机提取主题词、分类号,将根本改变手工操作的落后状况,并将数据库的管理推向标准化、兼容化。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
自动标引与自动分类论文参考文献
[1].李丹阳.基于UCL的网页信息自动分类及标引技术研究[J].计算机光盘软件与应用.2013
[2].顾波.中文图书自动标引与自动分类加权设计研究[J].黑龙江史志.2009
[3].傅亮.基于《军事信息资源分类法》标引经验的自动分类模式构想[J].现代图书情报技术.2007
[4]..基于知识库的中文信息自动标引及自动分类[J].江苏社会科学.2007
[5].何琳,侯汉清.基于标引经验和机器学习相结合的多层自动分类[J].中国索引.2006
[6].薛春香,夏祖奇,侯汉清.基于语料和基于标引经验的自动分类模式比较[J].南京农业大学学报(社会科学版).2005
[7].何琳,侯汉清.基于标引经验和机器学习相结合的多层自动分类[C].2005年中国索引学会年会暨学术研讨会论文集.2005
[8].邓茜,林红.中文新闻信息自动分类标引的构想与实现[J].中国传媒科技.2005
[9].薛春香,夏祖奇,侯汉清.基于语料和基于标引经验的自动分类模式比较[J].中国索引.2005
[10].薛春香,夏祖奇,侯汉清.基于语料和基于标引经验的自动分类模式比较[C].NCIRCS2004第一届全国信息检索与内容安全学术会议论文集.2004