一、如何提高引公文主题词的精确性(论文文献综述)
刘为[1](2018)在《基于语义网的傣族历史档案信息资源开发研究》文中指出随着人类认知世界和改造世界的能力不断增强,计算机技术与网络技术也飞速发展。万维网(World Wide Web)作为互联网(Internet)的一种应用成为了人们在网络环境中最常用的平台与工具。在Web1.0环境中,人们只能单向被动地阅读和获取信息;在Web2.0环境中,所有人既可以作为信息的接收者也可以作为信息的创造者和提供者在这一全球化信息空间中进行信息交流。为适应人们不断升级的信息需求,语义网(Semantic Web)作为Web3.0的主要组成部分被提出。信息资源在语义网中被层层递进相互继承的置标语言在不同粒度、维度、层次上进行描述与揭示,从而使得这些信息资源能够被机器处理和理解。语义网打破了机器与机器之间、人类与机器之间的壁垒,使得人类获取信息和知识的方式内容以及人类社会的运作模式呈现出全方位的关联性与智能化。在语义网环境下,利用相关语义方法与技术对信息资源进行开发和管理,能充分挖掘信息资源的价值并在最大程度和范围内发挥其作用。傣族历史档案信息资源作为我国档案信息资源体系中的重要组成部分和人类知识资源中不可替代的部分,也应顺应这一趋势被开发管理。本文首先结合现有研究基础和傣族历史档案实际管理工作情况,对傣族历史档案信息资源进行了重新界定,并结合语义网的特性为档案信息资源开发赋予了新的内涵。接着,本文针对基于语义网的傣族历史档案信息资源开发工作在微观、中观、宏观三个层面上的实施进行了论述。微观层面,本文根据傣族历史档案信息资源的特性对其进行了科学分类,设计了傣族历史档案信息资源元数据方案以期能够充分揭示其各方面的特征,在此基础上提出构建傣族历史档案信息资源本体,并以傣族医药知识领域本体构建为例说明了该工作实施的方法和优越性,实现了傣族历史档案信息资源的语义组织。中观层面,本文提出基于关联数据技术将傣族历史档案信息资源创建为关联数据集,并构建了基于关联数据的傣族历史档案信息资源整合模型,实现了傣族历史档案信息资源在档案馆之间、与其他信息机构之间、以及语义网信息空间中其他信息源之间的资源整合与知识融合。宏观层面,为实现和保障前两个层面的工作,本文提出在语义网环境下传统档案信息资源开发工作模式应实现转型,并融合政策法规、标准规范、合作交流、人才培养等方面构建了相关保障机制,从现实层面提供了基于语义网的傣族历史档案信息资源开发实施策略。
陈欢[2](2014)在《面向垂直搜索引擎的聚焦网络爬虫关键技术研究与实现》文中研究表明随着Internet的飞速发展,信息资源的规模已变得极其庞大。在海量的网络信息资源中,快速、精确地找到用户所需的信息变得日益困难。此时,搜索引擎应运而生。搜索引擎为用户查找信息提供了极大地便利,故而被人们广泛使用。网络爬虫是搜索引擎的核心模块,负责采集网络上的各种网页。网络爬虫的爬行策略和性能极大地影响了搜索引擎的服务质量,因此,网络爬虫值得研究与改良。由于庞大的网络规模和及时响应需求,通用搜索引擎提供的检索结果往往充斥着许多无关数据,无法令用户满意。垂直搜索引擎,是为提供更细致精准的搜索服务而发展的新一代搜索引擎。本文的研究对象是垂直搜索引擎中的聚焦网络爬虫。聚焦爬虫专注于特定领域的信息采集,它的资源采集效率较高。聚焦爬虫为爬虫领域的发展提供了新的思路,具有较高的研究、实用价值。本文首先概述了搜索引擎的发展状况和网络爬虫的研究现状,阐述了搜索引擎的基本原理及工作流程,然后深入探讨了聚焦爬虫系统所涉及的各项关键技术。最后基于上述理论给出了一个聚焦爬虫系统的工程化实现。本文在聚焦爬虫系统的爬行策略上,借鉴Fish-Search算法与Shark-Search算法的算法流程,在其基础上动态地调节主题相关度的闽值,以避免主题网页团之间的隧道问题。同时本文借用了成熟的文本分析方法,即向量空间模型中的TF-IDF算法,通过改进的方法来计算网页的主题相关度与URL链接的主题相关度。在网页的正文内容提取方面,利用网页的标签树结构,通过计算文字/标签密度来提取网页正文。实验表明,与以传统方法实现的聚焦爬虫系统相比,本文实现的聚焦爬虫系统虽然在爬行的准确率上略有下降,但其能获得更高的主题资源发现率,在两者之间取得一个较好的平衡。
程道光[3](2009)在《行政公文语义的模糊语义学研究》文中认为模糊语义学研究对象是语素、词和词组的模糊性,它的研究涉及语义模糊性、明晰性、模糊度、范畴等概念。模糊性是人类语言的自然属性,语言系统各个层次上都存在着程度不同的模糊,模糊语言学认为对自然语言中的语言单位或语言模式分析时会表现出不确定性。行政公文作为公众事物的信息载体要求真实、准确地传达语言信息,语体色彩具有明晰、简洁、庄重、模式的特征,要求用词确切。本文围绕行政公文中词语的模糊性和明晰性展开论述,应用模糊语义学理论研究行政公文语境中行政公文用词规律及其语义模糊性。以行政公文语境为研究出发点,主要分析行政公文中的时间范畴、方位范畴、指代范畴、事物范畴、颜色范畴、称谓范畴、数量范畴、行为动作和心理活动范畴词语(语素、词或词组)的用词规律和模糊语义。论文通过对行政公文语义模糊性及其与行政公文语体色彩明晰性的特征分析,表明模糊与明晰共处于语言的统一体中,是语言两种相互对立又相互联系的属性。
胡岩洁[4](2008)在《基于本体的政务信息资源共享研究》文中研究说明迅猛发展的信息化技术使电子政务领域所积累的信息资源飞速增长。政府是最大的信息创建者、采集者、分布者和消费者。根据国外的测算数据,政务信息资源约占社会信息资源总量的80%,这些信息资源形式多样、缺乏统一的描述方式,无序的管理现状导致政务信息资源的应用效果极为低下。如何使政务信息资源的共享更加顺畅,如何减小信息资源标注的工作量,提高信息资源查询的效率,是现在政务信息资源共享实施所面临的难点。本文首先对相关研究进行了综述,包括信息资源管理理论的发展、政务信息资源的定义、分类及表示方法,介绍了语义网相关技术——本体的定义、表示和构建。针对电子政务信息资源管理现状,本文深入分析现有的政务信息资源组织典型模式——元数据方案与搜索技术方案,最终提出结合本体的政务信息资源组织方式。在此基础上本文进一步设计了基于本体的政务信息资源共享系统框架,并对框架的功能模块作了详细的介绍。实现这一系统功能的基础在于政务领域本体的开发实现。本文探索利用电子政务主题词表构建政务领域本体的可行性,并基于这一方法开发了以“政务信息资源主题”为核心的小型领域本体。本文在最后探讨基于本体的政务信息资源共享系统功能实现,包括最重要的两个功能:语义标注与语义检索,详细阐述了实现算法,并借助“政务信息资源主题”本体,通过政府信息公开目录中的多个实例来模拟实现了语义标注和语义检索流程,验证了系统的运行效果。通过对资源内容的语义描述,原型系统能够基于领域知识语义相关的概念,帮助用户合理利用更多相关信息资源。
李雄波[5](2007)在《知识表示在教学领域的应用研究 ——《教育信息处理》的知识表示》文中提出在知识经济时代,知识爆炸性地增长,知识工程随之得到了快速的发展。作为知识工程学的基本组成部分,知识表示日益受到重视。在理论上,知识工程学的学科理论体系的完善,有利于知识表示理论基础的日趋成熟。在实践上,专家系统的两大核心——后台知识库和推理机,两个模块的设计都与知识表示有着紧密联系。结合专家系统的应用,我们可以看出,知识表示在学科教学领域将有着非常广泛的前景。特别是语义网络知识表示方法,有助于体现学科知识点之间的联系,便于学习者更加系统地掌握知识。就目前所开发的课程学习平台而言,其后台知识库大多数是采用多维向量集表示知识点的,推理过程是对多维向量集的精确匹配或模糊匹配。学习者无法了解知识点之间的联系,而且当向量的维度较大时,会相应地增加检索、查询知识库的难度。鉴于此,研究知识表示在学科领域的应用具有重要的现实意义。本研究是针对基于知识表示的课程学习平台,旨在以多样化的知识表示方法构建后台知识库,根据知识点本身的类型特点选取合适的一种或多种知识表示方法。据此,学习者可以清晰地了解知识点之间的联系,在检索、查询知识库时能较迅速地找到所需的知识点。并以本专业的基础课程《教育信息处理》为例,设计了基于知识表示的课程学习平台的模型。根据国际经济合作组织的知识分类标准,对事实知识、原理知识、技能知识采取产生式规则、框架、语义网络等知识表示方法,存储于各个子知识库中。利用中间件——知识处理器,搭建起用户学习平台与知识库之间沟通的桥梁,很好地解决了以往专家系统在学科领域中应用所遇到的问题,并将随着知识表示的发展,进一步深化在学科领域的应用。
王礼胜[6](2003)在《论现代汉语的公文语体词》文中研究表明本文从词语运用所反映出的语体色彩出发,对语体词和公文语体词进行了界定,并概括出公文语体词的两大基本类型:专用公文语体词和常用公文语体词。 本文结合具体语料,充分考虑具体的语境因素,着重从语用及相关特点等方面分析概括了文种词、程式化词语等专用公文语体词和文言词、四字格、三字格、缩略语、模糊词等常用公文语体词的运用形式。本文还就公文语体词在现代汉语词汇发展中的作用进行了探讨和分析,并对运用中存在的问题和发展趋势作了简单的说明,力图能够较为系统的阐述公文语体词。
肖明[7](2001)在《WWW科技信息资源自动标引的理论与实践研究》文中指出随着因特网的迅速发展和广泛应用,它逐渐成为目前最大的信息资源宝库和最主要的信息交流渠道,由于因特网信息资源的显着特点是量大而无序,故随之出现了“数据丰富,知识贫乏”现象。现有的搜索引擎大多是基于关键字的全文检索系统,较少考虑信息的语义问题,因而不能够满足用户的不同需求,广大用户也很难利用它们来获取因特网中许多有价值的知识。为此,本论文针对WWW科技信息资源自动标引展开理论和实践两方面的研究,其主要研究目的如下:为处理因特网信息资源提供技术支持,为普通用户检索因特网信息资源提供便利,为建设中国数字图书馆提供新的研究思路。 论文提出了基于《中国分类主题词表》的WWW科技信息资源自动标引系统(STAI)设计方案,该系统具有WWW网页的格式自动检测与转换、自动分词与自由词标引、自动分类标引和主题标引等功能。STAI系统是一个自动化程度较高的易用型软件,该试验系统可以同时实现中英文网页的自动标引,兼顾了如何结合自然语言与情报检索语言二者在信息检索方面各自的优越性。在STAI系统设计和实践过程中,本论文做出了一定的创新性尝试。例如,采用了结构化程序设计方法等先进的程序设计思想,重视ActiveX控件的设计和应用,其目的都是为了提高程序代码的可重用性和可移植性;论文中首次提出了“类目短语”这一新概念,设计了将自然语言与情报检索语言紧密结合的若干对应表,比如用于实现自动分类标引和自动主题标引的“类目短语-主题词对应表”、“主题词-分类号对应表”等。以上研究成果,为今后进一步研制具有自主知识产权的WWW科技信息资源自动标引软件产品奠定了良好的基础。 此外,笔者还对文献自动标引的理论和方法进行了系统化的梳理,文中引用的大量参考文献对于从事相关领域研究的人员来说具有较高的参考价值。
孙天军[8](2001)在《如何提高引公文主题词的精确性》文中指出 从当前的机关工作实践来看,在公文主题词标引上还存在着一些问题。具体表现为:标引的随意性较大,错标、漏标的现象比较突出。解决这些问题,唯有熟练掌握公文主题词的标引规则、方法和技巧。笔者结合工作实践,谈一下正确标引公文主题词的粗浅认识。一、搞好主题分析主题分析就是根据公文标引和检索的需要,对公文内容进行分析,从中提炼出该公文的主题概念,并确定主题类型和结构,并以此为依据,选择恰当的主题词作为公文的检索标识。主题分析是主题词标引的第一步,也是
韩军[9](2000)在《论档案主题标引》文中提出 一、引言档案自古至今以其独特的魅力在人类社会活动中占有举足轻重的地位。如何保存、利用好档案,充分发挥其价值,始终是档案工作的永恒主题和最终目的。随着档案数量的无限制增长,查阅档案成了“众里寻她千百度’。要想快速、准确地查到所需档案,保证检索质量,就必须做好档案的标引工作。档案标引分为分类标引和主题标引。由于分类标引工作比较规范,在这里不再论述,本文仅论述档
张小维[10](1999)在《试论加强文件管理的必要性》文中认为论述文件与档案的关系,分析提高文件管理的具体措施,强调加强文件管理的重要性。
二、如何提高引公文主题词的精确性(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、如何提高引公文主题词的精确性(论文提纲范文)
(1)基于语义网的傣族历史档案信息资源开发研究(论文提纲范文)
中文摘要 |
abstract |
1 绪论 |
1.1 研究背景和意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究现状与评析 |
1.2.1 语义网国内外研究现状 |
1.2.2 傣族历史档案信息资源开发研究现状 |
1.2.3 相关研究述评 |
1.3 研究内容与设计 |
1.3.1 研究内容 |
1.3.2 思路设计 |
1.4 创新点 |
2 相关概念与理论阐述 |
2.1 傣族历史档案信息资源开发相关概念和理论 |
2.1.1 傣族历史档案信息资源相关概念 |
2.1.2 傣族历史档案信息资源开发相关理论 |
2.2 语义网相关理论 |
2.2.1 语义网概述 |
2.2.2 语义网信息组织方法与本体理论 |
2.2.3 语义网最佳实践——关联数据 |
2.3 语义网和傣族历史档案信息资源开发的关系 |
2.3.1 语义网是傣族历史档案信息资源开发的外部环境 |
2.3.2 语义网为傣族历史档案信息资源开发提供技术方法 |
2.3.3 语义网的实现得益于傣族历史档案信息资源开发 |
3 基于语义网的傣族历史档案信息资源开发总体方案设计 |
3.1 傣族历史档案信息资源开发管理工作现状 |
3.1.1 收集与保管的现状 |
3.1.2 整理、翻译和编目的现状 |
3.1.3 传播和传承的现状 |
3.2 基于语义网的傣族历史档案信息资源开发的必要性 |
3.2.1 必需手段:充分实现傣族历史档案信息资源的价值 |
3.2.2 必要条件:发挥档案工作作用和适应学科发展规律 |
3.2.3 必需方法:顺应社会发展规律和满足社会利用需求 |
3.3 基于语义网的傣族历史档案信息资源开发的可行性 |
3.3.1 实体储备与数字资源基础 |
3.3.2 业务规范与技术标准支持 |
3.3.3 理论研究和实现方法参考 |
3.4 基于语义网的傣族历史档案信息资源开发工作内容与方法 |
3.4.1 基于语义网的傣族历史档案信息资源开发工作内容与基本任务 |
3.4.2 基于语义网的傣族历史档案信息资源开发实施步骤与技术方法 |
4 傣族历史档案信息资源的语义组织 |
4.1 傣族历史档案信息资源的分类 |
4.1.1 傣族历史档案信息资源的分类现状 |
4.1.2 傣族历史档案信息资源分类体系构建 |
4.2 傣族历史档案信息资源元数据方案设计 |
4.2.1 傣族历史档案信息资源元数据方案设计原则与步骤 |
4.2.2 傣族历史档案信息资源相关元数据方案分析 |
4.2.3 傣族历史档案信息资源元数据方案构建 |
4.3 傣族历史档案信息资源本体构建 |
4.3.1 傣族历史档案信息资源本体构建原则 |
4.3.2 傣族历史档案信息资源本体构建方法与工具 |
4.3.3 傣族历史档案信息资源本体构建的实现——以傣族医药本体构建为例 |
5 基于语义网的傣族历史档案信息资源整合 |
5.1 基于语义网的傣族历史档案信息资源整合的目标与任务 |
5.1.1 基于语义网的傣族历史档案信息资源整合目标 |
5.1.2 基于语义网的傣族历史档案信息资源整合任务 |
5.2 基于语义网的傣族历史档案信息资源整合模型设计 |
5.2.1 基于关联数据的傣族历史档案信息资源整合的优势分析 |
5.2.2 基于关联数据的傣族历史档案信息资源整合参考模型 |
5.2.3 基于语义网的傣族历史档案信息资源整合模型构建 |
5.3 基于语义网的傣族历史档案信息资源整合实现方法 |
5.3.1 傣族历史档案关联数据创建模块的实现方法 |
5.3.2 傣族历史档案关联数据发布模块的实现方法 |
5.3.3 傣族历史档案关联数据融合模块的实现方法 |
6 基于语义网的傣族历史档案信息资源开发实现策略 |
6.1 面向语义网环境的档案信息资源开发工作模式转型 |
6.1.1 传统档案信息资源开发工作模式的局限性 |
6.1.2 基于语义网的档案信息资源开发工作模式 |
6.2 基于语义网的傣族历史档案信息资源开发保障机制构建 |
6.2.1 意识观念与政策法规保障机制 |
6.2.2 组织管理体制与合作交流机制 |
6.2.3 标准规范建设与人才培养机制 |
总结与展望 |
参考文献 |
攻读博士学位期间完成的科研成果 |
致谢 |
(2)面向垂直搜索引擎的聚焦网络爬虫关键技术研究与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 概述 |
1.1.1 Internet的发展 |
1.1.2 搜索引擎的发展 |
1.2 国内外相关技术发展现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 本文研究内容与组织结构 |
第二章 爬虫体系结构研究 |
2.1 搜索引擎概述 |
2.1.1 搜索引擎基本原理 |
2.1.2 通用搜索引擎的局限 |
2.1.3 垂直搜索引擎概述 |
2.2 网络爬虫研究 |
2.2.1 通用爬虫基本原理及结构 |
2.2.2 聚焦爬虫系统结构 |
2.2.3 主题页面的分布特性 |
2.3 本章小结 |
第三章 聚焦网络爬虫关键算法的研究与改进 |
3.1 主题爬行策略研究与改进 |
3.1.1 基于网页链接结构的爬行策略 |
3.1.2 基于网页内容的爬行策略 |
3.1.3 其它策略 |
3.1.4 改进的爬行策略 |
3.2 主题相关度计算方法 |
3.2.1 基于向量空间模型计算文本相似度 |
3.2.2 网页主题相关度计算方法 |
3.2.3 链接主题相关度计算方法 |
3.3 网页内容的提取 |
3.3.1 HTML简介 |
3.3.2 标签树的建立 |
3.3.3 基于文字/标签密度的网页正文提取方法 |
3.4 URL链接去重 |
3.5 中文分词 |
3.5.1 中文分词算法 |
3.5.2 jieba分词系统 |
3.6 本章小结 |
第四章 基于改进爬行策略的聚焦爬虫系统设计 |
4.1 聚焦爬虫系统的总体架构 |
4.1.1 聚焦爬虫系统模块设计 |
4.1.2 聚焦爬虫系统流程设计 |
4.2 网页采集模块 |
4.2.1 HTTP协议简介 |
4.2.2 判断网页编码 |
4.2.3 Gzip压缩编码传输 |
4.2.4 采集模块流程 |
4.3 文本相似度计算模块 |
4.4 线程池工作模块 |
4.5 本章小结 |
第五章 系统实现及实验分析 |
5.1 系统的实现 |
5.1.1 实验环境 |
5.1.2 实验过程 |
5.1.3 相关度阈值的设定 |
5.2 实验与分析 |
5.2.1 评价方法 |
5.2.2 实验分析 |
5.3 本章小结 |
第六章 结束语 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(3)行政公文语义的模糊语义学研究(论文提纲范文)
摘要 |
Abstract |
中文文摘 |
第一章 绪论 |
第一节 模糊语言学研究成果和语义模糊性 |
第二节 本文研究新视野和资料来源 |
第二章 行政公文与模糊语义 |
第一节 行政公文及其语境 |
第二节 模糊语义学和公文语义研究对象 |
第三节 模糊语义的语用价值 |
第四节 行政公文的语义模糊性 |
第三章 行政公文语义范畴及其语义模糊性 |
第一节 行政公文时间范畴词语的模糊性 |
第二节 行政公文方位范畴词语的模糊性 |
第三节 行政公文称谓范畴词语的模糊性 |
第四节 行政公文指代范畴词语的模糊性 |
第五节 行政公文事物范畴词语的模糊性 |
第六节 行政公文数量范畴词语的模糊性 |
第七节 行政公文颜色范畴词语的模糊性 |
第八节 行政公文行为动作及心理活动范畴词语的模糊性 |
第四章 结论 |
附录:近10年模糊语义学相关研究成果目录 |
参考文献 |
攻读学位期间承担的科研任务与主要成果 |
致谢 |
个人简历 |
(4)基于本体的政务信息资源共享研究(论文提纲范文)
摘要 |
ABSTRACT |
图例 |
表格 |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 政务信息资源是最重要的一类信息资源 |
1.1.2 信息共享是政务信息资源管理的关键一环 |
1.2 课题背景 |
1.3 研究内容 |
1.4 研究方法 |
1.5 文章结构 |
第二章 政务信息资源管理相关理论综述 |
2.1 信息资源管理理论 |
2.1.1 基本概念研究 |
2.1.2 信息资源管理体系研究 |
2.1.3 管理研究角度分析 |
2.2 政务信息资源共享研究 |
2.2.1 政务信息资源的定义和分类 |
2.2.2 政务信息资源共享的技术实现 |
2.2.3 政务信息资源共享的管理问题 |
2.3 本章小结 |
第三章 本体及其构建技术 |
3.1 本体概念与分类 |
3.1.1 本体(Ontology)的定义 |
3.1.2 本体的分类 |
3.2 本体表示与语言 |
3.2.1 本体建模原语 |
3.2.2 本体语言 |
3.3 本体构建技术 |
3.3.1 本体构建的准则 |
3.3.2 本体构建方法 |
3.3.3 本体构建工具 |
3.4 本体应用 |
3.5 本章小结 |
第四章 政务信息资源组织模式分析 |
4.1 政务信息资源的类型 |
4.2 基于元数据的政务信息资源组织 |
4.1.1 元数据标准 |
4.1.2 基于元数据的政府信息共享——以GILS为例 |
4.3 基于信息门户与搜索引擎的政务信息资源组织 |
4.4 组织模式的比较与分析 |
4.4.1 元数据组织模式的优势 |
4.4.2 "信息门户+搜索引擎"组织模式的优势 |
4.4.3 实用效果评价 |
4.4.4 组织模式分析 |
4.5 结合本体的政务信息资源组织模式 |
4.6 本章小结 |
第五章 基于本体的政务信息资源共享系统框架 |
5.1 基于领域知识的政务信息资源共享需求 |
5.2 设计目标 |
5.3 系统框架 |
5.4 数据分布 |
5.5 各功能模块 |
5.5.1 自动标注模块 |
5.5.2 服务处理模块 |
5.5.3 信息资源元数据库管理模块 |
5.5.4 本体维护模块 |
5.6 访问控制与安全策略 |
5.6.1 信息资源的控制策略 |
5.6.2 系统安全结构设计 |
5.6.3 内外网信息交换安全 |
5.7 本章小结 |
第六章 政务领域本体构建—实例 |
6.1 基于主题词表的领域本体构建方法 |
6.1.1 主题词表概述 |
6.1.2 主题词表与领域本体的比较 |
6.1.3 基于主题词表构建领域本体的优越性 |
6.1.4 基于主题词表构建领域本体的方法 |
6.2 电子政务领域本体的构建基础——电子政务主题词表 |
6.2.1 电子政务主题词 |
6.2.2 电子政务主题词表 |
6.3 "政务信息资源主题"相关的电子政务领域本体构建过程 |
6.3.1 选择构建工具与语言 |
6.3.2 确定本体的构建需求,界定其构建领域和范围 |
6.3.3 领域信息的收集以及重点概念和关系的确定 |
6.3.4 建立本体的框架结构 |
6.3.5 定义类 |
6.3.6 定义类的属性 |
6.3.7 为类创建实例 |
6.3.8 本体的OWL编码 |
6.3.9 本体的进化 |
6.4 本章小结 |
第七章 政务信息资源共享的关键功能实现 |
7.1 语义标注功能 |
7.1.1 政务信息资源语义标注基础——元数据 |
7.1.2 语义标注的实现思路 |
7.1.3 政务信息资源语义标注实例 |
7.2 语义检索功能 |
7.2.1 语义检索的实现思路 |
7.2.2 政务信息资源语义检索实例 |
7.3 本章小结 |
第八章 结论与展望 |
8.1 结论 |
8.2 研究局限以及未来研究展望 |
参考文献 |
致谢 |
(5)知识表示在教学领域的应用研究 ——《教育信息处理》的知识表示(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
图表目录 |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目标 |
1.3 研究意义 |
1.4 论文框架 |
第2章 知识表示在教学领域的应用 |
2.1 知识表示的内涵与机制 |
2.2 知识表示的应用实例 |
2.3 知识表示在教学领域的应用前景 |
第3章 《教育信息处理》的知识表示 |
3.1 《教育信息处理》课程的分析 |
3.2 《教育信息处理》的知识表示 |
第4章 基于知识表示的教育信息处理学习系统的设计 |
4.1 基于知识表示的教育信息处理学习系统的设计思想 |
4.2 学习系统设计的关键技术 |
4.3 基于知识表示的教育信息处理学习系统的模型 |
第5章 研究总结、反思和展望 |
5.1 研究工作总结 |
5.2 研究反思 |
5.3 研究展望 |
参考文献 |
后记 |
(6)论现代汉语的公文语体词(论文提纲范文)
中文摘要 |
英文摘要 |
引论 |
第一节 公文语体词的界定 |
一 语体词 |
二 公文语体词 |
第二节 对公文语体词使用现状的分析 |
一 专用公文语体词 |
二 常用公文语体词 |
第三节 公文语体词在现代汉语词汇发展中的作用 |
一 产生了大量的新造词 |
二 增强词语的表达效果 |
结论 |
参考文献 |
后记 |
(7)WWW科技信息资源自动标引的理论与实践研究(论文提纲范文)
第1章 引论 |
1.1 研究背景 |
1.2 研究目的 |
1.3 研究意义 |
1.4 主要技术难点 |
1.5 论文的组织安排 |
第2章 书面汉语自动分词 |
2.1 书面汉语自动分词概述 |
2.1.1 书面汉语自动分词的研究意义 |
2.1.2 书面汉语自动分词的难点 |
2.2 书面汉语自动分词方法评介 |
2.2.1 基于字符串匹配的分词方法(机械匹配法) |
2.2.2 基于理解的分词方法 |
2.2.3 基于统计的分词方法 |
2.2.4 基于标志的分词方法 |
2.2.5 基于神经网络的分词方法 |
2.3 主要书面汉语自动分词系统评介 |
第3章 文献自动标引 |
3.1 自动标引相关概念 |
3.1.1 文献标引 |
3.1.2 文献自动标引 |
3.2 英语文献自动标引方法 |
3.3 汉语文献自动标引方法 |
第4章 文献自动分类 |
4.1 文献自动分类概述 |
4.1.1 文献自动分类的研究意义 |
4.1.2 文献自动分类的主要方法 |
4.2 自动分类国外研究概况 |
4.3 自动分类国内研究概况 |
4.3.1 基于词典法的中文自动分类系统 |
4.3.2 基于专家系统的中文自动分类系统 |
4.3.3 现有中文自动分类系统存在的缺陷 |
4.4 自动分类的未来发展方向 |
第5章 STAI系统的总体设计思想 |
5.1 STAI系统概述 |
5.2 STAI系统的功能设计 |
5.2.1 网页格式的自动检测与转换 |
5.2.2 关键词的自动抽取 |
5.2.3 WWW网页的自动标引 |
5.3 STAI系统的体系结构设计 |
5.4 STAI系统的开发环境 |
5.4.1 STAI系统的软件开发环境 |
5.4.2 STAI系统的硬件开发环境 |
5.5 STAI系统的数据库设计 |
5.5.1 STAI数据库的概念设计 |
5.5.2 STAI数据库的逻辑设计 |
第6章 格式预处理模块的实现 |
6.1 BIG5/GB码的自动检测和转换 |
6.1.1 BIG5/GB码的自动识别 |
6.1.2 BIG5/GB码的自动转换 |
6.2 创建BIG5/GB内码自动检测和转换ActiveX控件 |
6.2.1 BIG5GBControl控件的创建步骤 |
6.2.2 BIG5GBControl控件的实现情况 |
6.3 因特网文档格式的转换 |
6.3.1 因特网上的主要文档格式 |
6.3.2 将HTML格式自动转换成纯文本格式的实现 |
第7章 自动分词与自由词标引模块的实现 |
7.1 自动分词与自出词标引模块的主要设计思路 |
7.2 构造适用于书面汉语自动分词的机器词典 |
7.2.1 中文词典概况 |
7.2.2 构建适用于WWW科技信息资源自动标引的中文分词词典 |
7.3 自动分词与自由词标引模块的实现情况分析 |
第8章 自动分类和主题标引模块的实现 |
8.1 自动分类和主题标引模块的主要设计思路 |
8.1.1 自动分类和主题标引模块的技术难点 |
8.1.2 自动分类和主题标引模块的主要算法 |
8.2 构造用于自动分类标引和主题标引的分类机器词典 |
8.3 自动分类和主题标引模块的实现情况分析 |
第9章 结束语 |
9.1 研究工作总结 |
9.2 今后研究计划 |
参考文献 |
研究成果和发表文章目录 |
致谢 |
四、如何提高引公文主题词的精确性(论文参考文献)
- [1]基于语义网的傣族历史档案信息资源开发研究[D]. 刘为. 云南大学, 2018(01)
- [2]面向垂直搜索引擎的聚焦网络爬虫关键技术研究与实现[D]. 陈欢. 华中师范大学, 2014(09)
- [3]行政公文语义的模糊语义学研究[D]. 程道光. 福建师范大学, 2009(02)
- [4]基于本体的政务信息资源共享研究[D]. 胡岩洁. 复旦大学, 2008(03)
- [5]知识表示在教学领域的应用研究 ——《教育信息处理》的知识表示[D]. 李雄波. 华东师范大学, 2007(03)
- [6]论现代汉语的公文语体词[D]. 王礼胜. 安徽大学, 2003(01)
- [7]WWW科技信息资源自动标引的理论与实践研究[D]. 肖明. 中国科学院文献情报中心, 2001(01)
- [8]如何提高引公文主题词的精确性[J]. 孙天军. 秘书工作, 2001(01)
- [9]论档案主题标引[J]. 韩军. 机电兵船档案, 2000(03)
- [10]试论加强文件管理的必要性[J]. 张小维. 武汉造船, 1999(01)