信息分类检索论文-黄丽清

信息分类检索论文-黄丽清

导读:本文包含了信息分类检索论文开题报告文献综述及选题提纲参考文献,主要关键词:人工智能技术,数字档案,信息资源,分类

信息分类检索论文文献综述

黄丽清[1](2019)在《浅析人工智能技术在数字档案信息资源分类与检索中的应用和发展》一文中研究指出现代科技推动了数字档案的发展步伐,尤其是人工智能技术的应用,使"互联网+档案建设"成为可能。人工智能技术的优势,体现在数字档案资源收集、分类检索、价值鉴定与安全管理等方面,提高了档案管理工作的智能性,同时也对管理人员的专业技能提出了高要求。本文主要对资源分类检索功能展开分析,希望对数字档案现代化发展起到积极借鉴作用。(本文来源于《中国管理信息化》期刊2019年14期)

王琳[2](2019)在《地震应急指挥系统信息文本的检索与自动分类研究》一文中研究指出我国的地震活动不仅频率高、强度大而且分布十分广泛,由其造成的社会经济损失居于自然灾害首位,因此如何有效的减轻和降低地震造成的社会经济损失,成为地震应急领域探讨和研究工作的重点。与发达国家相比,我国地震应急信息的管理主要存在着以下叁个方面的差异:(1)信息采集手段较单一;(2)信息传送不够及时、准确,甚至存在死角、失真现象;(3)信息获取速度较慢,产出与存储源多样。因此针对目前我国地震应急基础信息多渠道上传模式以及震后大量灾情等信息的纷纭复杂,基于信息检索在智能化领域的快速发展,本文收集了四川省2013年4月20日芦山7.0级地震、2014年11月22日康定6.3级地震、2017年8月8日九寨沟7.0级地震、2017年9月30日广元青川5.4级地震的四次地震应急资料,就我国的地震应急工作以及应急信息的检索分类做了以下分析与研究:(1)详细介绍了我国地震应急的工作体系、工作内容;分析了地震应急信息多渠道源的特点,按照信息产出的空间属性,将信息源划分为地震发生现场信息源和非现场信息源,结合应急信息的服务对象,以地震系统工作内部和工作外部环境来对信息的渠道和用户进行细分。(2)基于近年来专家学者在地震应急信息分类方面的研究成果,以信息服务的高效便捷为目的,按照地震事件的震前、震时、震后时间主线,将地震应急信息分为震前基础背景信息(震区自然灾害以及社会基础背景信息)、地震震情灾情信息(地震本身属性以及其造成的直接、间接损失信息)、震后应急救援信息(应急救援动态行动信息)叁类。(3)通过对文本信息检索方法的学习,考虑到目前地震应急信息手动归类存在的现实困难,基于地震应急信息分类的需求,构建了一种高效便捷的信息分类处理方法。对比分析了信息检索的叁种基本检索模型,采用TF-IDF为权值公式,选取传统的布尔模型(关键词分类法),展开了地震应急信息自动分类的研究。(4)采用“关键词分类法”,对多渠道地震应急信息的自动分类进行研究。主要工作有:1)信息的分类。对收集的应急资料,按建立的分类标准进行分类;2)文本的结构化处理。首先将各类信息集成于一个文本文档(.txt文档),再按动词、名词进行分词、词频统计处理;3)筛选关键词,得到关键词库。选取词频统计top20的词、计算每个词对应的TF-IDF值,按规则手动选取得到关键词库;4)在计算机语言的支持下,按词频所占比例将关键词库划分五个区间,采用布尔模型最大匹配的方式,设计地震应急信息自动分类的实现方法。信息经过结构化规范处理后,选取的震前基础背景信息关键词主要有人口、降水量、GDP等;地震震情灾情信息关键词主要有灾区、震情、余震等;震后应急救援信息关键词主要有绑带、搜救、医疗器材等。由筛选结果来看,各类信息的关键词之间具有一定的辨识度,处理后的信息使得传输的条理性更强,更便于进一步的信息加工与处理。实现地震应急信息的自动分类,能大大的提高信息的利用率,在一定程度上缩短应急信息加工处理与服务的时间,快速高效地为应急指挥提供信息服务。(本文来源于《中国地震局地震预测研究所》期刊2019-06-24)

许奥狄[3](2019)在《信息检索中基于深度学习的文本表示与分类方法研究》一文中研究指出文本表示与分类是支撑高质量信息检索的前提;高稀疏、高维度文本特征和检索准确率低是当前信息检索任务中文本表示与分类方法面临的主要问题。为了准确、高效地检索出目标信息,构建性能优异的文本表示与分类方法已成为信息检索领域的研究热点之一。本文针对多分类、多标签文本表示与分类方法展开了深入研究,主要工作如下:(1)针对传统基于BOW的多分类文本表示与分类方法存在高稀疏、高维度的固有缺点,提出一种融合深度信念网络(Deep Belief Network,DBN)与文本卷积神经网络(Text Convolutional Neural Network,TextCNN)的深度信念卷积神经网络模型(Deep Belief Convolutional Neural Network,DBCNN)。DBCNN模型首先通过DBN预训练,在保留文本有效信息的前提下,对文本特征进行降维;进一步,通过TextCNN对降维的文本特征进行卷积和池化处理,以提取低维度、稠密的文本高层特征向量表示。实验结果表明,DBCNN模型的多分类文本表示与分类性能优于传统方法,准确率平均提高了6.18%;关键词词向量嵌入相比普通词向量嵌入,能有效提高模型的性能;DBN结构中的每层节点数越接近输入词汇的个数,DBCNN模型的性能越好;引入L2正则化和滑动平均模型能有效提高DBCNN模型的分类准确率。(2)针对传统多标签文本表示与分类方法存在检索?准确率低、汉明损失高的问题,提出一种融合双向长短时记忆网络(Bi-Long Short-Term Memory,Bi-LSTM)与文本卷积神经网络的双向长短时卷积神经网络模型(Bi-Long Short Time Convolutional Neural Network,Bi-LSTCNN)。该模型首先通过Bi-LSTM网络提取文本的上下文特征向量,并将其和模型输入进行拼接,得到信息更加丰富的文本融合特征向量;再利用TextCNN提取局部特征的能力对文本融合特征向量进行降维,获取文本高层特征向量表示。实验结果表明,Bi-LSTCNN模型的多标签文本表示与分类性能优于传统方法,准确率平均提高了9.4%、汉明损失平均减少了0.374;引入L2正则化和滑动平均模型能有效提高Bi-LSTCNN模型的分类准确率。(3)针对多标签文本表示与分类方法的输出空间随着文本标签集合增大而指数增长、导致难以获得准确标签集合的缺点,本文在Bi-LSTCNN模型基础上引入层次化标签树的多标签分类策略,以提高Bi-LSTCNN模型的性能。实验结果表明,引入层次化标签树的Bi-LSTCNN模型在处理多标签文本表示与分类任务时相比于未引入层次化标签树的Bi-LSTCNN模型,其召回率、准确率、F1值分别提高了2.2%、2.9%、2.5%;汉明损失降低了0.187。(本文来源于《重庆邮电大学》期刊2019-05-20)

姚丽华,于广州[4](2019)在《关系型数据库信息资源检索结果分类方法仿真》一文中研究指出针对当前数据库信息资源检索结果分类方法准确率和查全率较低的问题,提出基于协同微粒群的关系型数据库信息资源检索结果分类方法,将信息资源检索结果进行标准化,计算标准化后检索结果的协方差,并将其最大值定义为数据库信息资源检索结果预处理目标函数。将方差最大值的求解转换成对样本最大值进行求解,引入拉格朗日系数对目标函数求解,期间融合了数据过滤器,实现检索结果预处理。初始化微粒群,通过骨干微粒群法对微粒位置进行更新。计算微粒适应度值,对微粒群之间的相似性进行判断,将相似的微粒群合并。检测当前运行状态满足终止条件与否和信息资源检索结果流结束与否,对未结束的检索结果数据流类中心变化位置进行预测,一直到不再接收资源检索结果,将最终分类结果输出。实验结果表明,所提方法分类准确性和查全性均较为理想,可行性也高于当前相关方法。(本文来源于《计算机仿真》期刊2019年01期)

朱云辉[5](2018)在《人工智能技术在数字档案信息资源分类与检索中的应用》一文中研究指出数字档案信息资源中的信息、数据和知识种类繁多,数量巨大,而且来源也是各不相同,这给档案的分类与检索带来很大的困难。和传统的分类与检索方法相比,人工智能技术在各个方面都占据着绝对的优势,能够快速对数字档案信息资源进行准确、有效地分类与检索,一定要在数字档案信息资源的管理工作中大力应用这种先进技术。(本文来源于《资源信息与工程》期刊2018年06期)

蔡智勇[6](2018)在《基于CPC分类号在信息检索的有效检索策略》一文中研究指出信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。随着技术的发展,而现有的信息检索领域的IPC分类不能完全满足检索的需求。本文以分类号"G06F17/30信息检索;及其数据库结构"为例,分析信息检索领域CPC分类号的使用情况,并结合实际案例探讨CPC分类对信息检索领域的检索效率的影响。(本文来源于《科技创新导报》期刊2018年23期)

李霞[7](2018)在《基于领域本体的白族服饰信息分类体系及检索研究》一文中研究指出民族文化是民族的灵魂与核心,而服饰则是民族文化的重要载体。白族服饰传递着白族的人文,其独特的装扮承载着其民族精神。白族服饰经过了千年的发展,包容和吸收了众多外来文化并保留了自身的精髓。但随着现今众多强势文化的侵袭,白族服饰的传承和发展面临着重大的挑战。因此,本文建立了白族服饰领域本体,对白族服饰文化进行整理与重组,有助于人们更清晰地查询和了解白族服饰,对白族服饰文化的保护与传承具有很大意义。随着因特网的迅猛发展,人们在信息获取方面对因特网愈加依赖,使得人们对信息检索的形式和方法更加多样化和准确化。信息检索逐渐成为人们研究的热点之一。传统检索通常采用关键词匹配的方法,不考虑关键词的语义信息,以至于不能获得用户期望的结果。而本文利用本体技术,能够通过知识之间的关联,充分结合语义推理技术,对检索词进行扩展并实现语义检索,以此提高白族服饰的信息检索效果。本文首先根据相关文献提取出白族服饰领域的重要词汇,以建立白族服饰词汇本体库;其次通过仔细研究白族服饰的特点,构建出白族服饰本体的分类体系,并对白族服饰领域本体的构建过程进行了详细的描述,包括白族服饰本体的可行性分析、需求分析、详细设计以及形式化编码;然后利用Protégé完成白族服饰领域本体的构建,并通过Jena的API将白族服饰领域本体中的数据装载到关系数据库MySQL中,实现对白族服饰本体文件的持久化存储;最后应用构建的白族服饰领域本体进行语义检索,进而验证本文理论技术的正确性。(本文来源于《云南师范大学》期刊2018-05-18)

邓慧丽[8](2018)在《CPC分类号在信息检索领域的检索应用》一文中研究指出信息检索领域IPC分类号下文献量巨大,在实际检索中关键词难扩展、检索时噪声很大,利用CPC检索能够极大降低噪声,大大提高检索效率。本文先对信息检索领域相关的IPC和CPC分类号进行了梳理比较,从理论层面探讨了采用CPC分类号能更有利于检索,然后结合一个典型案例分析CPC分类对检索的有效性。(本文来源于《计算机产品与流通》期刊2018年05期)

田永刚[9](2016)在《基于文本分类技术的WEB校友信息检索系统实现》一文中研究指出在当今这个信息技术发展越来越迅猛的时代,尤其是Web的广泛普及和应用,Web上的信息也呈现着飞速增长的趋势,并逐渐积累成巨大的信息资源库。然而,面对目前Internet上依旧在不停增多的信息资源,怎样才能快速和精确地从这巨大的信息资源库中,检索到自己所需要的具体信息资料便成了一项值得探索和研究的课题。对于学校从事校友工作的部门来说,校友信息挖掘和收集是校友工作的一项非常重要的基础性工作。如今的Internet包含了众多各个时代,各个行业和人群的资料信息,其中便包括了很多校友的个人资料,生活状态,工作简历或是与校友相关的活动报道等等。在一般情况下,我们在Internet上查找校友的相关信息的时候,通常会直接通过搜索引擎来查找,但是由于搜索引擎反馈回来的搜索结果太多,并且夹杂着很多混乱的信息甚至有一些存在安全隐患的网页链接,所以从搜索结果中判断真假对错,挑选出有用的数据信息也是一项庞大而且繁琐的工作。因此,为了提高校友信息检索者的工作效率和检索精准度,建立一个自动、全面、详细并且精准的“Internet校友信息搜索系统”,必然会给校友工作人员带来很多便捷和帮助。建立一个这样的系统是非常实用并且有意义的。本文研究了关于文本分类技术的校友信息检索方法,深入地解释和分析了关于在Internet上进行校友信息检索的特点和目前所面临的难点。并且,在两次分类方法的基础上,设计了一个基于互联网的校友信息检索系统。本文的工作如下:1.简要介绍了互联网上校友信息的分布特点,以及由此产生的学习模型的泛化能力不足和维灾难问题;2.采用了两次分类的方法来完成校友信息的分类,这两次校友信息分类提高了检索结果的准确率和全面性;3.使用启发式规则将校友的名字和相关关键词在检索结果中进行辨识;4.根据以上所述的相关校友信息检索方法,本文使用JAVA语言建立起一个基于互联网的校友信息检索系统。该系统借助互联网搜索引擎技术以及网页爬虫来随时和及时的检索互联网和校友相关的各类信息。(本文来源于《天津大学》期刊2016-11-01)

刘宇[10](2015)在《突发事件案例及其舆情信息爬取、分类及语义检索研究》一文中研究指出当代突发事件的新闻报道和相关研究文章呈爆发式增长。面对海量的突发事件案例和舆情数据,为了挖掘突发事件特征及关联关系,本文提出了突发事件案例及其舆情本体模型,将爬取、分类、检索等工作抽象出模板,针对数据爬取、抽取、分类的可配置需求进行了建模、设计和实现,完成了以下工作:第一,提出了突发事件案例及其舆情本体模型。模型以ABC Ontology模型为上位本体,结合搜索引擎的爬取、抽取、分类等步骤,抽象出可配置模板,分别完成了案例及其舆情爬取可配置建模,案例抽取可配置建模,案例分类可配置建模。第二,提出了突发事件案例及其舆情处理与语义检索平台设计。针对突发事件案例及其舆情信息的特点与结构,设计出整体平台框架、信息处理流程与数据结构,并按照模块划分,分别对数据爬取模块、数据抽取模块、数据分类模块、案例入库模块和案例语义检索模块进行流程设计,数据结构设计与功能设计。第叁,完成了突发事件案例及其舆情处理与语义检索平台实现,分别通过新华网RSS推送新闻的实例、中国应急分析网新闻专题实例、兰州大学案例库实例,从RSS推送新闻、新闻专题、案例库叁个方面介绍平台的数据爬取过程、数据抽取过程、数据分类过程、案例入库过程和语义检索功能。本文构建了突发事件案例及其舆情信息本体模型以及数据爬取、抽取与分类的可配置模板,并完成平台实现。并且通过对不同数据源的平台实现验证了模型的通用性,为突发事件特征及关联关系挖掘提供了有效的平台支撑。(本文来源于《天津大学》期刊2015-12-01)

信息分类检索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

我国的地震活动不仅频率高、强度大而且分布十分广泛,由其造成的社会经济损失居于自然灾害首位,因此如何有效的减轻和降低地震造成的社会经济损失,成为地震应急领域探讨和研究工作的重点。与发达国家相比,我国地震应急信息的管理主要存在着以下叁个方面的差异:(1)信息采集手段较单一;(2)信息传送不够及时、准确,甚至存在死角、失真现象;(3)信息获取速度较慢,产出与存储源多样。因此针对目前我国地震应急基础信息多渠道上传模式以及震后大量灾情等信息的纷纭复杂,基于信息检索在智能化领域的快速发展,本文收集了四川省2013年4月20日芦山7.0级地震、2014年11月22日康定6.3级地震、2017年8月8日九寨沟7.0级地震、2017年9月30日广元青川5.4级地震的四次地震应急资料,就我国的地震应急工作以及应急信息的检索分类做了以下分析与研究:(1)详细介绍了我国地震应急的工作体系、工作内容;分析了地震应急信息多渠道源的特点,按照信息产出的空间属性,将信息源划分为地震发生现场信息源和非现场信息源,结合应急信息的服务对象,以地震系统工作内部和工作外部环境来对信息的渠道和用户进行细分。(2)基于近年来专家学者在地震应急信息分类方面的研究成果,以信息服务的高效便捷为目的,按照地震事件的震前、震时、震后时间主线,将地震应急信息分为震前基础背景信息(震区自然灾害以及社会基础背景信息)、地震震情灾情信息(地震本身属性以及其造成的直接、间接损失信息)、震后应急救援信息(应急救援动态行动信息)叁类。(3)通过对文本信息检索方法的学习,考虑到目前地震应急信息手动归类存在的现实困难,基于地震应急信息分类的需求,构建了一种高效便捷的信息分类处理方法。对比分析了信息检索的叁种基本检索模型,采用TF-IDF为权值公式,选取传统的布尔模型(关键词分类法),展开了地震应急信息自动分类的研究。(4)采用“关键词分类法”,对多渠道地震应急信息的自动分类进行研究。主要工作有:1)信息的分类。对收集的应急资料,按建立的分类标准进行分类;2)文本的结构化处理。首先将各类信息集成于一个文本文档(.txt文档),再按动词、名词进行分词、词频统计处理;3)筛选关键词,得到关键词库。选取词频统计top20的词、计算每个词对应的TF-IDF值,按规则手动选取得到关键词库;4)在计算机语言的支持下,按词频所占比例将关键词库划分五个区间,采用布尔模型最大匹配的方式,设计地震应急信息自动分类的实现方法。信息经过结构化规范处理后,选取的震前基础背景信息关键词主要有人口、降水量、GDP等;地震震情灾情信息关键词主要有灾区、震情、余震等;震后应急救援信息关键词主要有绑带、搜救、医疗器材等。由筛选结果来看,各类信息的关键词之间具有一定的辨识度,处理后的信息使得传输的条理性更强,更便于进一步的信息加工与处理。实现地震应急信息的自动分类,能大大的提高信息的利用率,在一定程度上缩短应急信息加工处理与服务的时间,快速高效地为应急指挥提供信息服务。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

信息分类检索论文参考文献

[1].黄丽清.浅析人工智能技术在数字档案信息资源分类与检索中的应用和发展[J].中国管理信息化.2019

[2].王琳.地震应急指挥系统信息文本的检索与自动分类研究[D].中国地震局地震预测研究所.2019

[3].许奥狄.信息检索中基于深度学习的文本表示与分类方法研究[D].重庆邮电大学.2019

[4].姚丽华,于广州.关系型数据库信息资源检索结果分类方法仿真[J].计算机仿真.2019

[5].朱云辉.人工智能技术在数字档案信息资源分类与检索中的应用[J].资源信息与工程.2018

[6].蔡智勇.基于CPC分类号在信息检索的有效检索策略[J].科技创新导报.2018

[7].李霞.基于领域本体的白族服饰信息分类体系及检索研究[D].云南师范大学.2018

[8].邓慧丽.CPC分类号在信息检索领域的检索应用[J].计算机产品与流通.2018

[9].田永刚.基于文本分类技术的WEB校友信息检索系统实现[D].天津大学.2016

[10].刘宇.突发事件案例及其舆情信息爬取、分类及语义检索研究[D].天津大学.2015

标签:;  ;  ;  ;  

信息分类检索论文-黄丽清
下载Doc文档

猜你喜欢