元搜索技术论文-许智宏,康有淞,王兰君

元搜索技术论文-许智宏,康有淞,王兰君

导读:本文包含了元搜索技术论文开题报告文献综述及选题提纲参考文献,主要关键词:Web信息抽取,元搜索,提取模型

元搜索技术论文文献综述

许智宏,康有淞,王兰君[1](2014)在《网络商品信息元搜索技术研究与应用》一文中研究指出在分析网络商品信息特点的基础上,改进现有的Web信息提取技术,设计一种基于元搜索技术的网络商品信息提取模型,实现对搜索范围的自动确定、网页搜索、以及商品信息的自动抽取。通过大量商品信息的搜索测试,在抓取范围的自动确定和商品信息的自动抽取上取得了很好的效果。(本文来源于《计算机应用与软件》期刊2014年04期)

徐伟群,马旸[2](2014)在《“元搜索”技术在省内网络环境治理中的实践》一文中研究指出基于JSSH(Javascriptshellserver)的元搜索引擎构建技术为"元搜索"在省内互联网网络环境治理的研究与部署给出了一种实践方案。结合江苏本省接入的域名库,对Baidu、Soso两个搜索引擎的搜索结果进行重新整合以提高结果的有效性,这种高效的元搜索引擎作为省内网络环境治理工作中不良信息获取方式的补充,为有互联网环境治理需求的单位提供了一种有力的技术手段。(本文来源于《江苏通信》期刊2014年01期)

吴宗灵[3](2010)在《基于JSSH的元搜索技术研究与应用》一文中研究指出我国互联网发展迅速,与传统的报纸、电视、广播有很大的不同,在互联网上,任何人都可以在博客(包括微博客)、社交网站(SNS)、论坛、留言版等上面发布个人言论和观点。网民既是信息的传播者,又是信息的受众。和国外相比,我国网民相对不够成熟,这对网络监管部门提出了巨大的挑战。因为如果互联网监管缺失,在网络上很容易出现虚假、反动甚至暴力的言论,势必严重影响绿色网络的营造与和谐社会的建设。考虑到全网热点分类汇总与趋势研判始终是互联网舆情监控工作关注的重点,仅仅面向明确目标开展网络监控存在无法把监控范围扩大至整个Internet的局限。基于传统搜索引擎的元搜索技术在网络热点融合方面优势突出。鉴于此,本文提出了基于JSSH的网络浏览器模拟技术构建元搜索引擎的技术方案,提供基于主题的全面的信息查询技术。方案以Mozilla的跨平台组件对象模型为基础,利用网页排版引擎Gecko的接口,以JSSh服务器和客户端模式,成功操控Firefox浏览器完成成员引擎的调用,能够很好的帮助跟踪当前热点问题的舆论动向,使其成为传统网络监管手段的有力补充。该方案对近几年呈爆炸式增长的微博客类需要身份认证的网站也能够起到很好的作用,JSSH客户端FireWatir通过JavaScript指令,指示预先安装在Firefox浏览器中的JSSH服务器操控浏览器,完成用户名密码等信息的自动填写,顺利的通过身份认证环节,进而调用微博客网站提供的搜索服务,构建以微博客为成员的元搜索引擎,实现微博客基于主题的信息获取。文章首先阐明本研究工作的意义,然后对搜索引擎以及元搜索引擎的工作原理作了介绍。在此基础上,对基于JSSH实现元搜索的原理和实现要点进行了阐述,再分析了微博客发展状况和给监管工作带来的挑战,并详细介绍了基于JSSH的浏览器模拟方法实现对微博客主题信息获取的技术要点,最后,描述了元搜索引擎的结果整合方法研究所取得的成果。(本文来源于《上海交通大学》期刊2010-12-01)

吴宗灵,李翔,林祥[4](2010)在《基于JSSh的元搜索技术研究与应用》一文中研究指出全网热点分类汇总与趋势研判始终是互联网舆情监控工作关注的重点,基于传统搜索引擎的元搜索技术在网络热点融合方面优势突出。鉴于此,提出了利用网络浏览器模拟技术构建元搜索引擎的技术方案。选择JSSh(JavaScript Shell Server)作为浏览器模拟技术的核心,方案相对于早期元搜索实现具备归一性与普适性强的优势。最后还初步探讨了元搜索引擎结果整合方法,提出基于用户自定义权重的结果整合方案。(本文来源于《信息安全与通信保密》期刊2010年11期)

白鹤,王劲林,赵志强[5](2009)在《基于元搜索技术的主题新闻门户系统》一文中研究指出主题新闻门户提供个性化的新闻信息集成服务,是现在企业级信息化应用的一个热点。实现了一个无需人工干预的主题新闻系统。它基于元搜索技术获得主题相关的新闻索引,之后构造分装器和采用启发式算法准确提取双层页面中的结构化信息;同时设计了结合URL和标题的新闻重复检测策略,提高抓取质量。原型系统运行以来得到了较优异的实验效果。(本文来源于《计算机系统应用》期刊2009年11期)

张志军[6](2009)在《基于本体的个性化元搜索技术的研究和实现》一文中研究指出随着互联网信息的飞速增长,越来越多的人将搜索引擎作为网络信息获取的主要手段。但是,在浩如烟海的互联网信息世界中,通过现有的搜索引擎,人们寻找有用信息还是存在着很大的困难。其中的主要原因有两个:一是用户教育背景的不同和知识领域的局限性同传统的基于关键词的查询服务之间的矛盾;二是用户信息的个性化需求与现有搜索引擎的“一般化”服务之间存在矛盾。为了更快、更准的获取特定的网络信息,成为搜索引擎研究的重点。元搜索引擎正好符合这一发展需求,因此近些年来得到了飞速的发展。元搜索引擎通过调用多个搜索引擎来实现搜索,并对搜索结果进行综合处理,能较好解决现有的搜索引擎所存在的缺陷。论文在元搜索引擎上引入基于本体的关键词扩展服务和个性化服务的结构模型,并结合通用本体库上基于语义相似度的搜索策略,提高信息检索的查全率和查准率。论文在本体的基础上提出了一个基于语义相似度的本体库搜索策略,对关键词的扩展服务有明显的改善,改进了单纯依靠语义相似度阈值来抑制关键词扩展的速率,减少了无用词的产生。论文在个性化搜索的研究中,提出了一种基于个性化本体的用户兴趣模型。论文在个性化本体的基础上提出了一种间隔排列合成法和加权位置排列法两者的结合的成员调度算法,它是根据扩展关键词集合和个性化本体库中的用户兴趣信息做出的成员搜索引擎选择,有计算简单快捷和查全率高的优点。同时,基于个性化本体的用户兴趣模型具有根据用户反馈信息更新用户兴趣信息的能力。最后论文简述了关于检索结果的合并策略,包括无效链接检查和去重复网页的步骤。(本文来源于《江西师范大学》期刊2009-04-01)

李欢[7](2008)在《基于多Agent及元搜索技术的中文问答系统的研究和应用》一文中研究指出近年来随着万维网(WWW)的发展,搜索引擎与信息检索也得到迅速的发展。由于技术开放性的特点,互联网上的信息越来越丰富,一方面为用户获取信息提供了海量的资料,但另一方面出现了“信息过载”现象,即从Web海量信息种迅速而准确地获取所需要的信息变得越来越困难。用户需要在搜索引擎的检索结果上再次进行大海捞针般的信息查找。由此,新的信息检索技术——问答系统应运而生。本文首先介绍了问答系统的研究背景、国内外现状及本文的研究内容,然后介绍了中文分词技术和问题分析,之后介绍了本文的工作重点:元搜索Agent信息检索和多文档答案提取。在信息检索部分引入元搜索Agent技术,从多个成员搜索引擎中获得候选答案的摘要及URL,通过去除冗余网页地址、判断网页地址有效性两个功能模块获得带有HTML标记语言的候选答案集合。利用元搜索技术,有效地提高了候选答案的查全率,为答案提取模块提供了广泛而全面的候选答案集合。在答案提取部分,首先介绍多文档提取技术和基本路线,然后提出了多文档答案提取方法。将答案定位到多文档合取上,通过正则表达式对信息检索部分获得的答案候选集进行页面的清洗工作、利用向量空间模型(VSM)计算问题与各候选答案集的相似度、对二次候选答案分句和提取有效句、利用基于词表层特征的相似度对二次候选答案进行筛选获得最终的答案句。本文实现了问答系统的各个模块,并进行了系统测试及评价分析。最后,对全文进行总结,并提出了下一步努力方向。(本文来源于《石家庄铁道学院》期刊2008-12-01)

沈宇,黄卫东[8](2008)在《基于领域本体的元搜索技术研究》一文中研究指出随着互联网的进一步发展,网络的信息资源得到了极大的丰富,虽然目前已经出现了许多功能强大的搜索引擎,但由于其自身技术的限制,在领域知识的查询上查准率、查全率都不是很理想,因此本文试图通过建立领域本体库,在语义上理解用户的检索请求,从而提高检索的精确率,并借助元搜索技术进一步扩大搜索的范围,提高信息的查全率、查准率。(本文来源于《信息通信》期刊2008年02期)

韩宇彬[9](2007)在《元搜索技术在地图搜索中的应用》一文中研究指出元搜索引擎是独立搜索引擎之上的搜索引擎,是搜索引擎技术的一个重要分支,也是搜索引擎发展的重要部分。地图搜索是搜索引擎市场的最新亮点,是搜索引擎技术在电子地图上的重要应用。如果能将二者的优点结合起来,就能从另一个视角来对搜索引擎进行研究,这对促进搜索引擎的发展有着重要的意义。本文将元搜索技术应用到地图搜索之中,并建立了这样的一个系统:用户只需输入一次地图查询请求,若干个独立的地图搜索引擎都会返回结果,系统分析这些结果并返回给用户需要的信息。 本文所做的主要工作如下: (1) 文章的开始对元搜索引擎做了简单的介绍,探讨了将元搜索技术应用到地图搜索中的可行性问题以及当前已经拥有的成果。 (2) 文章讨论了将元搜索技术应用到地图搜索中所需要研究的问题,这些问题包括:基于元搜索技术的地图搜索引擎的构建方法,用户输入地址的分析方法,各个独立搜索引擎结果信息的获取方法,结果文件的信息抽取方法,搜索结果的最优解(路径搜索)查找方法。 (3) 在系统的构架上,采用了成熟的B/S结构来设计系统。文章对可能用到的技术做了详细的分析,对每个技术的应用都进行了比较和权衡,并选取最可行的方案来建立系统,使得建立的系统在时间上和空间上都符合设计的要求。 (4) 文章对这个建成的系统进行了评估,并建立了测试项来对系统进行测试,运用测试结果的数据来说明元搜索技术在具体的应用中所取得的成果和经验。 (5) 最后,文章给出了结论,结论中指出了当前元搜索技术研究中存在的一些问题,阐述了元搜索引擎发展的定位和元搜索技术应当具有的发展方向。(本文来源于《西北工业大学》期刊2007-03-01)

苏超,蔡铭,姚玉荣[10](2006)在《面向领域资源的智能元搜索技术研究》一文中研究指出如何快速、有效地从互联网中获取特定领域资源信息,已成为当前研究热点之一。本文提出并构建了一种基于元搜索技术的领域资源检索系统,介绍了其中的关键技术,包括:领域资源模型构造、查询请求与调用、查询结果处理等。最后以计算机教学资源检索为例进行了实例验证。(本文来源于《计算机科学》期刊2006年09期)

元搜索技术论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

基于JSSH(Javascriptshellserver)的元搜索引擎构建技术为"元搜索"在省内互联网网络环境治理的研究与部署给出了一种实践方案。结合江苏本省接入的域名库,对Baidu、Soso两个搜索引擎的搜索结果进行重新整合以提高结果的有效性,这种高效的元搜索引擎作为省内网络环境治理工作中不良信息获取方式的补充,为有互联网环境治理需求的单位提供了一种有力的技术手段。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

元搜索技术论文参考文献

[1].许智宏,康有淞,王兰君.网络商品信息元搜索技术研究与应用[J].计算机应用与软件.2014

[2].徐伟群,马旸.“元搜索”技术在省内网络环境治理中的实践[J].江苏通信.2014

[3].吴宗灵.基于JSSH的元搜索技术研究与应用[D].上海交通大学.2010

[4].吴宗灵,李翔,林祥.基于JSSh的元搜索技术研究与应用[J].信息安全与通信保密.2010

[5].白鹤,王劲林,赵志强.基于元搜索技术的主题新闻门户系统[J].计算机系统应用.2009

[6].张志军.基于本体的个性化元搜索技术的研究和实现[D].江西师范大学.2009

[7].李欢.基于多Agent及元搜索技术的中文问答系统的研究和应用[D].石家庄铁道学院.2008

[8].沈宇,黄卫东.基于领域本体的元搜索技术研究[J].信息通信.2008

[9].韩宇彬.元搜索技术在地图搜索中的应用[D].西北工业大学.2007

[10].苏超,蔡铭,姚玉荣.面向领域资源的智能元搜索技术研究[J].计算机科学.2006

标签:;  ;  ;  

元搜索技术论文-许智宏,康有淞,王兰君
下载Doc文档

猜你喜欢