导读:本文包含了垂直搜索引擎技术论文开题报告文献综述及选题提纲参考文献,主要关键词:云技术,垂直搜索,网络爬虫,微信公众号
垂直搜索引擎技术论文文献综述
项鑫[1](2016)在《基于垂直搜索引擎技术的校园微信平台的设计与研究》一文中研究指出随着信息技术的发展和高校信息化工作的推进,各高校都建立了自己的数字化校园信息服务系统。传统的数字校园信息服务系统多基于B/S架构开发,有较好的兼容性,用户可以通过电脑或智能终端与系统进行数据交互。在4G网络的推动下,用户通过智能手机便可以完成大部分过去需要通过电脑才能完成的业务操作,并以APP的方式实现了功能拓展,为用户提供了更为人性化的服务。而以QQ、微信为代表的即时通讯软件更成为了智能手机的必装应用,这已然改变了人们的生活方式,提高了办事效率,为广大师生提供了诸多的方便。基于垂直搜索引擎技术的校园微信平台,通俗的讲就是将数字化校园信息服务平台融入到微信公众平台中,并为数字化校园搭建垂直搜索引擎爬虫系统,基于校园环境的特殊性实现垂直搜索功能。通过爬虫系统实现对数字校园各系统信息检索的统一,并将各页面接口统一融入到校园微信工作平台中,从而实现统一入口,统一认证。课题研究设计的校园信息微信平台,采用PHP、MySQL、Linux Bash Shell等技术对微信号进行二次开发,利用云服务构建中间服务器作为数据传输联系点,实现微信客户端、微信服务器、校园各信息系统间数据的有效规则交互。并且对用户请求的数据做分析归纳,通过MemCache技术形成访问频繁数据堆,减少用户等待数据返回的响应时间。在信息检索功能中使用了基于垂直搜索引擎技术的网络爬虫系统,对网络爬虫的工作进行了流程化的设计,并对网络爬虫主题词的提取算法进行了优化,从而实现检索排序的优化,让搜索变得更专业,更精准。(本文来源于《浙江工业大学》期刊2016-10-10)
张弛[2](2014)在《基于HMM的主题垂直搜索引擎技术研究》一文中研究指出计算机网络技术的飞速发展,对于搜索引擎技术也提出了更高的要求。文章主要以垂直搜索引擎的主题网页抓取策略为研究内容,从提高主题网页抓取的准确度和效率出发,引入隐马尔科夫模型,并重点讨论了该模型具体应用策略和过程,该模型的应用方法不仅分析了网页内容,还考虑网页上下文链接距离结构,在一定程度上提高了主题页面抓取的精度。(本文来源于《自动化技术与应用》期刊2014年10期)
景瑞林[3](2014)在《石油信息垂直搜索引擎技术》一文中研究指出石油信息垂直搜索引擎由搜索器、索引器、检索器和用户接口四个部分组成,该系统主要包括网页搜索、图片搜索和新闻搜索功能。石油搜索引擎面向石油行业定向搜索,解决了油田网无搜索引擎及搜索不便的问题;提供了历史网页保存,可随时以快照形式提供信息;按照信息发布单位和IP精确检索;对油田网检索的信息进行安全管理和敏感词的监控。石油行业专业搜索引擎技术的应用使油田局域网真正起到了搜索引擎和导航的作用。(本文来源于《油气田地面工程》期刊2014年03期)
孙纳新,赖江轶,王玉萍[4](2013)在《垂直搜索引擎技术在武警部队心理数据库建设中的应用》一文中研究指出垂直搜索引擎技术的发展使得大数据时代特定专业的信息获取成为可能,通过对武警部队心理数据库数据采集过程中使用异步非阻塞聚焦爬虫策略,大大提高了数据采集性能。(本文来源于《电子测试》期刊2013年24期)
李勇[5](2013)在《房地产信息垂直搜索引擎技术研究》一文中研究指出由于计算机及网络的飞速发展,因特网上的信息量呈指数级增长。当使用通用搜索引擎来搜索相关的信息时,准确率越来越令人难以接受,有时候甚至访问了几十个页面都无法找到所需的内容,这对于一般人是无法接受的。面对这个问题,垂直搜索引擎应运而生。垂直搜索引擎的出现能够解决通用搜索引擎的领域性不足问题,对特定领域的搜索能够做到更加专注、更加深入、更加精确。本文课题是针对近年来房地产的现状,设计并实现了房地产垂直搜索引擎。其中重点研究垂直搜索引擎中的两个关键技术:网络爬虫和中文分词。本文的主要内容如下:(1)介绍了研究背景和意义、搜索引擎的概述以及垂直搜索引擎的国内外现状和发展。(2)介绍了垂直搜索引擎所涉及的相关技术,包括网络爬虫技术、网页信息提取技术、中文分词技术、信息索引技术和搜索结果排序技术。(3)深入研究了Shark-Search算法,分析其存在的两个不足之处:锚文本上下文不足和局部最优不足。针对这两个不足之处提出了改进,分别加入了链接聚类和隧道技术。链接聚类能够解决Shark-Search算法的锚文本上下文不足之处,而隧道技术则能够解决主题孤岛效应,从而避免局部最优问题。实验表明改进后的算法相比原来算法在抓取主题相关的页面上有显着提高。(4)研究了概率统计模型的一种——隐马尔可夫模型,并且将其和词性标注相结合,加入自定义状态和自定义标注,经过计算来确立最大概率的状态序列,从而能够有效地识别房地产命名实体。(5)结合前几章提出的理论,实现了房地产垂直搜索引擎系统,其中包括五大部分:网络爬虫、页面处理、中文分词、信息索引、信息搜索。(6)对论文做了全面的总结,并对未来的研究工作进行了展望。(本文来源于《杭州电子科技大学》期刊2013-12-01)
王锐[6](2013)在《石油行业垂直搜索引擎技术研究》一文中研究指出垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则更加专注、具体和深入。随着油田信息化建设进程的推进,油田建设了具有自己特色的信息网和不同专业的信息管理系统。信息网网站规划非常庞大,信息内容十分丰富,因此,迫切需要一个搜索引擎系统,从限定范围的互联网上和企业内网上搜索到石油有关网页的有效信息,并结合石油行业的特殊需要,对信息进行处理,为油田网络用户和科研、生产人员方便地提供所需要的信息。本文设计了石油行业垂直搜索引擎的处理流程,通过信息抓取、处理和索引实现了图片搜索功能、网页搜索功能和论坛搜索功能;通过搜集整理行业词汇,建立了石油百科知识词库;开发了石油垂直搜索引擎系统,研发了搜索器、处理器、索引器、检索器在内的全部四个子系统,实现了图片搜索自动提取、网页定向搜索提高及时性和论坛独立搜索提高检索准确性,最终形成了基于自然语言理解的一个个性化、智能化的网络信息搜集工具。石油行业的专业搜索引擎全国还没有,该技术的应用解决了目前网站信息采集和检索方面的问题,提高了网站的维护效率和网页查询效率。通过为石油各个专业领域、石油从业人群以及石油行业特定需求提供具有石油行业色彩的、而且“专、精、深”的有专业价值的信息和相关服务,提供更加专注、具体和深入的信息内容,搜索引擎将被打造成为石油系统最权威、最专业的信息引擎。该系统实现信息采集的自动化,能为网站用户搜索信息带来全新的使用体验,能让用户在最快的时间里找到最需要的信息,真正起到搜索引擎和导航的作用。实践证明该系统有很好的应用效果,为提高油田网站信息采集和信息检索水平发挥了重要作用。(本文来源于《电子科技大学》期刊2013-09-25)
苗海,张仰森,岳明[7](2013)在《基于聚类算法的垂直搜索引擎技术研究》一文中研究指出设计并实现了一个基于相似聚类算法的垂直搜索引擎。利用网络爬虫NWebCrawler,通过定制正则表达式,高效爬取所需的URL;通过解析爬取的URL信息,提取结构化数据;利用正向最大匹配算法,对搜索关键字分词;利用向量空间模型,根据相似度值对搜索结果聚类;基于Lucene建立索引,检索所需信息。实验结果表明,基于相似聚类算法的垂直搜索引擎,比通用搜索引擎的准确率和召回率高,与普通的垂直搜索引擎相比,具备了相似产品查询功能。(本文来源于《北京信息科技大学学报(自然科学版)》期刊2013年01期)
罗秀春,石现升,郝智超,李建清[8](2012)在《垂直搜索引擎技术在不良网站发现中的应用研究》一文中研究指出色情网站的发现是色情网站治理中的首要问题。随着互联网向纵深方向发展,垂直搜索引擎技术也得到了长足的发展。将垂直搜索引擎技术应用在色情网站搜索中,对于色情网站的治理意义非凡。简要介绍了垂直搜索引擎的关键技术及其在色情网站监测和管理中的应用价值,主要研究了垂直搜索技术在色情网站信息分类检索中的应用。(本文来源于《计算机安全》期刊2012年12期)
周纯[9](2011)在《垂直搜索引擎技术进展》一文中研究指出随着网络与通信技术的迅速发展,为了满足人满对特定领域信息的个性化需求,更具有针对性的垂直搜索引擎应运而生。本文介绍了垂直搜索引擎,并对垂直搜索引擎的核心技术垂直网络蜘蛛技术和信息抽取技术作了介绍,最后进行了总结和展望。(本文来源于《知识经济》期刊2011年09期)
汪明强[10](2010)在《基于JAVA+LUCENE+HERITRIX的WEB垂直搜索引擎技术研究与实现》一文中研究指出随着Internet网上的信息呈几何级数式的增长,搜索引擎已经成为用户浏览网络信息的首选。传统的通用搜索引擎(Google、Yahoo以及国内的Baidu等等),作为一个辅助用户查找信息的工具已经成为大多数互联网用户访问网络的入口。但是,这些通用性搜索引擎也存在着一定的局限性,如:通用搜索引擎的信息量过大、查询不准确、深度不够等问题。在这种情况下,为了解决这些问题,垂直搜索引擎应运而生。垂直搜索引擎是专注于某一行业或领域,满足行业专业需求、或者某项业务需求的专业搜索引擎,是搜索引擎的细分和延伸,是对某类网页资源和结构化资源的深度整合,并为用户提供符合专业用户操作行为的信息服务方式。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则更加专着、具体和深入。本文重点研究并剖析了这种新兴的技术。本文的主要研究内容如下:1.研究了垂直搜索引擎的由来,发展过程和应用现状。分析研究了传统的搜索引擎开发应用模型和搜索引擎的Web应用模型,对搜索引擎技术包含的关键技术进行了分析。2.阐明了Lucene技术,Heritrix技术,信息结构化提取技术的基本原理和使用方法,提出整合Lucene与Heritrix使其与J2EE平台完全融合的方案。3.实现手机产品垂直搜索引擎系统。(本文来源于《河北工业大学》期刊2010-11-01)
垂直搜索引擎技术论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
计算机网络技术的飞速发展,对于搜索引擎技术也提出了更高的要求。文章主要以垂直搜索引擎的主题网页抓取策略为研究内容,从提高主题网页抓取的准确度和效率出发,引入隐马尔科夫模型,并重点讨论了该模型具体应用策略和过程,该模型的应用方法不仅分析了网页内容,还考虑网页上下文链接距离结构,在一定程度上提高了主题页面抓取的精度。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
垂直搜索引擎技术论文参考文献
[1].项鑫.基于垂直搜索引擎技术的校园微信平台的设计与研究[D].浙江工业大学.2016
[2].张弛.基于HMM的主题垂直搜索引擎技术研究[J].自动化技术与应用.2014
[3].景瑞林.石油信息垂直搜索引擎技术[J].油气田地面工程.2014
[4].孙纳新,赖江轶,王玉萍.垂直搜索引擎技术在武警部队心理数据库建设中的应用[J].电子测试.2013
[5].李勇.房地产信息垂直搜索引擎技术研究[D].杭州电子科技大学.2013
[6].王锐.石油行业垂直搜索引擎技术研究[D].电子科技大学.2013
[7].苗海,张仰森,岳明.基于聚类算法的垂直搜索引擎技术研究[J].北京信息科技大学学报(自然科学版).2013
[8].罗秀春,石现升,郝智超,李建清.垂直搜索引擎技术在不良网站发现中的应用研究[J].计算机安全.2012
[9].周纯.垂直搜索引擎技术进展[J].知识经济.2011
[10].汪明强.基于JAVA+LUCENE+HERITRIX的WEB垂直搜索引擎技术研究与实现[D].河北工业大学.2010