语义数据挖掘论文-普树芳

语义数据挖掘论文-普树芳

导读:本文包含了语义数据挖掘论文开题报告文献综述及选题提纲参考文献,主要关键词:位置感知计算,轨迹数据挖掘,GPS室外定位,WiFi室内定位

语义数据挖掘论文文献综述

普树芳[1](2019)在《基于移动计算平台的轨迹数据挖掘语义化感知技术研究》一文中研究指出如今智能手机的发展发生了质的飞越,无论是硬件技术还是软件技术,双核、四核智能手机在现今的人们看来已是很平常,操作系统也在更新换代,对于人工智能已不是遥不可及。智能手机平台上的各种应用给人们提供了极大的便利。因此,利用智能手机来实现数字化轨迹感知正是适应了这一主流趋势,充分拓展了智能手机的应用范围。随着人们对4A(anything,anywhere,anybody,anytime)位置信息的需求不断增加,当前实时位置信息已成为人们最受关注的服务之一,现如今人们的活动范围越来越大,随之而来的是越来越多的不确定性。这种移动性和不确定性给数字化轨迹研究带来了更多可能性,也让位置感知计算推进了一大步。该技术通过GPS和WiFi进行结合,在不同的情景下使用不同的定位方式,以移动设备终端进行数据采集,对行为轨迹信息结构设计和语义化,便于用户进行行为轨迹信息的分析查询。(本文来源于《科技资讯》期刊2019年24期)

张稼,陆兴华[2](2019)在《基于语义关联特征的大型信息管理系统数据挖掘技术》一文中研究指出为了提高大型信息管理系统的数据检索和挖掘能力,提出了一种基于语义关联特征提取的大型信息管理系统数据挖掘技术。构建云存储模型进行大型信息管理系统中大数据分布式存储设计,结合大数据信息流的特征重组方法进行信息管理系统的优化结构重组,在重组的信息管理系统拓扑结构中提取信息管理分布数据的语义关联维特征量,以语义关联特征量为训练样本集进行信息管理系统的集成调度和数据挖掘,采用模糊C均值算法进行大型信息管理系统中分布数据语义关联特征的自适应融合和聚类处理,采用特征压缩器进行大型信息管理系统的存储空间降维处理,提高目标数据挖掘能力和信息管理系统的自适应调度能力。仿真结果表明,采用该方法进行大型信息管理系统数据挖掘的准确性较好,语义关联聚类性较强,提高了对信息管理系统目标数据的检索和调度能力。(本文来源于《电子测量技术》期刊2019年04期)

米捷,刘道华[3](2019)在《基于语义关联性特征融合的大数据挖掘方法》一文中研究指出提出一种基于语义关联性特征融合的大数据挖掘算法.对云存储大数据分布式信息流进行高维相空间重构,在重构的相空间中提取大数据的语义关联维特征量,以提取的特征量为测试集进行自适应学习训练.采用模糊C均值算法进行大数据语义关联特征的稀疏性融合和聚类处理,在聚类中心实现对挖掘目标数据的指向性聚敛,输出数据挖掘结果,并采用特征压缩器进行降维处理,降低计算开销.仿真结果表明,采用该方法进行大数据挖掘的特征提取准确性较好,挖掘数据的聚类能力较强,在实时性和准确性方面具有优势.(本文来源于《信阳师范学院学报(自然科学版)》期刊2019年01期)

周亮[4](2018)在《基于语义相似性关联特征提取的大数据挖掘技术》一文中研究指出为了提高武器装备信息管理数据库中的大数据挖掘能力,提出一种基于语义相似性关联特征提取的大数据挖掘技术。构建武器装备信息管理数据分布式结构模型,采用关联规则信息融合方法进行大数据分块结构匹配处理,结合自适应回归分析方法进行武器装备信息管理数据的关联特征提取,对提取的装备管理数据的关联规则特征量进行属性分类识别,计算大数据的语义相似性关联特征量,结合判决统计分析方法进行大数据的融合调度,采用语义划分方法进行大数据模糊聚类处理,实现武器装备信息管理数据库中的大数据自适应挖掘。仿真结果表明,采用该方法进行大数据挖掘的准确性较高,对冗余数据的抗干扰能力较强,提高了武器装备大数据的自适应挖掘和检索能力。(本文来源于《智能计算机与应用》期刊2018年05期)

陶健[5](2018)在《基于语义的隐私保护车辆轨迹数据挖掘技术研究》一文中研究指出随着车载智能终端设备、各种定位技术(GPS、GSM、RFID等)和存储技术的快速发展,海量车辆轨迹数据被收集存储,并应用于用户行为分析、交通流量预测、异常车辆检测等多个领域。然而车辆轨迹数据中含有的大量冗余信息和敏感信息又制约着车辆轨迹数据挖掘的发展。因此,本文基于离线车辆轨迹数据,利用车辆轨迹的时空特征以及相关语义知识进行展开研究,具体研究工作如下:(1)针对基于轨迹时空属性的停留点提取方法实用性低的问题,本文从轨迹语义的角度剖析车辆轨迹的特点,提出一种不依赖真实路网环境的车辆轨迹停留点提取算法;利用真实出租车轨迹数据集的实验结果表明,该算法相比现有停留点提取算法有更好的实用性。(2)针对基于轨迹空间属性的兴趣区域挖掘方法应用性低的问题,本文从轨迹时空属性的角度并结合用户出行习惯,提出基于密度的时空聚类算法来细粒度发现兴趣区域的变化,同时利用地理反编码技术和ArcGIS软件,对兴趣区域进行语义标注,并可视化在地图上。仿真实验结果表明,该算法相比现有兴趣区域挖掘算法有更好的应用性,且可以直观的发现不同时段兴趣区域分布。(3)针对车辆轨迹移动模式挖掘时会泄露车辆位置隐私问题,本文从车辆轨迹语义的角度保护敏感位置,提出基于语义空间匿名的移动模式挖掘算法。该算法利用兴趣点的地理空间分布特征,对轨迹停留点进行空间匿名以满足(k,l)隐私保护模型的同时,实现频繁移动模式挖掘;理论分析算法的安全性,仿真实验验证算法不仅有效降低轨迹信息损失度,而且对发现的频繁移动模式的空间语义解释性更高。(本文来源于《安徽师范大学》期刊2018-06-01)

彭盛兰[6](2018)在《基于数据挖掘的用户语义智能分析系统设计与开发》一文中研究指出用户反馈是用户体验优化的重要组成部分,对于互联网产品来说,用户评论则是用户反馈最直接的组成部分。通过处理用户评论,能有效地获取用户需求,挖掘产品的可用性问题,为产品的优化迭代提供切实有力的支撑。在大数据时代,数据挖掘技术得到了飞速发展。本文所涉及开发的基于数据挖掘的用户语义智能分析系统旨在利用人工智能简化用户反馈的分析过程,将设计师从冗杂重复的案头工作中解放出来,探索人工智能在设计研究中的应用方式。本系统以自然语言处理技术为核心技术点,对自然语言处理在中文语境中的应用进行了详细的实践。系统的主要功能包括用户将大文本的用户评论上传至系统进行分析,系统则输出包括需求,关键词,优缺点在内的top10问题,以及每个问题所属的原始评论。系统为后续设计研究中的各项工作提供强有力的支撑。用户语义智能分析系统通过对用户反馈的原始评论进行详细的分析,来探索评论中用户需求和产品可用性问题的表达方式和构成特征,并提出了具有普遍适用性的用户需求和可用性问题的基础构成形式。在此基础上,利用现有的自然语言处理技术对原始文本进行分词分句,情感分析和依存文法分析等语义处理,然后利用观点分析,观点标签抽取和极性分析等方法对语义处理结果进行分析,最后,进行数据相似度计算以获得用户需求和产品可用性分析的聚类结果。本文探讨了功能设计的策略,在充分研究了使用场景和用户认知的基础上,使用以用户为中心的设计方法,提出了系统的设计流程。通过多次用户反馈进行功能设计迭代,最终构建了系统的交互界面设计模型。最后,在充分实践的基础上,根据交互原型,设计了该系统的可视化界面。经由设计师和工程师的共同努力,最终将产品实现并投入使用。该系统能够应用在设计研究中,切实地提高在大量用户信息中获取有效信息的效率。本文对于人工智能在设计中的应用做出了探索和尝试,并为设计研究提供了新的工具和方法。(本文来源于《湖南大学》期刊2018-04-20)

涂鼎[7](2016)在《基于层次语义结构的流式文本数据挖掘》一文中研究指出文本作为一种人类信息交流的基本方式,在非结构化数据中占有极其重要的地位。与其他形式的数据相比,文本数据通常价值较高,因而对文本数据自动分析和挖掘方法的研究一直是计算机领域的一个热门话题。目前互联网上的文本数据增长十分迅速,且是每时每刻持续不断生成的,因此可将其看作是一条条连续的文本流。与传统文本数据相比,流式文本数据具有一些新的特点:1)文本流中的很多数据是低质量的,较难提取有效语义信息;2)文本流中的模式是动态变化的,对挖掘技术提出了准确捕捉这种变化的要求。以上这些特点对现有文本数据挖掘技术提出了新的挑战。目前流式文本数据挖掘技术尚未十分完善,急需提出针对以上挑战的相关算法。层次结构作为常见的数据组织方式,不仅能够更加精确的反映数据间的固有关系,并且是实现自适应方法的一种重要途径,而基于自适应方法可实现自动匹配流式数据中不断变化的模式。本文将层次结构应用到流式文本数据挖掘中,从概念层次构建、稀有类别检测和在线主题检测等叁方面入手,提出了叁种方法以期提高流式文本数据挖掘的性能。最后基于上述方法,本文提出了一种针对流式文本数据挖掘的半监督在线层次主题模型。本文具体贡献如下:1)针对现有概念层次构建方法在微博、用户评论等不规范短文本中语义关系提取精度较低的问题,提出了一种基于复合语义距离的多路概念层次构建方法。该方法中的复合语义距离结合了语义字典距离和上下文距离的优点,并且保证了方法的适用范围和所获取的语义关系的精度。同时,本文还提出一种改进的多路凝聚聚类算法用以构建概念层次。相对传统凝聚聚类而言,多路凝聚聚类能保持概念对间的相对远近关系。此外,本文还提出一种改进的概念层次相似度标准,该标准解决了其原始形式中可能出现的多次匹配问题。实验结果表明,该方法生成的概念层次与真实概念层次的相似度为所有对比方法中最高。2)针对从文本流的概念层次或主题层次中发现新概念或主题的问题,提出了一种基于层次密度聚类的稀有类别检测方法。在社交网络或新闻流中,发现新颖的文档或者新兴主题是很有价值的,异常检测在新颖数据检测中可发挥关键作用。为了改进现有检测方法,本文首先提出了一种基于相对距离约束和核函数的半监督密度聚类算法(Relative Comparison Kernel Mean Shift,RKMS)。与其原始形式相比,RKMS可扩展性更强,且更加适合层次聚类这种应用场景。然后本文基于RKMS提出了一种基于层次结构的稀有类别检测方法。与现有同类方法相比,该方法的优点是无需预先指定类别的数目,且可通过结合主动学习和半监督学习实现模型的逐步优化。实验结果表明,该稀有类别检测方法在使用线性映射和非线性映射的情况下均比其他方法表现更好。3)针对从持续输入的文本流中检测和跟踪主题的问题,提出了一种在线的层次主题模型(Hierarchical Online Non-negative Matrix Factorization,HONMF)。现有在线主题模型大多以扁平方式组织已发现的主题,但将每个主题视作互相独立的个体忽略了主题间的潜在关系,因而限制了这些主题模型的表达能力。针对该问题,本文首先对在线字典学习方法进行扩展并提出一种层次的在线稀疏矩阵分解方法,其可生成以层次形式组织的主题。同时,本文借鉴均值漂移(Mean Shift)聚类的思想提出一种基于主题带宽(Topic Bandwidth)的主题层次结构控制机制,其可自适应的决定主题节点的数目和主题层次的深度。此外,本文还提出在已有主题层次中检测新兴主题和消亡主题的标准,并基于这些标准实现主题层次结构的动态演化。实验结果表明,HONMF能够在更短的运行时间内发现更高质量的主题,并且可跟踪主题结构的变化。4)为了验证本文研究路线的整体效果和进一步提升HONMF的性能,提出了一种基于语义关系的半监督层次在线主题检测框架(Semantic Relation based Semi-supervised Hierarchical Online Non-negative Matrix Factorization,SSHONMF),其将本文前述研究工作整合融合到一套流程中。该流程首先根据语义词典和训练文档生成针对特定文本挖掘任务的概念层次,并基于其中的语义关系对原始文档矩阵进行调整。接着其会使用HONMF检测文本流中的主题层次,同时基于本文稀有类别检测方法中的选择指标从主题层次中选择出线索文档。最后,其将根据线索文档学习出新的相似度度量并用于后续的HONMF过程。实验结果表明,通过结合前述方法,SSHONMF的性能比HONMF有所提升,证明了本文研究路线的合理性和有效性。(本文来源于《浙江大学》期刊2016-04-01)

陈世莉,陶海燕,李旭亮,卓莉[8](2016)在《基于潜在语义信息的城市功能区识别——广州市浮动车GPS时空数据挖掘》一文中研究指出随着中国城市化进程的不断推进和深入,城市内部空间结构正发生不断的变化。城市内部形成的不同功能区标识研究,对城市结构理论以及政策制定、资源配置等方面具有非常重要的意义。这些不同的功能区包括住宅区、工业区、教育区以及办公区等。本文以大数据为依托,重点研究城市功能区的特点和分布状态,选取广州市6个区为样本,以最新道路网络为分割依据把研究样本分为439个区域。对历时一周的海量浮动车(GPS)数据以及兴趣点数据采用时空语义挖掘方法,建立潜在的狄利克雷模型(LDA)以及狄利克雷多项式回归模型(DMR);通过OPTICS聚类方法对不同模型的结果进行聚类,进而利用POI类别密度、居民出行特征等方法进行分区结果识别。同时,参考百度地图的地理信息,将研究得到的广州市功能分区结果与广州市城镇用地现状图、居民日常出行特征进行对比验证分析。研究表明,该方法基本能识别出具明显特征的城市功能区,如成熟居住区、科教文化区、商业娱乐区、开发区等。识别出的广州市不同类型的功能区呈现了以居住区和商业区为主导,其他类型功能区围绕其展开的特点。研究证明,利用大规模、高质量的个体时空数据开展人们移动行为和日常活动组织及社会空间的研究,能从一个新的视角揭示城市功能区的形成及其机制。(本文来源于《地理学报》期刊2016年03期)

张达,罗云[9](2015)在《基于语义的船艇火灾预案核心数据挖掘》一文中研究指出船艇中大都集中了众多的易燃物,而且多数集中不知道一起,热源分布极为广阔,火灾很容易发生。船艇火灾一旦发生,必然火势猛烈、蔓延快速而且烟多雾多,同时,考虑到船艇灭火空间相对较为狭窄,很可能引发较为严重的事故。针对这一问题,相关人员必须设计出合适的船艇火灾预案。本文主要对基于语义的船艇火灾预案核心数据进行介绍,希望能够为相关人员提供一定的参考借鉴。(本文来源于《黑龙江科技信息》期刊2015年14期)

杨立波,李新宇[10](2014)在《语义web数据挖掘在电子教学上的实施》一文中研究指出语义web是web2.0时代计算机对网络发展做出的定义,是自动语义处理用户的数据,以帮助用户使用,同时提供个性化的服务。web数据挖掘是数据挖掘的一个应用,利用数据挖掘技术从网络文档中抽取并且发现信息,着重从web日志和数据中发现模式。语义结构可以通过web挖掘发现的模式或关系来构建,通过结合两个应用程序,实现语义web挖掘。在电子教学中的web挖掘应用,已成为一个教育的基本组件。(本文来源于《太原大学学报》期刊2014年03期)

语义数据挖掘论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为了提高大型信息管理系统的数据检索和挖掘能力,提出了一种基于语义关联特征提取的大型信息管理系统数据挖掘技术。构建云存储模型进行大型信息管理系统中大数据分布式存储设计,结合大数据信息流的特征重组方法进行信息管理系统的优化结构重组,在重组的信息管理系统拓扑结构中提取信息管理分布数据的语义关联维特征量,以语义关联特征量为训练样本集进行信息管理系统的集成调度和数据挖掘,采用模糊C均值算法进行大型信息管理系统中分布数据语义关联特征的自适应融合和聚类处理,采用特征压缩器进行大型信息管理系统的存储空间降维处理,提高目标数据挖掘能力和信息管理系统的自适应调度能力。仿真结果表明,采用该方法进行大型信息管理系统数据挖掘的准确性较好,语义关联聚类性较强,提高了对信息管理系统目标数据的检索和调度能力。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语义数据挖掘论文参考文献

[1].普树芳.基于移动计算平台的轨迹数据挖掘语义化感知技术研究[J].科技资讯.2019

[2].张稼,陆兴华.基于语义关联特征的大型信息管理系统数据挖掘技术[J].电子测量技术.2019

[3].米捷,刘道华.基于语义关联性特征融合的大数据挖掘方法[J].信阳师范学院学报(自然科学版).2019

[4].周亮.基于语义相似性关联特征提取的大数据挖掘技术[J].智能计算机与应用.2018

[5].陶健.基于语义的隐私保护车辆轨迹数据挖掘技术研究[D].安徽师范大学.2018

[6].彭盛兰.基于数据挖掘的用户语义智能分析系统设计与开发[D].湖南大学.2018

[7].涂鼎.基于层次语义结构的流式文本数据挖掘[D].浙江大学.2016

[8].陈世莉,陶海燕,李旭亮,卓莉.基于潜在语义信息的城市功能区识别——广州市浮动车GPS时空数据挖掘[J].地理学报.2016

[9].张达,罗云.基于语义的船艇火灾预案核心数据挖掘[J].黑龙江科技信息.2015

[10].杨立波,李新宇.语义web数据挖掘在电子教学上的实施[J].太原大学学报.2014

标签:;  ;  ;  ;  

语义数据挖掘论文-普树芳
下载Doc文档

猜你喜欢