数据挖掘本体论文-黄飞

数据挖掘本体论文-黄飞

导读:本文包含了数据挖掘本体论文开题报告文献综述及选题提纲参考文献,主要关键词:本体,数据挖掘技术,商务智能

数据挖掘本体论文文献综述

黄飞[1](2018)在《基于本体的数据挖掘技术在商务智能中的应用》一文中研究指出随着信息技术的迅猛发展,人们已经进入信息时代,信息的类别和数量不断增多,这在一定程度上加大了企业决策的难度,导致很多企业无法紧跟时代发展步伐。在信息时代,企业管理者必须具备信息处理能力,能够从大量信息中筛选出有价值的信息,并转换为商业信息。在新形势下,基于本体的数据挖掘技术被广泛应用于商务智能中,该技术可以实现信息的自动化处理,满足企业管理和发展需求。(本文来源于《中国商论》期刊2018年36期)

巩晓敏,沈惠璋,邓莎莎[2](2018)在《基于本体关系的群体事件网络关注度影响因素数据挖掘研究》一文中研究指出随着社会的发展,我国群体性事件逐渐增多,且发生得日益频繁,这极大地影响到了广大人民群众和相关企事业单位的正常生活和生产。尤其是伴随着互联网的日益普及,越来越多的群体事件以网络为依托反映个人诉求,群体事件网络关注度成为众多学者关注的焦点。在分析群体事件特征的基础上,运用基于本体关系的数据挖掘算法,对群体事件网络关注度进行分类,获取了分类规则,并对分类规则进行了分析,为我国群体事件预警和治理提供了决策依据。(本文来源于《上海管理科学》期刊2018年05期)

程翔[3](2017)在《基于本体数据库的多标签预测模型及生物医药数据挖掘研究》一文中研究指出随着信息、概念和术语以指数级别的速度在飞速增长,本体数据库在生物信息领域的应用变得越来越广泛。本体数据库旨在统一科学术语,完成新老知识的无缝对接。GO(Gene Ontology)数据库和Ch EBI(Chemical Entities of Biological Interest)是两个典型的本体数据库。GO数据库是一个大型的存储基因产品生物功能的数据库。它的发起源于生物学家要求对不同领域的基因产品进行统一记录存储,以便更方便快捷地注释新的基因产品。Ch EBI数据库则专注研究小化学实体的分子。本体数据库应用于预测模型的典型方法大致有两种:分类图形结构相似方法和信息内容相似方法。但是,由于数据的飞速增长,以及人工智能技术的发展,老的预测模型已经不能够满足研究人员的要求。本文通过构造Bayes统计降维方法和OIPM(Ontology Information Probability Model)特征提取方法,使用新创建的多标签预测算法进行模型构建,提高了蛋白质亚细胞预测模型和药物预测模型的性能,缩短了模型的运行时间。通过Jacknife交叉验证方法的测试,与最新的预测模型对比,证实了新建预测模型的有效性。为了便于生物实验科学家和药物研究人员开发和研究使用,本文构建了网络蛋白质亚细胞预测服务器和药物ATC(Anatomical Therapeutic Chemical)类别预测服务器。以下是论文的主要工作和创新点:(1)创建了新的多标签算法ML-GKR(Multi-Label Gaussian Kernel Regression)。多标签分类是机器学习新兴的领域,它属于多分类问题的特殊情况。多标签分类中的每个案例可能会被分配一个或者多个目标标签。ML-GKR由高斯核回归算法演变而来,融入了多标签的属性。在多标签ATC药物分类模型研究章节中,通过将ML-GKR算法与经典的多标签算法ML-KNN(Multi-Label K-Nearest Neighbor)和RankSVM算法进行对比,发现除Aiming以外,ML-GKR在Chou的五个多标签评价指标的其他四个方面都是最优的。尤其是对多标签算法最重要的Absolute true评价指标,ML-GKR算法的预测值达到60.98%,比ML-KNN和RankSVM分别高6.82%,25.21%。在CPU处理器为(x64)4*2.6G的计算机(Windows7操作系统,4G内存)上运行,ML-GKR算法Jacknife测试的运行时间只有ML-KNN和RankSVM的0.3%和0.03%,运行时间为3分钟。(2)多标签药物ATC分类模型研究。指定一个药物化合物,我们提取出化合物-化合物交互信息、化合物-化合物结构相似信息和分子指纹相似信息作为样本特征,应用多标签算法ML-GKR,预测出药物的ATC类别及他的可能活性成分、治疗、药物和化学性质。该分类模型实现了第一个多标签ATC药物分类模型网站。以前的药物ATC分类网站为单标签预测模型,即一种药物只可以标记为14个ATC类中的某一个类。但是,某一个ATC药物可能同时属于多个ATC类。通过对该药物ATC分类模型研究,我们发现它对于旧药重利用有重要指导作用。我们使用网络预测模型对3883个药物进行预测分析,有1229药物样本被预测为假阳性。通过对部分药物预测结果的假阳性分析,我们发现假阳性可以指导药物的重利用和再开发。(3)基于ChEBI的多标签药物ATC分类模型研究。研究了如何根据药物在ChEBI数据库中的本体信息,抽取药物特征向量的问题。开发出来一个新的模型叫做OIPM,根据ChEBI中叙述化合物功能语义之间的差异来量化两个化合物之间的相似性。将OIPM与化合物-化合物交互信息、化合物-化合物结构相似信息和分子指纹相似信息等样本特征融合在一起,实现药物ATC类别预测精度的进一步提高。为此,我们开发了一个多标签ATC药物预测模型i ATC-mHyb。根据一个化合物特征功能的语言叙述,预测出它的治疗、药物和化学性质。这是一个重要,并且具有挑战性的问题,因为它的预测结果将有助于药物的开发和利用。(4)基于GO的多标签动物蛋白质亚细胞定位预测模型研究。该预测模型在最新的动物亚细胞位置预测模型iLoc-Animal的基础上进行改进后得到的。网络服务器的访问地址为:http://www.jci-bioinfo.cn/pLoc-mAnimal/。iLoc-Animal动物蛋白质的GO特征向量采用了GO术语频率(Term Frequency)方法。这种方法类似于1-0方法,1-0方法的特征向量中的每个元素的值只能为1或0,1代表GO术语对该蛋白质有标记,0表示GO术语对该蛋白质没有标记。而GO术语频率方法的特征向量中的每个元素的值为大等于0的整数,0表示GO术语对该蛋白质没有标记,其它数值表示给定蛋白质以及同源蛋白的GO术语出现的频率计数。本文提出的多标签动物蛋白质亚细胞定位预测模型pLoc-Animal使用了基于贝叶斯统计的特征向量降维方法。该方法假设样本中每个特征变量之间独立不相关,对每个GO术语进行贝叶斯统计,计算它与蛋白质亚细胞位置的关联度。然后,统计最大的关联值,以此作为蛋白质的特征向量。贝叶斯概率统计降维方法对iLoc-Animal中的GO特征向量进行降维,蛋白质特征向量维数从3043降到20维。pLoc-Animal模型采用多标签分类算法MLGKR,融合了GO特征向量和Grey-PSSM(Grey-Position Specific Scoring Matrix)矩阵特征向量,构造出预测动物蛋白质亚细胞位置的多标签模型。pLoc-Animal预测模型的绝对正确率达到0.6193,与预测模型i Loc-Animal相比提高了0.16。由于数据特征维的降低,预测模型的运行时间也大大降低。在(x64)4*2.6G CPU处理器,4G内存,Windows7操作系统的计算机上,对iLoc-Animal预测模型进行Jacknife测试,需要花费一个多月的时间。同样的硬件平台和操作系统,对动物蛋白质亚细胞位置预测模型pLoc-Animal进行Jacknife测试,只需要2分钟。同时,由于预测模型的运行时间大大地降低,对ML-GKR参数的优化也成为可能。(5)非平衡多标签集成植物蛋白质亚细胞定位预测模型研究。创建了多标签植物蛋白质亚细胞定位预测模型pLoc-mPlant,网络服务器的访问地址为:http://www.jci-bioinfo.cn/pLoc-mPlant/。通过分析发现,植物蛋白质数据集的各类蛋白质之间数量差别比较大,978个蛋白质中,属于Golgi apparatus和peroxisome类的只有21个,属于chloroplast类的有286个。同样可以注意到,Golgi apparatus和peroxisome类的蛋白质正负样本比率接近1:50。针对植物蛋白质数据集的非平衡特点,构建两个新的多标签集成算法EML-GKR-1和EML-GKR-2。其中,EML-GKR-1算法融合了上采样和下采样技术处理植物蛋白质数据集的非平衡问题,EML-GKR-2算法融合了代价敏感方法用于处理植物蛋白质数据集的非平衡问题。预测模型以蛋白质GO特征向量表示蛋白质特征,分别使用了叁种多标签算法(ML-GKR、EML-GKR-1和EML-GKR-2)对植物蛋白质亚细胞位置进行预测。与最新的植物蛋白质亚细胞位置预测模型相比,新的集成算法在标准数据集上性能有较大提高。(本文来源于《东华大学》期刊2017-10-01)

谢江安[4](2016)在《基于本体的叁类上市疫苗相关不良反应数据挖掘与分析》一文中研究指出疫苗作为当代医学最伟大的发明之一,在过去的两个多世纪里对于减轻传染病给人类带来的苦难、延长人类平均寿命起到了不可替代的重要作用。然而,疫苗接种经常伴随着一些不良反应(adverse event,AE)的发生,其中一些不良反应是严重的甚至致命的。理解掌握特定疫苗不良反应发生谱系对于预测潜在的严重不良反应(serious adverse event,SAE)、改善疫苗安全性至关重要。鉴于此,疫苗安全警戒(vaccine pharmacovigilance)作为一门新兴的医药科学,旨在收集、检测、评估、监控和预防疫苗相关的不良反应。基于此论文作者参与开发的不良反应本体(Ontology of Adverse Events,OAE)方法,本文重点研究了叁类具有代表性的上市疫苗不良反应发生谱系。首先,对预防甲肝和乙肝的单价疫苗(Havrix和Engerix-B)及联合疫苗(Twinrix)相关的不良反应进行了统计分析并做了基于本体的分类研究。在此基础上,设计了一种整合MCMC抽样的逻辑回归模型用于预测疫苗间的相互作用对不良反应结果的影响;其次,基于不良反应报告系统(Vaccine Adverse Event Report System,VAERS)数据库数据和PubMed文献荟萃分析数据,对卡介苗(BCG)作为结核病预防性疫苗和膀胱癌治疗性疫苗相关的不良反应进行了本体化的统计分析研究;最后,对上市布鲁氏菌病疫苗(S19、Rev1和RB51)在动物和人群中引发的不良反应进行了基于本体方法的荟萃分析研究。本文的研究结果不仅有利于上市疫苗安全性的监督管理,而且有助于设计更为安全有效的新疫苗。与此同时,本文研究方法同样适用于其他上市疫苗相关的不良反应数据挖掘与分析。本文主要研究结果如下:(1)自2001年5月至2015年7月,对于年龄不小于18岁的接种者,VAERS累计报道了941、3885和1624例不良反应案例分别与Havrix、Engerix-B和Twinrix有关。经过一系列生物医学信息统计筛选,我们共计得到了46、69和82个有统计学意义的AEs分别与Havrix、Engerix-B和Twinrix有关。基于OAE的分类分析表明:这些有统计意义的AEs主要涉及到接种者的行为和神经学病变、免疫系统、视觉系统和肝胆系统。其中29个AEs被归集为SAEs,且黄疸是唯一一个与叁种疫苗都相关的SAE。为了识别两种单价苗同时使用而潜在发生的疫苗-疫苗相互作用信号,我们设计了一个整合MCMC抽样的逻辑回归模型。基于该模型,13个AEs的发生被识别出受到疫苗与疫苗之间的协同相互作用影响。此外,同时采用OAE和Med DRA对这13个AEs进行了等级分类,针对分类结果所做的比较分析清晰地表明了OAE在AE等级分类分析上的诸多优势。(2)从397例VAERS报道的BCG疫苗接种不良反应案例中,我们共计得到了64个有重要统计意义的AEs与BCG作为结核病预防性疫苗接种有关;14个有统计意义的AEs与BCG作为膀胱癌治疗性疫苗有关。从PubMed文献库中获得的41篇同行评议论文荟萃分析挖掘出了48个AEs与结核病预防性BCG疫苗有关;43个AEs与膀胱癌治疗性BCG疫苗有关。基于OAE的本体等级分类研究指出:BCG作为结核病预防性疫苗相关的不良反应主要集中在免疫系统、皮肤和呼吸系统;相比之下,BCG作为膀胱癌治疗性疫苗相关的不良反应主要发生在泌尿系统。尽管BCG两种用途引发的不良反应谱系截然不同,我们依然发现叁种AEs同时与BCG的这两种用途有关,即寒栗、肺炎和C反应蛋白水平升高。此外,针对VAERS数据库中24例BCG疫苗接种相关的死亡案例报告的荟萃分析表明疫苗接种者的实际年龄、同时接种的其他疫苗和接种者自身免疫状态对死亡结果的发生有重要影响。(3)基于PubMed文献库检索到的27篇同行评议论文,我们的荟萃分析识别出20种AEs发生在动物的布鲁氏菌病疫苗接种过程中;46种AEs发生在由于非主观原因而意外接种动物布鲁氏菌病疫苗的人群中。OAE等级分类研究表明:这些动物相关的不良反应主要集中在动物的免疫和生殖系统,并最终导致流产或不孕不育的发生;而人相关的不良反应主要涉及到行为和神经学方面的病变,并表现出类似流感发生的症状,这与人类直接感染布鲁氏菌出现的临床症状是基本一致的。另一方面,基于方差分析的线性匹配模型用于检测动物在疫苗接种过程中的哪些变量对流产不良反应的发生有重要影响。模型结果指出接种动物种属类型、接种疫苗剂量和疫苗接种途径叁个变量对流产发生有重要影响;其他两种变量(接种动物年龄和接种疫苗类型)对流产的发生无显着性影响。总的来说,本研究的结果有利于我们更好的理解布鲁氏菌病疫苗引发的人畜不良反应,同时有助于未来设计更安全有效的布鲁氏菌病疫苗。(本文来源于《重庆大学》期刊2016-10-01)

蒋志远,郭渊[5](2016)在《CAPP中基于本体和CBR技术的数据挖掘建模研究》一文中研究指出研究了基于本体的数据挖掘事例库的构建、两级事例检索策略(以基于本体的语义理解为第一级事例检索,以数值相似度计算为第二级事例检索)、语义相似度计算方法、数值相似度计算方法等技术,将本体技术和CBR技术集成起来构建了基于本体的CBR系统,并通过大量实验验证了其有效性。(本文来源于《装备制造技术》期刊2016年06期)

郑廷,张云涛[6](2016)在《基于领域本体的数据挖掘技术在贿赂犯罪侦查中的应用》一文中研究指出针对目前职务犯罪中日益增长的贿赂犯罪涉案人员关系复杂的特点,在传统侦查方法的基础上,可以尝试利用领域本体概念建立贿赂犯罪案件的专业知识模型,并根据该模型分析计算贿赂犯罪案件的资料和电子信息,利用数据挖掘技术关联关系算法从犯罪嫌疑人的社会关系人群中筛选出案件相关人,从而为获取新的案件线索与突破案件提供辅助性帮助。(本文来源于《中国检察官》期刊2016年03期)

任维武,胡亮,赵阔[7](2015)在《基于数据挖掘和本体的入侵警报关联模型》一文中研究指出为了突破入侵检测领域的原有瓶颈,提出了一种新的基于数据挖掘和本体的入侵警报关联模型。该模型通过对底层警报的聚类和分类,发现并且筛选攻击,然后根据已建立的基于本体的攻击知识模型,对这些攻击进行关联,以达到识别、跟踪和预测多步攻击的目的。通过对KDD Cup1999和DARPA 2000数据集的模拟实验,验证了模型的有效性。(本文来源于《吉林大学学报(工学版)》期刊2015年03期)

张轶辉[8](2015)在《数据挖掘系统对本体的应用》一文中研究指出数据挖掘的重点在于从大量数据中把未知的有价值的新知识或规律给挖掘出,在信息产业界的极大关注。数据挖掘会常受人为因素干扰,主要因为此项工作是不断重复的过程。业务人员与数据库技术人员在挖掘准确阶段共同确定目标数据后需由数据挖掘专家提供帮助选择适合的模型、算法。将专家引入数据挖掘过程中能补充和促进相关知识和知识背景,有利于挖掘,避免产生无意义的结果。(本文来源于《信息通信》期刊2015年04期)

张轶辉[9](2015)在《在领域先验知识本体需求下的数据挖掘改进分析》一文中研究指出以顾客需求及行为理论为基础,结合新时期顾客需求管理领域的先验性知识,对领域先验知识本体需求下的数据挖掘改进方法进行了积极探究,并在后续文章写作中研究了挖掘算法的选择及设置约束条件等,以期能为新时期顾客需求数据挖掘有效性的改进提供有益的参考,促进顾客需求知识的共享。(本文来源于《电脑编程技巧与维护》期刊2015年03期)

穆俊[10](2014)在《基于本体的数据挖掘技术应用于商务智能中的实际应用》一文中研究指出首先阐述了挖掘技术与商务智能的含义,指出了数据挖掘技术应用在商务智能中的意义,结合新时期我国各大企业的发展实际,对基于本体的数据挖掘技术应用在商务智能中的实际情况进行了分析,旨在利用数据挖掘技术,发挥出企业商务智能系统的优势,提高企业核心竞争力,促进企业长远发展。(本文来源于《微型电脑应用》期刊2014年12期)

数据挖掘本体论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着社会的发展,我国群体性事件逐渐增多,且发生得日益频繁,这极大地影响到了广大人民群众和相关企事业单位的正常生活和生产。尤其是伴随着互联网的日益普及,越来越多的群体事件以网络为依托反映个人诉求,群体事件网络关注度成为众多学者关注的焦点。在分析群体事件特征的基础上,运用基于本体关系的数据挖掘算法,对群体事件网络关注度进行分类,获取了分类规则,并对分类规则进行了分析,为我国群体事件预警和治理提供了决策依据。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数据挖掘本体论文参考文献

[1].黄飞.基于本体的数据挖掘技术在商务智能中的应用[J].中国商论.2018

[2].巩晓敏,沈惠璋,邓莎莎.基于本体关系的群体事件网络关注度影响因素数据挖掘研究[J].上海管理科学.2018

[3].程翔.基于本体数据库的多标签预测模型及生物医药数据挖掘研究[D].东华大学.2017

[4].谢江安.基于本体的叁类上市疫苗相关不良反应数据挖掘与分析[D].重庆大学.2016

[5].蒋志远,郭渊.CAPP中基于本体和CBR技术的数据挖掘建模研究[J].装备制造技术.2016

[6].郑廷,张云涛.基于领域本体的数据挖掘技术在贿赂犯罪侦查中的应用[J].中国检察官.2016

[7].任维武,胡亮,赵阔.基于数据挖掘和本体的入侵警报关联模型[J].吉林大学学报(工学版).2015

[8].张轶辉.数据挖掘系统对本体的应用[J].信息通信.2015

[9].张轶辉.在领域先验知识本体需求下的数据挖掘改进分析[J].电脑编程技巧与维护.2015

[10].穆俊.基于本体的数据挖掘技术应用于商务智能中的实际应用[J].微型电脑应用.2014

标签:;  ;  ;  

数据挖掘本体论文-黄飞
下载Doc文档

猜你喜欢