导读:本文包含了因果关系发现论文开题报告文献综述及选题提纲参考文献,主要关键词:数据挖掘,大数据,知识发现,定量
因果关系发现论文文献综述
舒晓灵,陈晶晶[1](2017)在《重新认识“数据驱动”及因果关系——知识发现图谱中的数据挖掘研究》一文中研究指出作为跨学科的一种方式,知识发现和数据挖掘是个多学科综合的领域。它的目标是识别和描述数据模式,向使用者传递有意义的数据模式信息,并运用一系列预测变量和它们的多重组合形式来高度准确地预测结果变量。数据挖掘实际上是知识发现的过程,包括理解问题领域、理解数据、数据准备、数据挖掘、评估新知识和使用新知识等环节,融合了归纳和演绎两种研究方法。该过程不仅回应了"数据为本"、"数据驱动"的误解,且为发现新理论与创新思维提供了新方式,为来自因果关系的挑战提供了新的解决途径。相较于传统社会科学研究方法,数据挖掘更关心对整个事件的完整阐述,利用多元、复杂和细节化的丰富数据,关注因果异质性和多重非线性关系,因此相比传统统计模型能更准确有效地预测解释结果。(本文来源于《中国社会科学评价》期刊2017年03期)
李何慧,陶伍海,彭聃龄,丁国盛[2](2017)在《发展性阅读障碍与脑异常的因果关系:研究范式及发现》一文中研究指出关于阅读障碍神经机制的研究已经有很多,但到目前为止,研究者仍不完全清楚,阅读障碍者脑区的异常,究竟是阅读障碍的原因还是结果。研究者发展出不同的研究范式来探究此问题,包括学龄前研究、双对照组研究、纵向研究等。文中综述了这些研究范式各具的优势、不足和研究结果之间的一致性,并分析了确认因果关系之所以困难的原因。在此基础上,提出如下建议:(1)细致区分阅读障碍的亚类型;(2)以成熟和完善的阅读认知-神经模型为指导;(3)通过不同的研究范式进行交叉印证;(4)综合考虑脑的动态发展变化特点,和基因、环境、经验的作用等多种因素的影响。(本文来源于《心理发展与教育》期刊2017年05期)
蔡瑞初,陈薇,张坤,郝志峰[3](2017)在《基于非时序观察数据的因果关系发现综述》一文中研究指出探索和发现事物间的因果关系是数据科学的一个核心问题,其中蕴含着丰富的科学发现机会和巨大的商业价值.基于非时序观察数据的因果关系发现方法能够从被动观察获得的数据中发现变量之间的因果关系,因而在各领域有广泛应用.这一类方法在过去叁十年取得很大进展,已经成为因果关系发现的重要途径.文中从因果关系方向推断、高维数据上的误发现率控制和不完全观察数据上的隐变量检测这叁个研究热点出发,对现有的因果关系模型与假设、基于约束的方法、基于因果函数模型的方法和混合型方法这叁大类方法,验证与测评涉及的数据集及工具等方面进行了详尽的介绍与分析.基于约束的方法主要包括因果骨架学习和因果方向推断两个阶段:首先基于因果马尔可夫假设,采用条件独立性检验学习变量之间的因果骨架,然后基于奥卡姆剃刀准则利用V-结构确定因果方向,典型的算法有Peter-Clark算法、Inductive Causation等,这类方法的主要不足是存在部分无法判断的因果关系方向,即存在Markov等价类难题.基于因果函数模型的方法则基于数据的因果产生机制假设,在构建变量之间的因果函数模型的基础之上,基于噪声的非高斯性、原因变量与噪声的独立性、原因变量分布与因果函数梯度的独立性等因果假设推断变量之间的因果关系方向,典型的算法有针对线性非高斯无环数据的Linear NonGaussian Acyclic Model算法、针对后非线性数据的Post-NonLinear算法、适用于非线性或离散数据的Additive Noise Model等,这类方法的主要不足是需要较为严格的数据因果机制假设,且Additive Noise Model等方法主要适用于低维数据场景.混合型方法则希望充分发挥基于约束的方法和基于因果函数类方法的优势,分别采用基于约束的方法进行全局结构学习和基于因果函数模型进行局部结构学习和方向推断,典型的算法有SADA、MCDSL等,理论分析较为不足是这类方法目前遇到的主要困难.最后,文中还基于研究现状分析讨论了因果方向推断、高维数据上的误发现率控制、隐变量发现、与机器学习的关系等未来可能的研究方向.(本文来源于《计算机学报》期刊2017年06期)
郝志峰,谢蔚涛,蔡瑞初,王丽娟,洪英汉[4](2017)在《基于因果强度的时序因果关系发现算法》一文中研究指出为准确推断时间序列间的因果网络,针对传统因果强度衡量方法的不足,提出一种基于信息熵的因果强度衡量标准(归一化因果熵)。为改进传统方法量纲不统一且冗余较多的缺点,通过归一化处理使量纲不同的节点间强度具备可比性,通过排除节点间的间接影响大幅减少冗余,更准确地衡量时序节点间的因果强度;在此基础上,设计时间序列的因果推断算法,以归一化因果熵衡量节点间因果关系的强弱,筛选强关系形成完整因果图。实验结果表明,该算法相比起传统算法更准确有效。(本文来源于《计算机工程与设计》期刊2017年01期)
李岩,王挺,刘万伟,张晓艳[5](2016)在《ICIC_Target:目标节点的局部因果关系网络的发现算法》一文中研究指出因果关系的研究在于揭示自然规律的和人类社会发展本质及其规律,对人类长久以来的生产生活和科学研究有着非常重要的作用.目前,因果关系的研究受到前所未有的广泛关注,但仍存在诸多困难和挑战.致力于建立一个因果激励/抑制模型以抽象地表示和解释因果的作用机制,并在此基础上提出用于目标节点的局部因果关系网络的自动发现方法框架ICIC和算法ICIC_Target.该方法不预先设定因果结构(如设定为无圈、隐含结构),并根据对因果关系本质的认识,利用初始变量(exogenous variables)和初始团树(IClique)的概念,在判定边和方向之前对变量进行粗略地排序,从而提高了因果关系网络发现的性能.在4个不同类型的数据集上实现了与多种经典方法,如HITON,IC,PC,PCMB等的对比实验,实验结果表明ICIC_Target方法适用范围广,有较好的鲁棒性,同时,从理论上分析证实了ICIC_Target方法具有较好的稳定性和较低的复杂度.(本文来源于《计算机研究与发展》期刊2016年07期)
谢蔚涛[6](2016)在《基于因果强度的时序因果关系发现算法研究》一文中研究指出随着计算机信息技术的快速发展,海量时间序列数据在工商业生产和科学研究过程中被收集。时间序列是指将某种现象某一个统计指标(如气温、股指、脉搏等等)在不同时间上的各个数值,按时间先后顺序排列而形成的序列。由于相比起传统的静态数据,时间序列数据背后包含着和时间动态有关的未知的、有价值的规律和机制,因此若能挖掘出这些知识进而对数据走向进行预测或干预,将对科学研究、商业营销、工程生产等方面产生重要意义。本文的工作是挖掘时序数据背后的因果网络。由于时序数据的变量间普遍存在因果性,而因果网络正好是分析事物间因果关系的有效工具,因此,因果网络比其它方法更适合于研究时序,成了该领域的常用方法。推断因果网络,实质是筛选出节点间的强关系组成完整因果图,由于节点间因果关系强弱不一,因此需要准确衡量出因果关系的强弱。然而,传统衡量标准普遍存在量纲不统一和冗余较多的缺点,无法准确衡量因果关系的强弱,严重影响时序网络因果推断的算法的准确性。针对这个情况,本文所做工作主要分为两部分:第一,针对传统衡量方法的两项不足,提出一种基于信息熵的因果强度衡量新标准,“归一化因果熵”,该方法的核心创新点有两项,一是通过归一化处理,使量纲不同的节点间强度具备可比性,统一了不同信息量的节点间强度的量纲,二是通过排除节点间的间接影响,减少高估强度的情况,大幅减少冗余,这两项改进使得“归一化因果熵”相比传统方法能更准确地衡量时序节点间的因果强度;第二,在此基础上,设计出相应的时间序列因果网络推断算法,以“归一化因果熵”衡量节点间因果关系的强弱,筛选出对单个节点形成强关系的“父辈”,再迭代计算每个节点相应的“父辈”子图,最终组成完整因果图,基于本文算法推断出的因果图相比起传统算法的推断结果,冗余更少,且能克服节点自信息量纲不统一带来的问题。在实验部分,本文通过人工生成的模拟数据集,在Matlab平台上进行实验验证。首先,设定标准数据集,通过ROC曲线测试传统算法和“归一化因果熵”在标准数据集下的实验表现,结果表明在召回率相同的情况下,“归一化因果熵”大幅降低了误中率,整体表现更优:然后,通过改变标准数据集中的数据特征,测试“归一化因果熵”和传统方法对数据集特征的敏感度,结果表明,“归一化因果熵”对数据特征变动的鲁棒性较好;最后,根据实验结果,分析“归一化因果熵”的不足和可改进之处。(本文来源于《广东工业大学》期刊2016-05-01)
袁畅[7](2016)在《基于时序的社交网络因果关系发现》一文中研究指出随着社交网络的飞速发展,越来越多的人开始挖掘社交网络潜在的价值,进而推动相关产业的发展,例如微商、微博营销、社交化电商等。在社交网络众多相关研究中,用户影响力对舆论引导、微博营销具有现实意义,是当前研究的难点和热点。现有的研究用户影响力的方法主要基于用户显式声明的好友网络,然而用户显式声明的好友网络往往具有较大的冗余性。具体表现为大量显式声明的好友网络对于用户的影响力没有实质作用。因此,如何基于用户行为数据,挖掘用户行为之间的因果网络是用户影响力评估的关键,具有重要的意义。然而,已有的社交网络因果关系推断方法中存在两个问题:1.无法识别间接因果影响而导致因果网络出现大量冗余边;2.没有充分考虑因果影响滞后长度。本文基于最小描述长度准则(MDL)对上述两个问题进行了统一建模,提出了一种新的模型MCRNC Minimal Causal Network)。在减少因果网络冗余方面,MCRN模型将因果传递熵算法应用于社交网络因果关系发现上,同时结合因果影响滞后长度对因果传递熵进行拓展,上述策略有效剔除了结构中的冗余边,提高算法的精确率;在探索因果影响滞后长度方面,使用MDL作为模型的评分标准,权衡模型的不确性和复杂度,有效降低了模型过拟合的问题。本文通过大量模拟数据集验证MCRN模型的多个评测指标都优于传递熵,因果传递熵等类似算法。通过新浪微博真实数据集的实验发现用户显式声明的好友关系很多不存在因果影响,存在因果关系的用户之间存在互动行为等现象,较好地验证了本模型的有效性。最后,本文以MCRN模型为理论基础,提出一个基于时序的社交网络因果关系发现系统的构建方案,简称MCRN系统,并给出系统架构和系统原型,该系统有助于用户准确直观地分析用户之间的因果关系,并进一步应用于现实生活中的其他领域。(本文来源于《广东工业大学》期刊2016-05-01)
姚宏亮,吴立辉,王浩,李俊照[8](2014)在《局部因果关系分析的隐变量发现算法》一文中研究指出结构分析的隐变量发现方法难以有效地发现隐变量且可解释性较差。基于因果关系和局部结构的不确定性,提出了一种基于局部因果关系分析的隐变量发现算法(hidden variable discovering algorithm based on local causality analysis,LCAHD)。LCAHD算法给出了因果结构熵的定义,将因果知识和不确定性知识相融合,以因果关系的不确定性程度作为隐变量存在的判定依据,并对这一依据进行了理论上的论证。LCAHD算法首先通过寻找目标变量的马尔科夫毯来提取局部依赖结构,并基于扰动学习获得扰动数据,联合扰动数据和观测数据学习局部依赖结构中的因果关系;然后利用因果结构熵对局部因果结构中因果关系的不确定性进行度量,并利用隐变量和因果关系不确定性之间的相关性判定条件,确定隐变量的存在性。分别针对标准网络和股票网络进行了实验,结果表明,该算法能准确地确定隐变量的位置,具有较好的解释性。(本文来源于《计算机科学与探索》期刊2014年04期)
金洲[9](2013)在《基于约束学习的观测数据因果关系发现研究》一文中研究指出人类对自然的探索活动本质上是发现各种现象的原因,因果关系能够给出各种现象的解释,而这些解释能帮助我们理解和掌握自然规律。设计良好的实验研究是获得因果关系的最有效的方法,但是实验研究容易受伦理道德、实验代价等因素的限制而无法开展。随着数据收集和存储技术的快速发展,在工程、医疗和科学实验等领域每天都产生不可计量的观测数据。在随机实验方法无法开展时,可以转向基于观测数据的因果发现。基于观测数据的因果发现方法即是利用科学的理论和方法,揭示了蕴含在海量的观测数据中的因果关系。从观测数据中发现因果关系具有非常重要的意义,同时也面临着许多实际的困难。因果关系没有普遍被接受的定义,不同的领域中的因果关系有不同的解释,很难使用统一的形式表达因果关系。在数据因果充分的条件下因果图模型给出了观测数据中对应的因果关系的直观表示。然而当数据因果充分条件在所有观测变量下不满足时往往不能构造正确的因果图。同时对观测数据中的变量构建因果图模型的效率与变量的数量成指数关系,随着变量数量的增加,全局因果图模型的约束学习代价将变的非常高。在实际的应用背景下,用户可能并不需要了解整个观测数据中包含的所有因果关系,发现其中一部分感兴趣的因果关系具有更大的理论意义和实现价值。为了解决现有因果模型学习和利用效率不高的问题,本文以研究观测数据因果关系发现为基础,针对观测数据的变量的一个子集学习对应的模型,通过获得的模型来表达和推导直接因果关系。论文的主要研究内容如下:1.从因果关系理论出发,研究了不同的因果关系约束学习方法,针对现有因果关系约束方法需要大量条件独立性计算的问题,提出了因果关系一致性约束方法,通过融合目标变量在不同控制变量条件下的条件关联来实现变量约束,避免了大量条件独立计算。在一致性约束思想的基础上,提出了基于观测数据等价类的因果关系一致性约束方法,方法改进了观测数据中变量一致性约束策略,有效地降低了观测数据一致性约束实现的代价。对直接因果关系进行了明确的定义,并综合缺省逻辑和一阶谓词的特点,利用缺省逻辑的蕴含式扩展将直接因果关系用因果规则的形式进行表达,为变量的直接因果关系提供了一个简洁的语法和形式化表达的工具,并在因果规则的基础上构建了因果预测和因果诊断的模型。2.因果规则是直接因果关系的有效表达形式,利用直接因果关系的理论从海量的观测数据中发现实际的因果规则具有重大的现实意义。针对传统关联规则兴趣度评价方法的不足,将因果关系引入关联规则兴趣度评价,基于信息量提出了一种因果规则度量方法。方法将不同关联规则之间的关系作为先验知识来剔除虚假和错误的因果规则,以兴趣度评价的方式实现了直接因果关系发现;同时提出了相应的算法,并通过实际数据比较和分析了该算法的性能。在关联规则的基础上进行直接因果关系发现能充分了关联规则挖掘的技术,为海量观测数据的直接因果关系发现提供了有益的探索。3.针对基于因果贝叶斯网络的因果关系发现具有复杂度高、计算难度大等缺点,在直接因果关系的形式化表达基础上,构建了一个通用的直接因果关系发现框架。框架基于变量一致性约束的思想,利用关联和部分关联的分层约束实现直接因果关系的发现。同时框架将单一因素的直接因果关系发现扩展到组合变量的直接因果关系,解决了传统因果发现方法无法表示组合因果关系的问题。基于框架提出了一个高效的因果规则挖掘算法,设计了顺序等价类存储表和局部顺序等价类存储表,结合有效的数据表示和搜索空间剪枝技术,提高了发现因果规则的效率。通过充分的实验评估,算法在不同的数据集合中都实现了较好的性能表现,相对于传统的因果关系发现算法不仅提高了效率,并且在不同的数据集上具有良好的扩展性。因果关系发现是知识发现领域的一个重要的课题,本文从观测数据的角度研究了直接因果关系的约束方法,讨论了因果规则的表达和推理形式,对海量观测数据的直接因果关系挖掘进行了探索,对数据挖掘领域中利用观测数据进行因果关系发现的理论研究和具体实践具有重要意义。(本文来源于《中国科学技术大学》期刊2013-05-06)
董雁适[10](2005)在《基于因果关系发现的关键化学组分辨识方法》一文中研究指出由于传统的组分分离-测试方法效率低并难以发现组分间的协同关系,逐步回归等传统统计分析方法又不可靠.用因果关系发现算法发现了关键化学组分,针对组效关系数据多为高维小样本的特点,提出了一种新的关系发现算法,并用此算法成功辨识出一种中药材川芎的关键组分,证明了该方法的可行性.(本文来源于《上海交通大学学报》期刊2005年10期)
因果关系发现论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
关于阅读障碍神经机制的研究已经有很多,但到目前为止,研究者仍不完全清楚,阅读障碍者脑区的异常,究竟是阅读障碍的原因还是结果。研究者发展出不同的研究范式来探究此问题,包括学龄前研究、双对照组研究、纵向研究等。文中综述了这些研究范式各具的优势、不足和研究结果之间的一致性,并分析了确认因果关系之所以困难的原因。在此基础上,提出如下建议:(1)细致区分阅读障碍的亚类型;(2)以成熟和完善的阅读认知-神经模型为指导;(3)通过不同的研究范式进行交叉印证;(4)综合考虑脑的动态发展变化特点,和基因、环境、经验的作用等多种因素的影响。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
因果关系发现论文参考文献
[1].舒晓灵,陈晶晶.重新认识“数据驱动”及因果关系——知识发现图谱中的数据挖掘研究[J].中国社会科学评价.2017
[2].李何慧,陶伍海,彭聃龄,丁国盛.发展性阅读障碍与脑异常的因果关系:研究范式及发现[J].心理发展与教育.2017
[3].蔡瑞初,陈薇,张坤,郝志峰.基于非时序观察数据的因果关系发现综述[J].计算机学报.2017
[4].郝志峰,谢蔚涛,蔡瑞初,王丽娟,洪英汉.基于因果强度的时序因果关系发现算法[J].计算机工程与设计.2017
[5].李岩,王挺,刘万伟,张晓艳.ICIC_Target:目标节点的局部因果关系网络的发现算法[J].计算机研究与发展.2016
[6].谢蔚涛.基于因果强度的时序因果关系发现算法研究[D].广东工业大学.2016
[7].袁畅.基于时序的社交网络因果关系发现[D].广东工业大学.2016
[8].姚宏亮,吴立辉,王浩,李俊照.局部因果关系分析的隐变量发现算法[J].计算机科学与探索.2014
[9].金洲.基于约束学习的观测数据因果关系发现研究[D].中国科学技术大学.2013
[10].董雁适.基于因果关系发现的关键化学组分辨识方法[J].上海交通大学学报.2005