时序化论文-卢志刚,李春生,胡亚楠,张可佳

时序化论文-卢志刚,李春生,胡亚楠,张可佳

导读:本文包含了时序化论文开题报告文献综述及选题提纲参考文献,主要关键词:模式挖掘,时域参数,径向基,特征选择

时序化论文文献综述

卢志刚,李春生,胡亚楠,张可佳[1](2019)在《基于径向基的时序化敏感特征选择方法研究》一文中研究指出在模式挖掘应用于生产智能分析与辅助决策过程中,为提高模式特征选择的准确性和敏感度,设计生产案例样本结构,对特征实体进行逻辑转化;采用时域参数,以时序等粒度函数为基础融合并处理原始数据,降低数据维度,完成数据清洗;选定距离特征评估法选择敏感特征,应用径向基函数,引入距离评估因子反应类内聚集程度,描述特征敏感程度,完成时序化敏感特征的选择,达到深度挖掘数据潜在敏感特征,提高数据变化模式表达能力和鲁棒性的目的.最后结合油田聚驱生产施工作业过程,利用方法实现多元复合并发生产异常模式的特征选择过程.(本文来源于《数学的实践与认识》期刊2019年07期)

刘增健[2](2018)在《临床医疗文本中实体时序化问题研究》一文中研究指出近些年,随着医疗信息化进程的不断推进,临床医疗信息处理技术正逐渐成为一个新的研究热点,受到大量科研机构和商业公司的关注。电子病历(Electronic Medical Record,EMR)作为医疗机构重要的信息载体,成为了医疗信息处理技术研究的重要数据来源,其中包含患者的疾病、症状、检查、治疗等医疗实体信息。这些信息对于分析患者健康状况、辅助医生诊断等方面起到十分重要的作用。那么,如何从非结构化医疗文本中抽取出这些医疗信息成为了医疗信息处理首要的任务。不同于通用领域的命名实体信息,医疗实体信息具有较高的时间敏感性,使得时间信息也成为了更好分析医疗文本必不可少的因素。那么,如何融合医疗实体与时间信息也成为了新的研究方向。为了解决上述问题,本文针对临床医疗实体时序化问题进行了深入研究,通过对临床医疗实体的识别、时间表达式的抽取以及医疗实体的时间标引,将医疗实体标引到时间轴上的具体时间节点或者时间区间上,从而实现了临床医疗实体的时序化过程。在实际应用场景方面,本文临床医疗实体时序化方法可以简明准确地实现对临床医疗文本的概述,极大地方便医生与患者对文本病历信息的快速浏览。此外,基于本文方法生成的医疗实体时序化链,还可以从大量的医疗文本病历中挖掘出不同疾病的临床检查项目、治疗手段和用药情况等信息,这些信息可以进一步为医生诊断疾病提供辅助和与参考。可以看出,本文临床医疗实体时序化问题的研究为后续相关的医疗信息处理任务打下了基础。此外,本文研究基于大量真实的中文临床医疗文本数据,其中包含了大量患者和医生的隐私信息。美国HIPAA(Health Insurance Portability and Accountability Act)法案明确规定所有临床医疗数据在用于科研和商业之前,必须去除或者替换掉全部的隐私信息。因此,为了保护患者和医生的隐私信息,本文对临床医疗文本的去隐私化方法也进行了相关的研究。下面简要概述本文的主要研究内容及成果,包括以下几个方面:第一,临床医疗文本的去隐私化方法研究。在去隐私化处理中,本文首先对临床医疗文本中的隐私信息进行识别,然后利用虚构的信息对原始真实隐私信息进行替换,进而实现了患者隐私信息的保护。对于隐私信息的识别,本文提出了一种多模型集成的隐私信息识别方法,利用四个独立的子模型(规则模型、条件随机场模型、循环神经网络模型和融合特征的神经网络模型)分别对隐私信息进行识别,然后采用一个集成分类器对各个模型的结果进行融合。实验结果表明,多模型集成方法取得了较好的性能,明显优于单个子模型的性能。此外,循环神经网络模型的性能要优于传统条件随机场模型,而融合人工特征之后,循环神经网络模型的性能又得到了进一步提高。第二,连续及非连续临床医疗实体识别方法研究。区别于传统命名实体识别任务,临床医疗实体识别旨在对于医疗文本中的疾病、症状、治疗等重要医疗信息进行识别。而由于临床医疗文本表述的特殊性,其中也存在大量的非连续医疗实体,如“头部轻微疼痛”中的“头部…疼痛”。针对医疗实体识别问题,本文提出了一种基于自注意力卷积循环神经网络的连续及非连续医疗实体识别方法CNN-LSTM-ATT。该方法融合了卷积神经网络、循环神经网络和注意力机制来对医疗实体进行识别。实验结果表明,CNN-LSTM-ATT模型取得了优于传统条件随机场和循环神经网络模型的性能。模型中基于卷积神经网络的特征学习模块和基于自注意力机制的标签预测模块发挥了重要的作用。第叁,临床医疗文本中时间表达式抽取及其归一化方法研究。针对临床医疗文本中的时间信息,本文提出了一种基于规则的时间表达式抽取及其归一化方法CMed TEX。该方法将时间信息划分为叁种类型:直接时间表达式(完整且准确)、间接时间表达式(不完整但准确)和模糊时间表达式(不准确),然后针对不同类型的时间表达式依次设计相应的抽取和归一化规则。该方式简化了规则库的构建过程。在人工标注数据集上的实验结果表明,CMed TEX方法取得了较好的性能,能够满足相关任务的需求,也为后续研究打下了基础。第四,临床医疗实体时间标引方法研究。本文首先采用基于章节信息的候选时间选择方法,为每个医疗实体生成相应的候选时间集合。然后进一步提出了一种基于循环卷积神经网络(RNN-CNN)的医疗实体时间标引方法。该方法通过循环神经网络与卷积神经网络分别对医疗实体和时间表达式的向量表示进行学习,然后结合大量时间关系特征共同完成对医疗实体时间关系的预测。实验结果表明,RNN-CNN模型取得了较好的性能,明显优于支持向量机和其他神经网络模型。最后通过标引时间的顺序实现了临床医疗实体的时序化。综上所述,本文针对临床医疗实体时序化问题的相关技术进行了深入的研究。构建了大规模的中文医疗文本数据集,并针对不同任务提出了相应的解决方法且取得了不错的性能,为临床医疗信息处理技术的研究做出了贡献。(本文来源于《哈尔滨工业大学》期刊2018-05-01)

万红新,彭云,郑睿颖[3](2016)在《时序化LDA的舆情文本动态主题提取》一文中研究指出随着互联网的发展,网络上产生了大量的舆情文本,提取这些文本的主题可以获取舆情的话题热点和演化趋势。由于舆情文本数据量巨大,并且主题具有随时间动态变化的特点,提出一种加入时间约束先验的LDA主题模型TC-LDA(Time Constrained LDA)。TC-LDA可以将文本数据转化为主题向量,大大降低了文本表示的维度,同时加入时间约束知识后实现了LDA的时序化转换,可以提高LDA捕捉动态主题的能力。实验结果表明,TC-LDA在主题词提取的准确率和召回率上与同类主题模型比较,具有更好的效果。(本文来源于《计算机与现代化》期刊2016年07期)

李春生,邸京华,李少龙,张可佳,王梅[4](2016)在《时序化生产预警有效影响因子的获取方法研究》一文中研究指出在生产预警有效影响因子的筛选过程中,为了达到降低维度,增强影响因子集的有效性,从而提高生产异常预警准确率的目的,选取和分析所有原始项目,应用模糊综合评价法量化模糊限制语,采用TRIMMEAN内均法排除极端评估值。运用特征选择技术发现敏感特征因子,借鉴混合智能方法定义影响因子集的逻辑表达结构,基于粒度分析处理时序化数据,同时利用激剧判定函数摒弃无效元素完成对数据的降维以及筛选,得到高精细化的有效影响因子集。以此达到辅助深度挖掘数据内部潜在规律,解决信息杂乱等现象,运用于生产异常分析,提高预警准确率的目的。最后针对大庆油田某采油厂生产历史数据,完成时序化生产预警有效影响因子的获取。(本文来源于《计算机技术与发展》期刊2016年07期)

葛杨,邱志明,肖亮[5](2011)在《新型舰炮系统时序化与随机性调度复合供弹方法》一文中研究指出针对兼容发射的大口径舰炮弹种单一、射速低、更换弹种速度慢、持续作战能力差的突出问题,提出了时序化设计与随机性调度相结合的系统设计方法。依据该方法建立了系统机构的时间分配模型和系统多工作步时序机构的随机调度模型(制式弹平均供弹速率50发/min),并基于全系统工作时序和弹库系统Markov状态转移矩阵,对弹库系统机构进行了随机性调度下的补弹时序决策控制和全系统机、电和控制一体化性能仿真。仿真结果表明:优化后的系统机构在弹种更换条件下,连续10发的平均供弹速率超过35发/min,系统平均弹种更换工作时间为4.6 s;通过优化,弹药更换效率提高20%~30%.该方法为符合连续供、补弹性能要求的系统机构设计提供了参考。(本文来源于《兵工学报》期刊2011年05期)

时序化论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

近些年,随着医疗信息化进程的不断推进,临床医疗信息处理技术正逐渐成为一个新的研究热点,受到大量科研机构和商业公司的关注。电子病历(Electronic Medical Record,EMR)作为医疗机构重要的信息载体,成为了医疗信息处理技术研究的重要数据来源,其中包含患者的疾病、症状、检查、治疗等医疗实体信息。这些信息对于分析患者健康状况、辅助医生诊断等方面起到十分重要的作用。那么,如何从非结构化医疗文本中抽取出这些医疗信息成为了医疗信息处理首要的任务。不同于通用领域的命名实体信息,医疗实体信息具有较高的时间敏感性,使得时间信息也成为了更好分析医疗文本必不可少的因素。那么,如何融合医疗实体与时间信息也成为了新的研究方向。为了解决上述问题,本文针对临床医疗实体时序化问题进行了深入研究,通过对临床医疗实体的识别、时间表达式的抽取以及医疗实体的时间标引,将医疗实体标引到时间轴上的具体时间节点或者时间区间上,从而实现了临床医疗实体的时序化过程。在实际应用场景方面,本文临床医疗实体时序化方法可以简明准确地实现对临床医疗文本的概述,极大地方便医生与患者对文本病历信息的快速浏览。此外,基于本文方法生成的医疗实体时序化链,还可以从大量的医疗文本病历中挖掘出不同疾病的临床检查项目、治疗手段和用药情况等信息,这些信息可以进一步为医生诊断疾病提供辅助和与参考。可以看出,本文临床医疗实体时序化问题的研究为后续相关的医疗信息处理任务打下了基础。此外,本文研究基于大量真实的中文临床医疗文本数据,其中包含了大量患者和医生的隐私信息。美国HIPAA(Health Insurance Portability and Accountability Act)法案明确规定所有临床医疗数据在用于科研和商业之前,必须去除或者替换掉全部的隐私信息。因此,为了保护患者和医生的隐私信息,本文对临床医疗文本的去隐私化方法也进行了相关的研究。下面简要概述本文的主要研究内容及成果,包括以下几个方面:第一,临床医疗文本的去隐私化方法研究。在去隐私化处理中,本文首先对临床医疗文本中的隐私信息进行识别,然后利用虚构的信息对原始真实隐私信息进行替换,进而实现了患者隐私信息的保护。对于隐私信息的识别,本文提出了一种多模型集成的隐私信息识别方法,利用四个独立的子模型(规则模型、条件随机场模型、循环神经网络模型和融合特征的神经网络模型)分别对隐私信息进行识别,然后采用一个集成分类器对各个模型的结果进行融合。实验结果表明,多模型集成方法取得了较好的性能,明显优于单个子模型的性能。此外,循环神经网络模型的性能要优于传统条件随机场模型,而融合人工特征之后,循环神经网络模型的性能又得到了进一步提高。第二,连续及非连续临床医疗实体识别方法研究。区别于传统命名实体识别任务,临床医疗实体识别旨在对于医疗文本中的疾病、症状、治疗等重要医疗信息进行识别。而由于临床医疗文本表述的特殊性,其中也存在大量的非连续医疗实体,如“头部轻微疼痛”中的“头部…疼痛”。针对医疗实体识别问题,本文提出了一种基于自注意力卷积循环神经网络的连续及非连续医疗实体识别方法CNN-LSTM-ATT。该方法融合了卷积神经网络、循环神经网络和注意力机制来对医疗实体进行识别。实验结果表明,CNN-LSTM-ATT模型取得了优于传统条件随机场和循环神经网络模型的性能。模型中基于卷积神经网络的特征学习模块和基于自注意力机制的标签预测模块发挥了重要的作用。第叁,临床医疗文本中时间表达式抽取及其归一化方法研究。针对临床医疗文本中的时间信息,本文提出了一种基于规则的时间表达式抽取及其归一化方法CMed TEX。该方法将时间信息划分为叁种类型:直接时间表达式(完整且准确)、间接时间表达式(不完整但准确)和模糊时间表达式(不准确),然后针对不同类型的时间表达式依次设计相应的抽取和归一化规则。该方式简化了规则库的构建过程。在人工标注数据集上的实验结果表明,CMed TEX方法取得了较好的性能,能够满足相关任务的需求,也为后续研究打下了基础。第四,临床医疗实体时间标引方法研究。本文首先采用基于章节信息的候选时间选择方法,为每个医疗实体生成相应的候选时间集合。然后进一步提出了一种基于循环卷积神经网络(RNN-CNN)的医疗实体时间标引方法。该方法通过循环神经网络与卷积神经网络分别对医疗实体和时间表达式的向量表示进行学习,然后结合大量时间关系特征共同完成对医疗实体时间关系的预测。实验结果表明,RNN-CNN模型取得了较好的性能,明显优于支持向量机和其他神经网络模型。最后通过标引时间的顺序实现了临床医疗实体的时序化。综上所述,本文针对临床医疗实体时序化问题的相关技术进行了深入的研究。构建了大规模的中文医疗文本数据集,并针对不同任务提出了相应的解决方法且取得了不错的性能,为临床医疗信息处理技术的研究做出了贡献。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

时序化论文参考文献

[1].卢志刚,李春生,胡亚楠,张可佳.基于径向基的时序化敏感特征选择方法研究[J].数学的实践与认识.2019

[2].刘增健.临床医疗文本中实体时序化问题研究[D].哈尔滨工业大学.2018

[3].万红新,彭云,郑睿颖.时序化LDA的舆情文本动态主题提取[J].计算机与现代化.2016

[4].李春生,邸京华,李少龙,张可佳,王梅.时序化生产预警有效影响因子的获取方法研究[J].计算机技术与发展.2016

[5].葛杨,邱志明,肖亮.新型舰炮系统时序化与随机性调度复合供弹方法[J].兵工学报.2011

标签:;  ;  ;  ;  

时序化论文-卢志刚,李春生,胡亚楠,张可佳
下载Doc文档

猜你喜欢