导读:本文包含了语义处理论文开题报告文献综述及选题提纲参考文献,主要关键词:数据分析,汉语语义,知识图谱
语义处理论文文献综述
赵盈,钱西成,刘笙皓,潘景昌[1](2019)在《现代汉语语义词库信息处理系统》一文中研究指出汉语是中华五千年历史文化的结晶,它数量庞大,语义又错综复杂。随着汉语词语数量的日益增长,如何进行数据分析,挖掘词语关系中的有价值的信息,并将其结构化是势在必行的发展趋势。本文致力于分析现代汉语语义,并构建语义词库信息处理系统描述它们之间的关系。用户通过知识图谱来观察数据,可以对数据的属性以及他们之间的关系有更为深入的了解。(本文来源于《信息技术与信息化》期刊2019年08期)
沈其亮[2](2019)在《浅谈分级显性意义假说对语义处理的价值及路径》一文中研究指出分级显性意义假说作为最先进的、最后出现的帮助人们理解语义含义的处理模型,对他出现之前的长期被人们广泛接受的两种语义处理方式即直接通达、语义假说产生了撼动性的影响,为人们提供了一种全新的话语处理模型,并确定了在话语处理中显性意义首先通达的重要内容。本文分析了对分级显性意义假说的深刻理解,并列举了对语义处理的几种形式,即重点分析了反语、隐喻语、惯用语,以此加强人们对分级显性意义假说的了解,扩大分级显性假说模型在语义领域的影响力。(本文来源于《佳木斯职业学院学报》期刊2019年06期)
黄璨[3](2019)在《面向医疗语义理解的结构化处理方法的研究与实现》一文中研究指出随着人工智能热潮的掀起,人工智能在医疗健康领域的应用场景也越来越丰富,人工智能技术影响着医疗行业的发展。在一些检查中,医生双手无法离开检查设备,亟需引入智能化的语音交互医疗产品来协助工作,提升工作效率。在智能化语音助手中语义理解引擎起着核心作用,医疗语义理解的含义是帮助语音助手进行理解医生的意图、提取医生说话内容的关键信息,并对获取的文本信息进行结构化处理,最终生成电子病历。蓬勃发展的背后,人工智能在医疗领域的应用和推广也面临着诸多问题和挑战。目前针对中文自然语言的医疗文本结构化处理方法采用的方案是存在较多的弊端:灵活性不足、无法实现各种业务的定制化、容易丢失重要病历信息等等。针对以上存在的问题,本文主要从以下几个方面开展工作:本文基于科大讯飞有限公司智慧医疗内核部门“面向医疗语义理解引擎”项目,对语音转写文本进行结构化处理的研究。本文通过对语音转写文本数据以及需求进行深入的分析,给出了一个“规则+命名实体识别+知识库+分类”一体化的医疗文本结构化处理方案。首先,针对目前传统信息提取技术应用于本课题中效果较差的问题,本文给出了一种基于规则和命名实体识别融合的信息抽取处理方法,该方法进行NLP(Natural Language Processing,自然语言处理)文法解析和命名实体识别的提取,并保留提取信息的并集。其次,针对传统医疗文本结构化中知识图谱的应用只是实体间语义的简单拼接,结构化效果较差的问题,因此本文引入知识图谱校验思路。其方法是在医疗知识图谱构建完成后,对结构化系统中提取的语义信息进行合法性校验,包括值类型、值范围、以及语义关系等,以提高文本结构化的正确率。然后,为防止文本中有用信息丢失,本文给出了一种基于CNN(Convolutional Neural Networks,卷积神经网络)分类模型对文本进行二分类的方法,并对其中CNN模型结构进行了改良。经过实验对比分析,最后选用jieba分词和CNN组合的方案对文本进行二分类。最后,通过对前面叁个主要部分的研究,设计和实现了面向语义理解的结构化处理方案。通过真实的现场语音转写文本数据验证改进后的系统在结构化效果以及分类效果有较大提升。(本文来源于《重庆邮电大学》期刊2019-06-09)
赵婕[4](2019)在《工作记忆和词汇—语义因素对高中生英语关系从句歧义处理的影响研究》一文中研究指出在文献中,被试可以把句子The dean liked the secretary of the professor who was reading a letter.中的关系从句挂靠在the professor(NP1),也可挂靠在the secretary(NP2),若被试将关系从句挂靠于NP1,则是高位挂靠,挂靠于NP2则是低位挂靠。目前,研究者们对于工作记忆是否影响歧义关系从句的加工尚无统一定论,对词汇-语义因素(介词类型和挂靠)是否影响被试的挂靠倾向和是否影响句子加工也无一致结论。因此,笔者以厦门市某重点高中高二年级两个班105名学生为研究对象,通过离线语法判断测试和在线工作记忆测试研究工作记忆与词汇-语义因素是否影响高中生歧义关系从句的加工,所得数据运用社科统计软件SPSS 21.0的叁因素方差分析和t检验进行统计,试图探讨以下问题:1)离线测试中,词汇-语义因素是否影响高中生歧义关系从句的加工?2)在线测试中,工作记忆与词汇-语义因素是否影响高中生歧义关系从句的加工?3)高中生是否采用和英语母语者一样的句法加工原则?结果如下:(1)离线测试中,通过对被试高位和低位(NP1和NP2)挂靠的得分进行配对样本t检验,p=0.000,说明词汇-语义因素(介词类型和挂靠)影响高中生歧义关系从句的加工。(2)在线测试中,以影响歧义关系从句处理的反应时为因变量,工作记忆和词汇-语义因素(介词类型和挂靠)为自变量,进行2×2×2的叁因素方差分析,得出工作记忆的主效应F(1,55)=294.525,p=0.000,挂靠的主效应F(1,55)=0.463,p=0.499,介词类型的主效应F(1,55)=0.246,p=0.622。工作记忆和挂靠的交互效应F(1,55)=7.823,p=0.007,挂靠和介词类型的交互效应F(1,55)=0.002,p=0.967,介词类型和工作记忆的交互效应F(1,55)=0.815,p=0.317。其中,工作记忆主效应、工作记忆与挂靠的交互效应显着值均小于0.05,说明工作记忆和词汇语义因素中的挂靠影响即时关系从句的加工,而介词类型和挂靠的主效应不显着,介词类型和挂靠以及介词类型和工作记忆的交互效应不显着,说明介词类型和挂靠均不影响即时关系从句的加工。(3)离线测试中被试的高位和低位(NP1和NP2)的配对样本t检验p=0.000,说明高位挂靠和低位挂靠有显着差异,即高中生采用和英语母语者不一致的谓词邻近原则。在线测试中,高工作记忆组(通过在线测试,记忆广度在4分以上的被试)的被试高位和低位(NP1和NP2)的独立样本t检验p=0.000,说明高工作记忆组被试采用和英语母语者一致的时近原则;低工作记忆组(通过在线测试,记忆广度在3分以下者)的被试的高位和低位(NP1和NP2)的独立样本t检验p=0.000,说明低工作记忆组学生采用和英语母语者不一致的谓词邻近原则。研究表明:(1)从关系从句与高中生挂靠的倾向来看,词汇-语义因素影响高中生离线歧义关系从句的加工。(2)工作记忆、工作记忆与词汇-语义因素中的挂靠均影响高中生在线关系从句的即时加工。(3)离线测试中,高中生使用和英语母语者不同的句法加工原则(即谓词邻近原则)。在线测试中,高工作记忆组学生使用和英语母语者相同的句法加工原则(即时近原则),低工作记忆组学生则依旧使用和英语母语者不同的句法加工原则(即谓词邻近原则)。以上发现可以用容量制约解析模型和浅层结构假说解释。因此我们认为高中教学中应该努力做到:(1)在教学前,利用诊断性测验,了解学生句法加工的方式。(2)了解英语句法特点使教学更有针对性。(3)教授学生科学记忆方法,扩大学生的工作记忆容量。(4)与母语思维作比较,培养学生的英语思维能力。(本文来源于《闽南师范大学》期刊2019-06-01)
陈杰[5](2019)在《基于语义网技术的M2M复杂事件处理系统设计与实现》一文中研究指出随着近年物联网的成熟和发展,大规模物联网应用提出物联网服务平台化的需要。面向物联网的M2M服务平台针对硬件设备能力开放需求提出了一种平台化的解决方案。目前M2M服务平台的主要实现面向物联网应用开放设备基础接口,并通过分布式消息队列等模式实现数据的大规模分发,尚不具备对物联网设备所产生的海量数据进行实时处理的能力。复杂事件处理(CEP)作为对海量数据进行实时处理的技术近年来受到了广泛的关注。针对现阶段M2M服务平台的局限,论文提出了基于语义网技术的复杂事件处理方法,利用事件的语义表示和语义推理技术,设计并实现的复杂事件处理引擎可根据用户定义的本体库实现复杂事件的分析和挖掘,提供了良好的业务扩展性和数据互操作性,为物联网应用提供语义更丰富、抽象程度更高的复杂事件流,满足物联网应用对设备的抽象能力的需求,提升M2M服务平台的可用性。该系统可通过复杂事件处理网络(EPN),形成可扩展、可伸缩的事件处理系统解决方案。论文首先介绍研究背景以及相关技术,结合M2M服务平台的应用场景说明M2M服务平台对复杂事件处理系统的系统目标,在此基础上分析了复杂事件处理系统的功能需求与非功能需求。随后,提出了基于语义网技术的复杂事件处理系统总体设计方案,描述了事件处理器(EPA)和事件处理引擎(EPE)等系统核心组件的交互流程与接口设计。在此基础上完成系统的详细设计并对系统实现方案进行简单描述。之后我们使用原型系统实现了道路交通事件检测的场景,完成系统功能的验证。最后,本文总结了复杂事件处理设计的一般方法,并总结了该领域未来的研究方向。(本文来源于《北京邮电大学》期刊2019-05-30)
王勇,罗安,曹元晖,刘纪平[6](2019)在《语义因子支持的多源POI分类信息一致化处理》一文中研究指出为了解决网络POI分类异构导致多源POI数据匹配与整合困难的问题,该文利用分类特征词提取、特征词去重与优化等关键技术,构建POI分类的语义概念格,然后通过概念格之间的语义关联关系,实现多源异构POI分类体系的映射与转换。最后通过实验验证了该文方法的有效性,并将其成功应用于省级地理信息公共服务平台(政务版)数据更新。(本文来源于《测绘科学》期刊2019年06期)
卢山,张宁[7](2019)在《基于语义的金融大数据处理系统模型设计》一文中研究指出2015年6月17日,《关于运用大数据加强对市场主体服务和监管的若干意见》在国务院第95次常务会议中被审议通过。意见中指出运用大数据技术对金融数据进行快速有效的处理与分析,保障金融机构的稳定运行。由于金融系统结构复杂,数据存储结构多种多样,因此数据的处理与分析是金融行业所面临的重大挑战之一。为了降低金融风险,提高数据处理效率,论文依托大数据背景,提出基于语义的大数据处理系统的宏观模型。(本文来源于《信息系统工程》期刊2019年02期)
蔺艳艳[8](2018)在《面向专利信息处理的语义分析方法研究》一文中研究指出近年来,中国的专利申请量极大且增速较快。报告显示仅2017年,国内发明专利申请量就高达138.2万件,同比增长14.2%,已审结74.4万件,未审结的专利文献量都很大而且不断增长。人工进行专利信息的标引和分类需要大量有专业基础的人,因此工作量巨大且进展缓慢,标引和分类时容易出现一致性错误,造成专利文献检索漏检、偏检和噪音大等问题。专利文本是一种半结构化的数据,难用现有数据结构方法加以规范。如何从具有技术和法律二维特征的专利文献中提取所需要的技术特征,对专利文献所描述的技术内容加以解析,是基于技术语言语义分析领域研究的重点。传统基于词频统计的文本挖掘方法难以适应专利文献的复杂结构,导致分析结果准确性不足,因此开展以专利文献为代表的技术语言的语义分析研究,准确定位和提取专利文献中的技术和产品特征。本文围绕专利文本的语义分析需求,重点对专利语言特征的准确提取开展研究与实验。通过构建专利领域本体来获取尽可能多专利领域术语信息,提高专利文献检索的查全率和查准率,并减少人工标引和检索的工作量。为此,本文主要做了如下研究工作:1、基于依存关系树-CRF(条件随机场)的文本术语提取。基于依存关系树-CRF的特征提取是基于语义分析的特征数据选取方法。传统文本关键词挖掘算法主要是基于特征向量模型计算词语在文档中出现的频率,容易忽略部分低频关键技术特征词。针对该问题,提出基于依存关系-CRF的文本特征提取算法对文本中每个词进行词性标记,并基于特征模版实现专利文本中术语自动提取。2、基于改进K-MEANS聚类算法的术语层次关系提取针对K-MEANS算法获取术语的层次关系,存在的无法自动确定类标签问题,提出基于科学统计和层次聚类的K-MEANS算法,能够自动的获取最佳类标签。本文对上述提出的两种改进方法分别做了实验,基于依存关系树-CRF的文本特征提取方法可应用于任意部分的专利文本中;相对于传统K-MEANS算法,基于科学统计和层次聚类改进的K-MEANS聚类算法可有效的对层次内部的聚类标签进行标记,更容易得到完整的层次关系。(本文来源于《江苏科技大学》期刊2018-12-20)
伍玉凯[9](2018)在《基于规则匹配的语义处理系统研究与实现》一文中研究指出随着科技水平和生活质量的高,人们对智能化的要求逐渐增高,迫切希望通过更加智能、便捷的方式来解决问题。日常生活中人们都是通过图形界面交互的方式,在交互上需要多次的繁琐操作,且无法保证结果匹配的精准度。智能化时代更加便捷的方式是仅通过用户的一次交互,判断用户意图,完成用户所需。针对上述情况,本文允许用户通过语音文本的方式与系统进行交互,通过建立语义框架模型,将文本的语义进行分析并作为结构化语义输出,语义精确到词粒度的拆分,完成意图的识别及处理。本文完成了口语语义的解析以及语义的执行处理。为了将语义转换为计算机可处理的结构化数据,建立了语义框架模型,将语义分为领域、意图、词槽叁要素。在语义解析过程中,基于有限状态自动机生成规则匹配网络,通过匹配网络完成语义解析,且该方法精度较高。为降低规则匹配复杂度,出规则分组概念,并实现了规则配置系统,简化规则配置流程。为弥补规则匹配缺点,基于CRF(条件随机场)算法设计了命名实体识别系统,用于高未登录词语义识别率。在语义解析基础上,针对特定领域的语音交互场景,将结构化语义数据作为指令,构建一套独立语义执行系统,完成语义意图分发和处理操作。最后,将各功能模块部署且进行功能效果测试,并与基于统计模型的语义解析方法进行比对,具有更好的精度和召回率,且验证语义业务处理准确率达90%。(本文来源于《哈尔滨工业大学》期刊2018-12-01)
李红伟[10](2018)在《微环境监测平台传感器数据实时语义处理关键技术研究》一文中研究指出传感器技术的飞速发展为我们生活中各个领域的实时应用提供了广泛的机遇,如环境监测,医疗保健,城市交通管理等。由于这些应用的快速出现,实时分析传感器数据流的需求日益增长。丰富传感器描述的主要方法是将语义标注技术运用到传感器数据流中,将低层观测数据转化为更高层次的观测数据。通过应用语义推理,可以从语义标注的传感器数据流中推导出隐含的或新的知识,实现应用的实时智能决策。然而,传感器数据流的高效语义标注和推理仍然处于初期状态,需要广泛的关注以实现对其的高效标注和推理。本文主要研究工作如下:1)传感器数据流实时语义标注方法的设计。根据传感器数据流的格式和SOSA/SSN本体的结构,设计了S-SASML映射语言和SDS2R算法,将传感器数据流转换为符合SOSA/SSN本体的RDF数据流。并且利用线程池技术实现方法的高并发处理,提高方法的实时性能。2)基于Spark Streaming的RDF流处理方法的设计。利用Spark Streaming提供的窗口操作将RDF流提取到窗口中;并且利用Spark Streaming提供的filter,map,reduce等操作对基于窗口的RDF流进行过滤、映射、聚合等操作,得到聚合后的RDF数据流。根据实际应用需求利用Jena Rule规则语言自定义规则,将规则应用于聚合后的RDF数据流,利用Jena推理引擎进行规则推理。3)原型系统的设计与实现。分析了微环境监测平台传感器数据实时语义处理原型系统的需求,包括功能需求和系统用例。根据需求分析,对原型系统的各个模块进行了详细设计。使用MyEclipse作为开发环境,使用Java语言开发用户界面,对微环境监测平台部署的区域进行监测,实时分析、对各种数据进行在线实时显示。(本文来源于《河北科技大学》期刊2018-12-01)
语义处理论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
分级显性意义假说作为最先进的、最后出现的帮助人们理解语义含义的处理模型,对他出现之前的长期被人们广泛接受的两种语义处理方式即直接通达、语义假说产生了撼动性的影响,为人们提供了一种全新的话语处理模型,并确定了在话语处理中显性意义首先通达的重要内容。本文分析了对分级显性意义假说的深刻理解,并列举了对语义处理的几种形式,即重点分析了反语、隐喻语、惯用语,以此加强人们对分级显性意义假说的了解,扩大分级显性假说模型在语义领域的影响力。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语义处理论文参考文献
[1].赵盈,钱西成,刘笙皓,潘景昌.现代汉语语义词库信息处理系统[J].信息技术与信息化.2019
[2].沈其亮.浅谈分级显性意义假说对语义处理的价值及路径[J].佳木斯职业学院学报.2019
[3].黄璨.面向医疗语义理解的结构化处理方法的研究与实现[D].重庆邮电大学.2019
[4].赵婕.工作记忆和词汇—语义因素对高中生英语关系从句歧义处理的影响研究[D].闽南师范大学.2019
[5].陈杰.基于语义网技术的M2M复杂事件处理系统设计与实现[D].北京邮电大学.2019
[6].王勇,罗安,曹元晖,刘纪平.语义因子支持的多源POI分类信息一致化处理[J].测绘科学.2019
[7].卢山,张宁.基于语义的金融大数据处理系统模型设计[J].信息系统工程.2019
[8].蔺艳艳.面向专利信息处理的语义分析方法研究[D].江苏科技大学.2018
[9].伍玉凯.基于规则匹配的语义处理系统研究与实现[D].哈尔滨工业大学.2018
[10].李红伟.微环境监测平台传感器数据实时语义处理关键技术研究[D].河北科技大学.2018