谓词识别论文-朱婷婷

谓词识别论文-朱婷婷

导读:本文包含了谓词识别论文开题报告文献综述及选题提纲参考文献,主要关键词:词语搭配消歧,词语搭配识别,谓词相容性

谓词识别论文文献综述

朱婷婷[1](2018)在《基于谓词相容性的双语词语搭配消歧和识别》一文中研究指出词语搭配是词语组合的习惯性出现,具有一定的共现频率、语法结构和语义透明性。词语搭配是人类自然语言知识的重要组成成分,在自然语言处理的各项任务中占有很关键的位置。词语搭配的研究对机器翻译,信息检索,句法分析和词义消歧等工作都有着促进的作用。现有的词语搭配自动抽取和识别方法主要是基于规则、基于统计和机器学习,以及一些综合策略方法。本文提出两个算法,分别是基于谓词搭配频数矩阵的双语词语搭配消歧方法和基于谓词相容性矩阵的双语词语搭配识别方法。按照所含语义信息粒度的粗细,我们将搭配分为叁种,按信息粒度从细到粗分别是谓词搭配、概念搭配和词语搭配。一个词语搭配能够产生一个或多个概念搭配,同样的,一个概念搭配能够产生一个或多个谓词搭配。在实验中,我们利用这叁种搭配的关系,将词语搭配的粗粒度信息迭加到细粒度的谓词搭配上,从而实现词语搭配的消歧和识别。首先,我们从语料库中抽取出有意义的中英词语搭配,接着使用这些词语搭配借助人工知识库HowNet得到概念搭配和谓词搭配,从而构建谓词搭配矩阵,词语搭配的共现频率在谓词搭配频数矩阵中进行迭加,根据谓词搭配矩阵中的信息就可以计算词语搭配的所有概念搭配的对应的分数,分数最高的就是最终消歧结果。双语词语搭配消歧就是在计算概念搭配的分数时同时使用中文和英文的谓词搭配频数矩阵信息,这种方式有效增加了谓词搭配的信息量,弥补了词语搭配语料库较小时,生成的谓词搭配频数矩阵过于稀疏的缺陷,有利于词语搭配消歧准确率的提高。所有的词语搭配都消歧结束后,我们就能得到一个消歧好的词语搭配库,即每个词语搭配都对应一个概念搭配,通过这个词语搭配库,我们可以构建谓词相容性矩阵,利用这个矩阵判断一个词语搭配是正确的或异常的。实验结果表明基于谓词搭配频数矩阵的消歧算法和基于谓词相容性的词语搭配识别算法的结果均达到了我们的预期,证明了该方法的可行性和有效性。(本文来源于《厦门大学》期刊2018-05-01)

韩磊,罗森林,潘丽敏,魏超[2](2014)在《融合词法和句法特征的汉语谓词高精度识别方法》一文中研究指出为了对汉语谓词进行系统的研究,提出一种融合词法和句法特征、结合C4.5机器学习和规则进行谓词识别的方法.该方法对句子的词法信息和句法信息分别进行特征提取,通过词法特征提取得到句子中可疑谓词及其个数,使用人工总结规则对词法特征进行规则过滤,对符合规则条件的样本直接给出结果,融合不符合规则样本的词法和句法特征,使用C4.5进行分类得到谓词识别结果.实验中,采用谓词总量达到20 000条以上的BFS-CTC标注语料库进行特征和参数选择、句法特征验证、训练数据量选择和算法准确性等一系列的实验,对谓词识别效果的影响进行研究.结果表明:句法特征能有效提升谓词识别效果,随着训练数据量的增加谓词识别准确率趋于平缓,达到了99%的高准确率.(本文来源于《浙江大学学报(工学版)》期刊2014年12期)

王倩,罗森林,韩磊,潘丽敏[3](2014)在《基于谓词及句义类型块的汉语句义类型识别》一文中研究指出从现代汉语语义学角度,可将句义类型划分为简单句义、复杂句义、复合句义和多重句义4种。作为在整体上对句义结构进行描述的方式之一,句义类型识别是对汉语句子进行完整句义结构分析的重要步骤。该文基于谓词及句义类型块提出了一种汉语句义类型识别的方法,实现了4种句义类型的识别。该方法先通过句中谓词的个数进行初步识别判断出部分简单句,再对剩余的句子先用C4.5机器学习的方法得到句中谓词经过的最大句义类型块的个数,再结合句法结构中顶端句子节点进行判决,最终给出剩余句子的句义类型判定结果。实验采用BFS-CTC汉语标注语料库中10 221个句子进行开集测试,句义类型的整体识别准确率达到97.6%,为基于现代汉语语义学的研究奠定了一定的技术研究基础。(本文来源于《中文信息学报》期刊2014年02期)

张宜浩,金澎[4](2012)在《谓词自动识别中的特征选择度量研究》一文中研究指出谓词的自动识别是浅层句法分析的重要内容。本文提出了基于支持向量机分类算法的谓词自动识别方法,重点描述了在特征构建过程中基于信息增益的特征筛选方法与基于同义词词林的特征词度量方法。信息增益方法选取对分类影响较大的特征,降低了特征维度;同义词词林的度量方法将特征词映射为深层次的语义概念,增强了特征的表达能力,强调了属性特征与模型的相关度。在小规模语料库上的实验表明,谓词识别的最好F-Score达到了84.0%,相较于对数据无任何处理的情况F-Score提高了4.6%。结果表明,这种新的特征筛选与特征度量方法在谓词识别中十分有效,可以极大提高分类器的性能。(本文来源于《计算机工程与科学》期刊2012年09期)

王红玲,袁晓虹,王步康,周国栋[5](2011)在《依存关系上的中文名词性谓词识别研究》一文中研究指出首次实现了一个基于依存关系的中文名词性谓词识别平台,作为语义角色标注的前提,谓词识别的结果直接影响语义角色标注的性能。使用两种方法进行实验:一种是基于传统的特征向量的方法在Chinese Nombank的转换语料上进行了系统实验,对各种词法特征、结构特征及其组合进行了测试,标准语料上F1值达到89.65,自动语料上达到81.27。另一种是使用树核的方法进行探索性实验,在标准语料和自动语料上分别得到84.62和80.93的F1值。(本文来源于《计算机工程与应用》期刊2011年20期)

赫兰光,王轩,李露,范士喜[6](2008)在《基于最大熵分类器的谓词识别与词义消歧》一文中研究指出谓词是语句的中心元素,其词义在分析语句含义时起着关键作用。谓词识别与词义消歧就是根据词语所处的上下文环境对谓词进行准确识别并标注谓词词义,其结果可被广泛应用到信息检索、文本分类、机器翻译等自然语言处理领域中,有着重要的研究意义。本文基于最大熵机器学习方法建立谓词的识别与词义消歧系统,并使用CoNLL 2008 share task提供的语料数据进行评测。最后系统在wsj+brown语料上谓词识别与词义消歧的最佳F-score评分分别为90.28和82.06。(本文来源于《第四届全国信息检索与内容安全学术会议论文集(上)》期刊2008-11-01)

谌志群[7](2007)在《汉语句子谓词的自动识别方法研究》一文中研究指出谓词的自动识别是浅层句法分析的重要内容。以汉语的“谓词中枢论”为语言学基础,详细分析了汉语句子中谓词所处的上下文环境,讨论了影响谓词出现的主要语境因素。提出了一种基于统计学原理的汉语句子谓词自动识别概率模型,通过极大似然估计对谓词候选词在句中充当谓词的概率进行近似计算,利用绝对折扣模型对参数进行平滑。在小规模语料库上进行的实验显示,谓词识别率最高分别达到了80.6%(动词性谓词)和83.2%(形容词性谓词),表明了该方法的可行性和有效性。(本文来源于《计算机工程与应用》期刊2007年17期)

王红军,徐林,张继宏[8](2004)在《一种模糊综合决策汉语谓词识别算法》一文中研究指出汉语谓词识别是Internet内容安全、机器翻译的重要研究内容之一?疚纳杓瞥鲆恢只诤河镉锓ü嬖?通过系统学习,自动建立模糊关系矩阵以识别汉语中心谓词的方法,并给出了相应的算法流程。实验表明,模糊综合决策汉语谓词识别算法,较传统的JXXT谓词识别器,具有更高的谓词识别率和算法稳定性。(本文来源于《中国自动化学会、中国仪器仪表学会2004年西南叁省一市自动化与仪器仪表学术年会论文集》期刊2004-10-01)

谭辉[9](2000)在《科技论文中的中心谓词的计算机识别原则》一文中研究指出对科技论文中的句法分析作了研究 ,结合计算机的特点采用句子成分分析法来分析句法特征 ,指出句子成分分析方法的主要问题是中心谓词的确定 ,提出在词库中应加入动宾词组 ,在此基础上给出了用计算机识别中心谓词的一些原则(本文来源于《武汉大学学报(自然科学版)》期刊2000年03期)

谓词识别论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为了对汉语谓词进行系统的研究,提出一种融合词法和句法特征、结合C4.5机器学习和规则进行谓词识别的方法.该方法对句子的词法信息和句法信息分别进行特征提取,通过词法特征提取得到句子中可疑谓词及其个数,使用人工总结规则对词法特征进行规则过滤,对符合规则条件的样本直接给出结果,融合不符合规则样本的词法和句法特征,使用C4.5进行分类得到谓词识别结果.实验中,采用谓词总量达到20 000条以上的BFS-CTC标注语料库进行特征和参数选择、句法特征验证、训练数据量选择和算法准确性等一系列的实验,对谓词识别效果的影响进行研究.结果表明:句法特征能有效提升谓词识别效果,随着训练数据量的增加谓词识别准确率趋于平缓,达到了99%的高准确率.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

谓词识别论文参考文献

[1].朱婷婷.基于谓词相容性的双语词语搭配消歧和识别[D].厦门大学.2018

[2].韩磊,罗森林,潘丽敏,魏超.融合词法和句法特征的汉语谓词高精度识别方法[J].浙江大学学报(工学版).2014

[3].王倩,罗森林,韩磊,潘丽敏.基于谓词及句义类型块的汉语句义类型识别[J].中文信息学报.2014

[4].张宜浩,金澎.谓词自动识别中的特征选择度量研究[J].计算机工程与科学.2012

[5].王红玲,袁晓虹,王步康,周国栋.依存关系上的中文名词性谓词识别研究[J].计算机工程与应用.2011

[6].赫兰光,王轩,李露,范士喜.基于最大熵分类器的谓词识别与词义消歧[C].第四届全国信息检索与内容安全学术会议论文集(上).2008

[7].谌志群.汉语句子谓词的自动识别方法研究[J].计算机工程与应用.2007

[8].王红军,徐林,张继宏.一种模糊综合决策汉语谓词识别算法[C].中国自动化学会、中国仪器仪表学会2004年西南叁省一市自动化与仪器仪表学术年会论文集.2004

[9].谭辉.科技论文中的中心谓词的计算机识别原则[J].武汉大学学报(自然科学版).2000

标签:;  ;  ;  

谓词识别论文-朱婷婷
下载Doc文档

猜你喜欢