导读:本文包含了句子分布论文开题报告文献综述及选题提纲参考文献,主要关键词:“哈”字句,句末助词,句子功能
句子分布论文文献综述
陈洁[1](2019)在《句末语气助词“哈”的句子功能分布》一文中研究指出在前人研究的基础上,进一步从正反两个方面分析了句末语气助词"哈"的句子功能分布特征,它可以分布在陈述句、疑问句、祈使句和感叹句的末尾,但出现在感叹句句末的可能性较小。基于其自身特点,"哈"对陈述句、疑问句的选择也是有条件、不自由的,只能出现在接受对象已知的陈述句和疑惑程度较低的疑问句中。(本文来源于《现代语文》期刊2019年03期)
刘海涛[2](2017)在《句子结构层级的分布规律》一文中研究指出句子结构的层级性是人类语言的重要特性。通过对汉语、英语和捷克语数百万词的句法标注语料库的分析,我们发现人类语言中,句子不同层级词语的数量分布具有规律性,随着所在层级的增加,词语所支配的词语的数量会逐渐减少。这些发现有助于我们理解人类语言句子结构的规律。(本文来源于《外语教学与研究》期刊2017年03期)
邱小燕[3](2017)在《句子长度的分布规律及其制约因素》一文中研究指出句长统计是一种针对句子在语用方面分析研究的统计方法,即通过统计定量的语料库中长度相同的句子出现的次数,再根据得到的数据绘制成表格,从句长的分布规律从而分析人们在句子使用方面的规律,从而分析出造成这种情况的原因。而且对于句长的研究在语言学——特别是第二语言教学中发挥着重要的作用,另外,在信息学、文献计量学及情报学方面也有所涉及。本文的研究工作,主要是从历时角度建立不同时间段的语料库,通过统计各个时间段的句长及其分布规律,再进行对比分析从而了解汉语的发展规律;最后,通过共时角度的汉英句长的对比分析异同点,从而证明语言具有共同性。文章一共分为六章:第一章是绪论,主要介绍了本文的选题背景以及国内外关于句法学、统计语言学及句长的研究现状,简要介绍了本文的研究目的与意义、研究思路和研究方法以及本文的结构组成。第二章是主要是针对本文在句长统计的过程中所要涉及到的相关实验软件进行的分析,主要分四个部分:第一,对已有的句长及句频的相关概念作了简单的说明;第二,介绍了统计语言学中叁种主要的中文分词算法及中文分词算法的难点——未登录词识别和歧义识别;第叁,介绍了一般情况下检测实验软件的标准——正确率和召回率及F指标,在这叁个检测标准的基础上,利用汉语及英语句长、句频的样本统计实验对本文所要使用的软件进行检测,从而确认本文实验软件的可行性;第四,大致介绍了本文语料的收集与整理的过程,为了确保数据的可靠性,本文语料库中汉语的语料上溯先秦,下及现当代,以及两汉、魏晋南北朝、隋唐、宋元、明清等时期,英语语料收集的主要是中世纪文艺复兴后的,文章篇幅也涉及了短篇、中篇及长篇,包括经、史、子、集各种典籍。第叁章是本文为下文作准备的基础部分,主要介绍了统计句长及句频的实验设备、程序代码的编写及实验步骤。本文所使用的软件是在Java软件的基础上完成的,由于本文所采用的语料涉及古今中外,既有纵向的从先秦到现当代,又有横向的中英文对比,并且是从字本位和词本位两个角度来统计分析的,因此本文所要进行的实验也是具有针对性的,这种"针对性"就要通过不同的程序代码来实现的。在实验设备和程序代码都具备的情况下,就可以进行句长及句频统计的实验了。第四章主要是对句长及句频实验数据的整理分析。根据上文的实验得出的数据绘制成Excel表格,再绘制成各个时期的散点图,从而通过每个时期高频句的句长及平均句长发现语言发展是比较稳定的。然后通过对汉语句长、句频在不同时间段的分析及同时间段汉英句长、句频的对比分析,从而得出句子长度的分布规律:一篇文章的句长是呈现抛物线的分布趋势的。即在理论上语言本身的递归性使得句子的长度是无限长的,但在语言的实际运用中,因为受到各种因素的影响,使得语言的长度是有限的,从而为下文分析句长制约的因素作了基础。第五章是本文的重点部分,先说明因为语言的递归性及重写规则使得句子可以无限长的,然而上文的实验数据表明每个时期无论是平均句长还是高频句的句长都是有限的,因此本章从信息加工的处理方式、语体、语调、强制性表达方式、语言的经济规则及个人的语言风格等六个方面来结合实验数据详细分析了它们对句长产生的作用。然后通过对复句及独立成分的分析证明句法是无法制约句长的。第六章是本文的结语,在总结了本文主要内容的基础上,指出本文还存在的一些不足之处,最后对将来在句长方面的研究作了一些展望。(本文来源于《安徽大学》期刊2017-04-01)
王玮[4](2016)在《基于分布表示的句子分类研究》一文中研究指出近年来深度学习的技术在NLP(natural language processing)领域有着巨大的发展。很多重要的NLP任务应用相关技术取得了很大的突破,如语言模型、机器翻译、QA(Question Answering)、中文分词等。相较于传统的浅层学习如逻辑回归、SVM(Support Vector Machine)等,深度学习模型拥有更强的表示能力。之所以深度学习技术在NLP领域有着快速的发展,与分布表示方法的发展成熟有密不可分的关系。词和句子是自然语言的基础单位,很多NLP的重要任务事实上都可以分解为词级别的任务或者是句子级别的任务。因此,好的词级别的分布表示和句子级别的分布表示对简化模型和提升任务效果都能起到关键的作用。词级别的分布表示研究近两年来有大量优秀的工作,现在的词向量技术在基础化,工具化,可迁移性等方面都表现良好。与之相对的,句子级别的分布表示研究还相对集中在有监督学习的领域,以及针对具体任务的建模。虽然针对具体任务设计的模型,能够取得很好的效果,但是在迁移性上不够完善。用无监督学习的方式得到句子的分布表示,并迁移到各个具体任务中去因而成为了一个重要而有意义的研究问题。本文中,作者主要的研究问题是通过无监督学习的方法,应用深度学习相关技术得到句子的分布表示,并将之应用在具体的句子级别分类任务,如情感分析和关系分类中,同时,针对具体的任务本身,研究句子分布表示与有监督的方法相结合以提升任务表现的方法。基于上述问题,本文的进行的研究工作和取得的成果如下:1.提出一种有监督的卷积—循环神经网络(convolutional-recurrent neural networks)的组合模型,在现有的多窗口卷积网络中引入双向循环网络层,来自适应的提取变长的模式,在MR、SST-1、SST-2等公开情感分析数据集上取得了较之前最优结果最多7%的准确率的提升。2.基于无监督的自编码器(auto-encoder)技术,设计了基于卷积神经网络、循环神经网络和卷积—循环神经网络的自编码器模型。实现了从词向量序列到句子分布表示的无监督建模。将得到的句子分布表示应用到句子分类任务中,在1中所述任务中取得了不弱于端到端有监督模型的效果。3.将上述有监督的模型和无监督模型进行结合,提出了一种自动卷积—循环神经网络(auto-convolutional-recurrent neural networks)的半监督模型,有效防止了有监督模型存在的过拟合现象,在1中所述结果上,进一步取得了1%~2%的提升。(本文来源于《北京邮电大学》期刊2016-11-25)
张云宽,胡婉君[5](2006)在《五句子歌分布于环湖北地域圈》一文中研究指出荆楚网消息(湖北日报)( 张云宽)流传千百年的五句子歌目前如何分布?我省民间文艺家梁前刚潜心研究多年后认为,它分布于以湖北为中心的环地域圈。这一看法解决了我省长阳和河南信阳多年的纷争。 五句子歌是我国民歌的一种,因以奇句成篇难登“大雅之堂”,关于它(本文来源于《湖北日报》期刊2006-04-02)
句子分布论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
句子结构的层级性是人类语言的重要特性。通过对汉语、英语和捷克语数百万词的句法标注语料库的分析,我们发现人类语言中,句子不同层级词语的数量分布具有规律性,随着所在层级的增加,词语所支配的词语的数量会逐渐减少。这些发现有助于我们理解人类语言句子结构的规律。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
句子分布论文参考文献
[1].陈洁.句末语气助词“哈”的句子功能分布[J].现代语文.2019
[2].刘海涛.句子结构层级的分布规律[J].外语教学与研究.2017
[3].邱小燕.句子长度的分布规律及其制约因素[D].安徽大学.2017
[4].王玮.基于分布表示的句子分类研究[D].北京邮电大学.2016
[5].张云宽,胡婉君.五句子歌分布于环湖北地域圈[N].湖北日报.2006