导读:本文包含了口语评分论文开题报告文献综述及选题提纲参考文献,主要关键词:计算机自动评分,人工评分,效度,效度验证
口语评分论文文献综述
王妍,彭恒利[1](2019)在《汉语口语开放性试题计算机自动评分的效度验证》一文中研究指出计算机自动评分优势诸多,发展势头迅疾,将这一技术引入到实评之中,须对其效度进行论证。本研究依据Williamson等在2012年提出的计算机自动评分效度论证框架,对2016年11月我国新疆地区中国少数民族汉语水平等级考试(MHK)口语考试的实测数据进行了计算机自动评分的效度验证,结果显示:依据该框架对口语开放性试题计算机自动评分进行效度验证是可行的,MHK口语开放性试题的计算机自动评分与人工评分的依据相似,与专家评分的相关系数在0.8以上,评分的一致性和稳定性较高,多项指标明显优于人工评分。(本文来源于《中国考试》期刊2019年09期)
谢小莉[2](2019)在《目标导向模式下大学英语课程口语能力培养——以CET口试评分标准为参照》一文中研究指出口语能力培养是大学英语课程教学的关键任务之一。目前,大学英语课堂在培养学生口语能力方面存在培养目标未细分,学生学习目标不明确,目标推进周期漫长,反馈调整迟滞,学习考评机制不健全,课内外联动不够等问题。结合《大学英语教学指南》,确定以大学英语四六级考试的口试评分标准为关键参照目标,运用深度细化培养目标、动态检视目标落实、比照落实情况灵活调整教学等策略,能在充分挖掘大学英语学习主体口语学习潜力的同时有效提高口语能力培养效率。(本文来源于《江苏工程职业技术学院学报》期刊2019年02期)
徐柳,蔡宏文[3](2019)在《英语口语测试任务特征对评分员关注点的影响》一文中研究指出本研究基于英语专业四级口试,对比了即席讲话和交谈等两项任务的评分过程中评分员的关注点。这两项任务在交互性、体裁和话题等方面存在差异。研究要求评分员对考生的录音进行评分,并报告评分理由,再将收集到的评分理由与官方评分标准进行对比,从中甄别出叁类成分:两项任务共有的构念成分、任务独有的构念成分和构念无关成分。结果发现,评分员的关注点与官方标准高度一致,但是在给不同任务评分时对相同的构念成分采用了不同的指标,并使用了与构念无关的标准。研究结果表明,任务特征对评分员关注点既有间接影响,也有直接影响。(本文来源于《现代外语》期刊2019年04期)
吴大志[4](2019)在《英语口语测试结果量化甄别与主观评分实证研究》一文中研究指出先进的网络水平与科学进步应有效利用于口语测试的量化操作中,利用量化甄别操作对学生的口语分数进行计算,保障量化甄别措施的可行性。本文结合实际研究,对英语口语测试结果的量化指标与量化综合系数进行定义,并简单分析了量化甄别的实际操作流程,研究了主观打分与量化测试的结果。(本文来源于《中国多媒体与网络教学学报(上旬刊)》期刊2019年04期)
黄明明,陈丽萍[5](2018)在《基于多面Rasch模型的幼儿师范生口语测试评分研究》一文中研究指出目的:探究幼儿师范生口语表达能力水平与结构,分析幼儿师范生口语测试中的评分者效应,以提升幼儿师范生口语测试公平性,促进幼儿教师口语课程教学效果。方法:以某高校学前教育学院举行的幼儿师范生口语大赛为例,运用多面Rasch技术分析本次大赛所得到的测评数据。结果:幼儿师范生口语表达能力水平相差较大,六位评分者评分严格,且差异明显,评分者的前后一贯性差,评分等级设置过于分散,高等级与低等级未能发挥相应作用。结论:幼儿师范生口语表达能力是多成分心理特质,需要从多方面训练,测试评分偏差源于评分员对评分规则的熟知度差,口语测试应当合理分散进行,过于集中测试导致的评分疲劳等会影响评分公平性。(本文来源于《萍乡学院学报》期刊2018年05期)
揭薇[6](2018)在《基于多面Rasch模型的商务英语口语测试评分研究》一文中研究指出信度和效度研究较多考察通用英语测试,而对专门用途英语测试的效度微观研究则相对缺失。本文应用FACETS软件对某高校VECTOR商务英语主观题型测试进行分析,从微观上对评分者严厉程度、考生能力差异、试题难易度差异进行进一步分析。结果显示,与其他通用英语主观题型测试的经验性结论相比,商务英语话题任务难度差异大,评卷者严厉度存在显着差异。本研究的结论有助于解释商务英语口语测试效度,并且利用该模型对评分者进行培训,从而改善考试设计、控制评分质量,改进评分标准和提高考试效度,这对相关教学和测试意义重大。(本文来源于《山东外语教学》期刊2018年03期)
吴倩文[7](2018)在《雅思口语测试评分标准对口语教学的启示——以应用型大学英语专业口语教学为例》一文中研究指出本文依据雅思口语测试的评分标准来反思应用型大学英语专业口语教学,得出结论:应用型大学英语专业口语教学应加强教师在口语课堂上的主导地位,加强对语料输入的重视和实践,加强对学生口语表达中语言形式的关注和重视对英语专业学生口语水平的评价。(本文来源于《科教文汇(下旬刊)》期刊2018年01期)
董昆[8](2017)在《口语测试评分流程的信度与效度分析》一文中研究指出表现性评价是指在真实语言测试情境中,对学生完成任务过程中的表现进行观察和评估。由于表现性评价重点强调对于考生运用某种语言能力的测试,因此表现性评价在二语测试中占据越来越重要的位置。但是,以表现性评价为主旨的英语口语能力测试在实际测试中,由于受到诸如考生的能力水平、考官的严厉度和一致性,任务和评分标准的难度以及偏差作用等影响,被试者是否得到口语能力测试的真实得分的问题值得重视和研究。因此在推行英语口语能力测试时,有必要对测试过程中评分流程的信度和效度进行验证。当前最常用的方法是运用多层面Rasch模型验证评分流程的信度与效度。运用多层面Rasch模型的研究曾集中于英语写作测试准确性和有效性的研究之上,现在模型研究也开始关注英语口语能力测试评分流程的信度与效度问题。在这种背景之下,本次研究旨在使用SPSS和Facets软件,通过研究在北京第二外国语学院举办的一次大学英语应用能力口语测试(Test of English Proficiency,简称TEP Oral),研究评分流程的信度和效度,了解影响考试最后得分的各种因素。本次研究的研究对象包括382名考生和36位评分员。大学英语应用能力口语测试(本文后续部分采用TEP Oral表述)采取整体评分和分项评分相结合的方式。本次研究首先采用SPSS进行描述性统计分析,随后使用Facets软件来进一步调查影响大学英语应用能力口语测试A级评分结果的各个侧面。本次研究旨在解决以下的问题:(1)整体评分和分项评分能否区分不同考生的能力水平?(2)评分员使用整体和分项评分时的严宽度是否不同?如若有不同,是何种程度的不同?(3)评分员在使用不同评分模式时是否能保持一致性?整体评分和分项评分的信度是否有显着性差异?如若有,哪一种评分模式更为可靠?(4)在两种评分模式下,考生的排名是否有所变化?(5)在两种评分模式下,各个分数是否得到合理使用?有没有过度使用或漏用的情况?研究结果显示使用整体和分项评分相结合的方式可以区分考生的不同能力水平。同时,评分员的严厉度在两种评分模式下均呈现了显着性差异,但是评分员在使用分项评分时更加宽松。评分员在使用不同评分模式评分时显着相关。有关考生得分层面,考生在不同评分模式下的排名无明显差异。最后,两种评分模式下的各个分数都得到了合理的使用。本次研究的结论显示大学英语应用能力口语测试A级的评分流程是可靠且有效的,本次研究结果会对英语口语能力测试和英语口语教学带来启示。(本文来源于《北京第二外国语学院》期刊2017-05-26)
张胜斌[9](2017)在《针对答题关键信息的汉英口语翻译题自动评分方法的研究》一文中研究指出英语口语考试自动评分一直是计算机辅助语言学习领域中的研究热点。目前,已有的自动评分方法大多针对朗读题、跟读题等题型,而针对汉英口语翻译题的自动评分方法则相对鲜见。采用人工评分方式对汉英口语翻译题进行评分时,评分员主要侧重答题中是否包含参考答案中要求回答的关键信息,其中关键信息一般通过关键词体现。基于此,本文模仿人工评分方式,研究了针对答题关键信息的汉英口语翻译题自动评分的相关问题,包括答题语音信号预处理,答题关键信息识别及关键信息完整性特征提取,答题发音流利度计算及流利度特征提取,结合关键信息完整性特征和流利度特征的自动评分方法设计等。主要研究工作包括:(1)考虑到在缺乏大量已标注语音数据的情况下难以构建精确的连续语音识别系统的问题,本文采用基于动态时间规整(DTW)算法的无监督语音关键词检出方法去识别答题语音中的关键词。首先在TIMIT语料库中对基于SLN-DTW(Segmental local-normalized-DTW)的语音关键词检出方法进行有效性验证实验,实验结果证明了其性能优势;进而结合WordNet构建答题关键词识别库,将SLN-DTW关键词检出方法应用于答题语音中的关键词识别,实验结果表明,采用SLN-DTW关键词检出方法检出的关键词个数可作为答题关键信息覆盖程度的有效特征表示。(2)对于检出的关键词,为了进一步得到其置信度,本文采用基于卷积神经网络(CNN)的语音识别方法对检出的关键词进行二次识别。首先通过构建基于CNN的语音识别模型,结合均值规整算法处理语音特征参数,在UCI机器学习库的Spoken Arabic Digit数据集上进行识别实验,实验得出的识别率优于其他模型在相同数据集上的实验结果;在采集的答题关键词数据集上进行识别实验,结果也优于其他两种常用的识别模型,证明了采用CNN语音识别方法的可行性。(3)利用答题语音关键词检出结果和关键词二次识别结果计算得到关键信息完整性特征,与原始答题语音层面上提取的流利度特征一起构成本文的自动评分特征。采用回归分析法对所有特征进行回归分析,构建本文的自动评分模型。通过真实的考试数据对评分模型进行性能测试,测试得到的机器评分与原始评分的整体相关性大小为0.729,证明提取的特征用于机器评分是有效的,也验证了本文提出的针对答题关键信息的汉英口语翻译题自动评分方法的有效性。(本文来源于《广东外语外贸大学》期刊2017-05-23)
王显涛[10](2016)在《大学英语口语测试中评分员效度研究》一文中研究指出在大学英语配对口语测试过程当中,有关评分宽严度与一致性常会受到多面Rasch模型(MFRM)的影响,发挥出一定作用。本次研究通过SPSS与MFRM分析的方法,将10对考生作为研究对象,依靠4名经验评分员对口试加以有效评价。结果显示,具有各异性格特点的评分员对宽严度方面的评价是不同的,相较于外向型评分员,内向型更加严格;表现在一致性方面的差异却微乎其微。(本文来源于《文教资料》期刊2016年19期)
口语评分论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
口语能力培养是大学英语课程教学的关键任务之一。目前,大学英语课堂在培养学生口语能力方面存在培养目标未细分,学生学习目标不明确,目标推进周期漫长,反馈调整迟滞,学习考评机制不健全,课内外联动不够等问题。结合《大学英语教学指南》,确定以大学英语四六级考试的口试评分标准为关键参照目标,运用深度细化培养目标、动态检视目标落实、比照落实情况灵活调整教学等策略,能在充分挖掘大学英语学习主体口语学习潜力的同时有效提高口语能力培养效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
口语评分论文参考文献
[1].王妍,彭恒利.汉语口语开放性试题计算机自动评分的效度验证[J].中国考试.2019
[2].谢小莉.目标导向模式下大学英语课程口语能力培养——以CET口试评分标准为参照[J].江苏工程职业技术学院学报.2019
[3].徐柳,蔡宏文.英语口语测试任务特征对评分员关注点的影响[J].现代外语.2019
[4].吴大志.英语口语测试结果量化甄别与主观评分实证研究[J].中国多媒体与网络教学学报(上旬刊).2019
[5].黄明明,陈丽萍.基于多面Rasch模型的幼儿师范生口语测试评分研究[J].萍乡学院学报.2018
[6].揭薇.基于多面Rasch模型的商务英语口语测试评分研究[J].山东外语教学.2018
[7].吴倩文.雅思口语测试评分标准对口语教学的启示——以应用型大学英语专业口语教学为例[J].科教文汇(下旬刊).2018
[8].董昆.口语测试评分流程的信度与效度分析[D].北京第二外国语学院.2017
[9].张胜斌.针对答题关键信息的汉英口语翻译题自动评分方法的研究[D].广东外语外贸大学.2017
[10].王显涛.大学英语口语测试中评分员效度研究[J].文教资料.2016