评分信度论文-王一吉,周红俊,袁媛,刘根林,郑樱

评分信度论文-王一吉,周红俊,袁媛,刘根林,郑樱

导读:本文包含了评分信度论文开题报告文献综述及选题提纲参考文献,主要关键词:脊髓损伤,数字评分法,感觉功能,信度

评分信度论文文献综述

王一吉,周红俊,袁媛,刘根林,郑樱[1](2019)在《数字评分法在脊髓损伤患者感觉异常关键点评分中的信度》一文中研究指出目的检验数字评分法在脊髓损伤感觉异常关键点评分中的重测信度和评测者间信度。方法 2016年10月至2018年10月,采用数字评分法对69例脊髓损伤患者的感觉异常关键点进行评分。评测者A对关键点进行第一次评分,次日评测者B对同一关键点进行再次评分。3周后由评测者A再次对同一患者进行评分。结果两侧肢体针刺觉评分和轻触觉评分的重测信度(r> 0.88, P <0.001)和评测者间信度(ICC> 0.93, P <0.001)均良好。颈段、胸段和腰段针刺觉评分和轻触觉评分的重测信度(r> 0.88, P <0.001)和评测者间信度(ICC> 0.93, P <0.001)均良好。结论数字评分法在脊髓损伤患者感觉异常关键点评分中具有良好的重测信度和评测者间信度。(本文来源于《中国康复理论与实践》期刊2019年10期)

毛星星[2](2018)在《评分员背景对大学英语期末考试写作评估信度和效度的影响》一文中研究指出不论是在课堂测试还是在大型标准化语言考试中,写作都是必不可少的一部分。它能够有效地测试出学生的综合语言运用能力。然而,由于评分的主观性,写作评分的准确性和公平性一直备受质疑。同一篇作文,不同评分员给出的分数可能会有很大的差别。这种情况下,写作评分的信度、效度和公平性就无法得到保证。Eckes(2008)也曾指出评分员不一致性是语言测量专家面对的最大挑战之一。现有研究表明,评分员的背景差异是导致作文得分偏离“真分数”的最重要原因之一。运用概化理论,本文旨在探究评分员的背景差异对大学英语期末考试中写作评估信度和效度的影响。基于此目的,本文将六位评分员按照叁个背景因素(性别、教育经历和写作评阅经历)进行分组(每个背景因素分成两组,每组叁人),比较了不同背景组别评分员的写作评分结果。本文的研究样本是从2017年6月湖南大学大一非英语专业学生的期末考试中抽取的60篇作文,由六位评分员采用整体评分的方法(1-15分)进行评阅。每位评分员独自评分。最终的分数在EXCEL和GENOVA中进行分析。分析结果表明,该写作评分的总体信度和效度较低。组间比较表明:与女性评分员相比,男性评分员的评分一致性更差,但两者在评分信度、聚合效度和区分效度上几乎无差别;与语言测试背景的评分员相比,非语言测试背景评分员的评分一致性、信度、聚合效度和区分效度明显偏低;与有经验的评分员相比,普通评分员的评分一致性、信度、聚合效度和区分效度相对较低。最后,本文挑选了两位评分员进行半结构化访谈,结果显示评分员的语言测试知识和评阅经历会对其评分观念和行为产生一定的影响,从而影响最终的作文得分。本文研究结果表明,评分员性别不会影响作文评分质量,但是评分员的语言测试背景与评阅经历却会产生明显影响。因此,探究评分员偏颇产生的原因对于写作评估信度和效度的研究至关重要。一旦了解了偏颇来源,我们就能够采取针对性措施来保障写作评分的信度、效度及公平性。(本文来源于《湖南大学》期刊2018-04-20)

汤旭娟[3](2018)在《基于SOLO理论的信息技术作品评价之评分人信度研究》一文中研究指出教育教学强调合作学习中学生互评的重要性,倡导自主、合作、探究的学习方式,而信息技术作品作为一种开放性试题作品,有着明显的能力梯度,答案和结论都具有较强的开放性,学生在互评时由于个人主观性会导致评价结果差异性较大,评分信度低。因此,寻求一种信度较高的评价方式是目前至关重要的问题。SOLO分类法是澳大利亚心理学家比格斯(Biggs)教授首倡的一种质性研究方法,这种方法是以等级描述为特征。SOLO分类法不仅能判断学生在回答问题时的思维结构,还能测试出更高层次的学习水平,它为开放性试题的评分提供了一种更有效的方法。鉴于其自身的优越性,能够满足信息技术作品的评价需求,改善学生互评中出现的评价不一致性问题。本研究在已有的研究基础上,以Photoshop信息技术作品为例,考察了将SOLO理论应用于信息技术作品评价上的评分人评价信度。本文在查阅了解SOLO理论与评分信度的相关文献后,使用了比较分析的研究方法,运用SOLO分类评价法对信息技术作品进行评价,并以传统评价方法为参照方法,展开探讨两种方法对评分人信度的影响,评分结果一致性如何。实验设计五名评分人运用两种评价标准前后两次对一个班级42名学生的Photoshop信息技术作品进行评分,运用Kendall和谐系数、Sperman相关系数等多种统计方法计算评分人信度,通过分析评分人内部一致性和评分人之间的评分一致性来考察评分人的评价信度。实验结果表明,基于SOLO分类法的信息技术作品评价有较高的一致性与一定的稳定性,整体的评分人信度相关性显着并高于传统评价方式的相关系数。(本文来源于《南京师范大学》期刊2018-03-18)

李艳玲,田夏春[4](2018)在《iWrite 2.0在线英语作文评分信度研究》一文中研究指出随着国内自动评分技术的飞速发展,写作自动评分方法不断涌现,i Write英语写作教学与评阅系统2.0应运而生。该系统拥有包含写作教学系统、智能批改引擎和自动评分引擎在内的多项自主知识产权技术,能够实现对英语作文的语言、内容、篇章结构和技术规范四个维度的机器智能评阅。文章从真实语言测试中获取了大量英语作文语料,充分利用一致性和一致率算法,将作文的人工评分与i Write 2.0的机器评分做了多角度对比,并对i Write 2.0在线英语作文评分的信度进行了实证研究。(本文来源于《现代教育技术》期刊2018年02期)

范琴,韩潮[5](2018)在《英汉双向口译测试评分结果的一致性——一项关于口译评分者之间信度的实证研究》一文中研究指出口译测试评估是口译教学的重要组成部分,对成绩评估、人才选拔等具有重要意义。在口译评估中,评阅人员之间的信度对口译测试的整体信度具有很大影响。本研究通过比较不同评分人员给学生英汉互译测试的分数,发现在英译汉和汉译英两个方向上,学生评分员之间的评分数据差异最大,而教师评分员之间的评分数据差异最小;在汉译英方向一位学生评分人员与一位教师评分人员的评分数据之间存在着具有统计学意义的显着差异。评分者语言能力、口译实践经验、口译评分经验等都是影响口译评分的重要因素。(本文来源于《海外英语》期刊2018年03期)

史润泽,李永刚,康晓凤[6](2017)在《评分者信度测量在护理研究中的应用》一文中研究指出评分者信度作为常用测量评价指标之一,有助于控制测量误差,提高主观变量测量的精确性,在护理研究中被广泛应用。本文对评分者信度测量的概念进行澄清,介绍常用的基于经典测量理论的几种评分者信度测量方法,如Pearson积差相关、Cronbach′sα系数、Spearman相关、组内相关系数(ICC)、Kappa系数、Kendall和谐系数,并对评分者信度测量的应用及影响因素进行分析,以期为护理人员在科学研究中正确应用评分者信度测量提供参考依据。(本文来源于《护理学杂志》期刊2017年19期)

尹姣[7](2017)在《文本翻译测试命题与评分的效度及信度探讨》一文中研究指出文本翻译测试是目前许多学校采用的一种翻译测试题型。作为一种主观测试题型,这种测试题型在命题及评分方面存在着一些问题,而这些问题影响了其测试的效度和信度。为了提高文本翻译测试的质量,使其达到测试目的,该论文首先界定了文本翻译测试,并对测试的效度与信度进行了解释,最后在文本翻译测试的命题及评分方面探讨了其效度与信度,并在此基础上提出了一些建议。(本文来源于《吉林省教育学院学报》期刊2017年08期)

董昆[8](2017)在《口语测试评分流程的信度与效度分析》一文中研究指出表现性评价是指在真实语言测试情境中,对学生完成任务过程中的表现进行观察和评估。由于表现性评价重点强调对于考生运用某种语言能力的测试,因此表现性评价在二语测试中占据越来越重要的位置。但是,以表现性评价为主旨的英语口语能力测试在实际测试中,由于受到诸如考生的能力水平、考官的严厉度和一致性,任务和评分标准的难度以及偏差作用等影响,被试者是否得到口语能力测试的真实得分的问题值得重视和研究。因此在推行英语口语能力测试时,有必要对测试过程中评分流程的信度和效度进行验证。当前最常用的方法是运用多层面Rasch模型验证评分流程的信度与效度。运用多层面Rasch模型的研究曾集中于英语写作测试准确性和有效性的研究之上,现在模型研究也开始关注英语口语能力测试评分流程的信度与效度问题。在这种背景之下,本次研究旨在使用SPSS和Facets软件,通过研究在北京第二外国语学院举办的一次大学英语应用能力口语测试(Test of English Proficiency,简称TEP Oral),研究评分流程的信度和效度,了解影响考试最后得分的各种因素。本次研究的研究对象包括382名考生和36位评分员。大学英语应用能力口语测试(本文后续部分采用TEP Oral表述)采取整体评分和分项评分相结合的方式。本次研究首先采用SPSS进行描述性统计分析,随后使用Facets软件来进一步调查影响大学英语应用能力口语测试A级评分结果的各个侧面。本次研究旨在解决以下的问题:(1)整体评分和分项评分能否区分不同考生的能力水平?(2)评分员使用整体和分项评分时的严宽度是否不同?如若有不同,是何种程度的不同?(3)评分员在使用不同评分模式时是否能保持一致性?整体评分和分项评分的信度是否有显着性差异?如若有,哪一种评分模式更为可靠?(4)在两种评分模式下,考生的排名是否有所变化?(5)在两种评分模式下,各个分数是否得到合理使用?有没有过度使用或漏用的情况?研究结果显示使用整体和分项评分相结合的方式可以区分考生的不同能力水平。同时,评分员的严厉度在两种评分模式下均呈现了显着性差异,但是评分员在使用分项评分时更加宽松。评分员在使用不同评分模式评分时显着相关。有关考生得分层面,考生在不同评分模式下的排名无明显差异。最后,两种评分模式下的各个分数都得到了合理的使用。本次研究的结论显示大学英语应用能力口语测试A级的评分流程是可靠且有效的,本次研究结果会对英语口语能力测试和英语口语教学带来启示。(本文来源于《北京第二外国语学院》期刊2017-05-26)

白玉洁,高淑玲[9](2017)在《浅析网络阅卷中阅卷员对评分信度的影响——以大学英语六级翻译题为例》一文中研究指出基于近年来网络评卷的兴起,本文以六级英语翻译真题网评工作为例,以评分信度为主,分析影响阅卷评分信度的主要人为因素,并从中分析其利弊,寻求解决方案,以期能够提升阅卷评分信度,降低人为因素造成的误差。(本文来源于《祖国》期刊2017年10期)

王怡安[10](2017)在《对比研究英汉交替口译中量表式和意群式评分方式的评分者间信度》一文中研究指出口译质量评估研究的一个中心问题是使用什么样的工具和标准(Sang-Bing Lee,2015)。由于口译测试中评分者存在差异性以及口译资格考试具有高利害性,确保质量评估中的评分者间信度至关重要。从评估机构的角度来说,使用有效、可信的评估工具有助于保证评估结果的客观公正,对推动口译测试的标准化进程和口译人才的选拔都有重要意义。本文研究的是针对英汉口译质量评估中“信息准确度”这一标准采用两种评分方式对评分者间信度的影响以及背后可能的原因,旨在探讨口译评估中对评估方式的合理选择,保持评估结果的客观、公正。本研究选取厦门大学叁级交替口译考试音频为样本,邀请20名评分者分别使用量表式(scale-basedrating)和意群式(proposition-basedrating)的评分表针对译文的信息准确度打分。评分者内部分为两组,一组为经验丰富的业内人士,另一组为口译专业叁年级硕士研究生。使用SPSS工具分析整组和两组内部的分数一致性。通过对比使用两种不同的评分方式体现的评分者间信度(inter-rater reliability)的差异并结合访谈分析产生差异的原因。研究发现,两张评分表都体现了比较高的评分者间信度,意群式评分表的评分者间信度要高于量表式评分表。但是不同背景的评分者可能适用于不同的评分方式。对于经验丰富的职业译员来说,量表式或者意群式的评分方式体现的评分者间信度差别不大,但是具体操作时,意群式的评估表可以更有效地帮助评分者保持评估标准的一致性、客观性。而对于学生译员来说,使用意群式的评分方式可以帮助其在面对不同水平的口译表现时,保持评分标准上的一致性,达到较高的评分者间信度。量表式评分表和意群式评分表各有特点,在实际操作中可以根据评分者的特点,评估的目的、性质等选择合适的方式。(本文来源于《厦门大学》期刊2017-04-01)

评分信度论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

不论是在课堂测试还是在大型标准化语言考试中,写作都是必不可少的一部分。它能够有效地测试出学生的综合语言运用能力。然而,由于评分的主观性,写作评分的准确性和公平性一直备受质疑。同一篇作文,不同评分员给出的分数可能会有很大的差别。这种情况下,写作评分的信度、效度和公平性就无法得到保证。Eckes(2008)也曾指出评分员不一致性是语言测量专家面对的最大挑战之一。现有研究表明,评分员的背景差异是导致作文得分偏离“真分数”的最重要原因之一。运用概化理论,本文旨在探究评分员的背景差异对大学英语期末考试中写作评估信度和效度的影响。基于此目的,本文将六位评分员按照叁个背景因素(性别、教育经历和写作评阅经历)进行分组(每个背景因素分成两组,每组叁人),比较了不同背景组别评分员的写作评分结果。本文的研究样本是从2017年6月湖南大学大一非英语专业学生的期末考试中抽取的60篇作文,由六位评分员采用整体评分的方法(1-15分)进行评阅。每位评分员独自评分。最终的分数在EXCEL和GENOVA中进行分析。分析结果表明,该写作评分的总体信度和效度较低。组间比较表明:与女性评分员相比,男性评分员的评分一致性更差,但两者在评分信度、聚合效度和区分效度上几乎无差别;与语言测试背景的评分员相比,非语言测试背景评分员的评分一致性、信度、聚合效度和区分效度明显偏低;与有经验的评分员相比,普通评分员的评分一致性、信度、聚合效度和区分效度相对较低。最后,本文挑选了两位评分员进行半结构化访谈,结果显示评分员的语言测试知识和评阅经历会对其评分观念和行为产生一定的影响,从而影响最终的作文得分。本文研究结果表明,评分员性别不会影响作文评分质量,但是评分员的语言测试背景与评阅经历却会产生明显影响。因此,探究评分员偏颇产生的原因对于写作评估信度和效度的研究至关重要。一旦了解了偏颇来源,我们就能够采取针对性措施来保障写作评分的信度、效度及公平性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

评分信度论文参考文献

[1].王一吉,周红俊,袁媛,刘根林,郑樱.数字评分法在脊髓损伤患者感觉异常关键点评分中的信度[J].中国康复理论与实践.2019

[2].毛星星.评分员背景对大学英语期末考试写作评估信度和效度的影响[D].湖南大学.2018

[3].汤旭娟.基于SOLO理论的信息技术作品评价之评分人信度研究[D].南京师范大学.2018

[4].李艳玲,田夏春.iWrite2.0在线英语作文评分信度研究[J].现代教育技术.2018

[5].范琴,韩潮.英汉双向口译测试评分结果的一致性——一项关于口译评分者之间信度的实证研究[J].海外英语.2018

[6].史润泽,李永刚,康晓凤.评分者信度测量在护理研究中的应用[J].护理学杂志.2017

[7].尹姣.文本翻译测试命题与评分的效度及信度探讨[J].吉林省教育学院学报.2017

[8].董昆.口语测试评分流程的信度与效度分析[D].北京第二外国语学院.2017

[9].白玉洁,高淑玲.浅析网络阅卷中阅卷员对评分信度的影响——以大学英语六级翻译题为例[J].祖国.2017

[10].王怡安.对比研究英汉交替口译中量表式和意群式评分方式的评分者间信度[D].厦门大学.2017

标签:;  ;  ;  ;  

评分信度论文-王一吉,周红俊,袁媛,刘根林,郑樱
下载Doc文档

猜你喜欢