导读:本文包含了计数回归模型论文开题报告文献综述及选题提纲参考文献,主要关键词:带约束的零膨胀计数模型,部分线性可加,半参数回归,大样本性质
计数回归模型论文文献综述
夏丽丽[1](2019)在《一类带约束的零膨胀计数模型的半参数回归分析》一文中研究指出在科学研究中,经常会遇到零膨胀计数数据,这类数据的共同点就是,观测数据的方差变化大于均值,我们通常称这是超散度问题。针对零膨胀计数数据,当面临一些复杂数据的情况下,比如有时候我们并不清楚某个协变量到底是对零膨胀部分有影响,还是对分布均值有影响,又或者是对这两者都有影响,目前我们的解决办法是先结合实际,然后再通过一遍遍的模拟来确定,这是相当麻烦和不精确的。针对某个协变量对零膨胀率或分布均值有影响的情况,研究起来并不困难,但当某个协变量对这两部分都有影响并且存在某中关联时,此时再用普通的零膨胀计数模型进行研究会不切实际,会产生较大的误差。面对上面的问题,本文研究了某个协变量对这两者都有影响的情况下,假设非零膨胀率和某种分布均值之间存在某种线性关系,例如捕鱼数据,捕鱼量受各种因素的影响,比如水的深度和经纬度即影响日平均捕鱼量,又影响非零捕获率,它们之间很肯存在某种线性关系,此时可以用带约束的零膨胀计数模型进行研究,约束条件为非零膨胀率和某种分布均值之间存在线性关系。加了约束条件的模型虽然又引入了新的参数,但相比无约束的情况,模型反而更加简洁,参数个数变少等优点,目前国内对此类型的数据缺乏系统性的研究,所以本文主要针对带约束的零膨胀计数数据进行展开。由于非参数回归技术主要是现有估计方法中的局部估计,必须有足够的数据点才能够得到比较精确的估计结果,与此同时,要想达到这样的条件,将会面临“维数祸根”,此时比较折中的办法就是运用半参数回归技术进行数据分析。本文在连接函数部分用了部分线性可加模型对带约束的零膨胀计数模型进行回归分析,非参数估计部分用了光滑样条的估计方法,主要是为了克服曲线对数据点的过度拟合现象。另外,在参数估计过程中,发现如果直接用对数似然函数进行估计,是相当困难的,因为会存在高微积分,难以求出解析解,但是在存在缺失数据的情况下,即零膨胀计数数据中的零我们并不清楚是来自分布零还是结构零,因此引入了EM算法,并把非线性估计器和惩罚似然估计结合在一起,在完全数据下,得到模型的惩罚对数似然函数,然后用EM算法和NewtonRaphson算法对模型的参数和非参数部分进行估计,并给出了相关大样本性质的证明。为了使研究的问题更能反映数据特点,本文还分析了不同离散分布情况下带约束的零膨胀计数模型,可以根据不同的数据特点进行模型选择。最后通过Monte Carlo模拟和实例分析,可以验证此方法的有效性。(本文来源于《兰州财经大学》期刊2019-06-10)
孙耀航,刘萍[2](2019)在《基于SVM的回归模型路口车辆计数方法》一文中研究指出论文提出了一种利用监控视频对路口车辆进行计数的新的方法。针对路口车辆交通拥堵、遮挡程度高、移动速度缓慢、车行有规律等特征,提出基于回归模型的路口监控视频车辆计数算法。首先对监控视频进行处理,从中提取车流特征。之后,利用SVM对实时道路车辆密度进行辨别,并根据辨别结果,对密度高或低的情况分别应用不同的回归模型进行计数。最后,以实地采集的路口交通视频对该方法进行了验证。实验结果表明,该方法可以在实现较高准确率的基础上,占用较少的计算资源,对路口监控视频的车流进行计数。(本文来源于《计算机与数字工程》期刊2019年02期)
胡良平[3](2018)在《过离散计数资料负二项分布模型回归分析》一文中研究指出本文目的是介绍过离散(即方差明显大于均值)计数资料负二项分布模型回归分析。首先,介绍了过离散计数资料及其负二项分布回归模型构建原理,包括"过离散计数资料负二项分布回归模型的形式"和"过离散计数资料负二项分布回归模型的求解";第二,介绍了"过离散计数资料负二项分布回归模型的SAS实现",包括:(1)"创建SAS数据集";(2)"求出因变量Y的均值和方差""检验因变量是否存在过离散现象"和"基于全部自变量对因变量Y构建多重负二项分布回归模型"。本文结果提示,在"过离散"非常严重的情况下,应使用"负二项分布回归模型"取代"Poisson分布回归模型"。否则,易得出不正确的结果和结论。(本文来源于《四川精神卫生》期刊2018年05期)
胡良平[4](2018)在《一般计数资料Poisson分布模型回归分析》一文中研究指出本文目的是介绍一般计数资料Poisson分布模型回归分析。首先,介绍一般计数资料及其Poisson分布模型构建原理,包括"一般计数资料Poisson分布回归模型的形式"和"一般计数资料Poisson分布回归模型的求解";其次,介绍"一般计数资料Poisson分布回归模型的SAS实现",包括"创建SAS数据集""求出因变量Y的均值和方差""检验因变量是否存在过离散现象""对过离散进行校正"和"基于全部自变量对因变量Y构建多重Poisson分布回归模型"。本文结果提示,在"过离散"不十分严重的情况下,通过在GENMOD过程的"model语句"中增加选项"dist=poisson"和"scale=deviance",可以较好地校正"过离散"导致的不良后果。(本文来源于《四川精神卫生》期刊2018年05期)
赵娜,洪广彬[5](2018)在《多项分布内生回归元计数模型的两阶段估计方法研究》一文中研究指出两阶段估计方法是解决计量模型变量内生性问题的重要方法,而现代社会科学领域的研究文献在选择两阶段估计方法时存在较多误区,缺乏比较系统的研究。基于多项分布内生回归元的计数模型,采用蒙特卡洛模拟比较2SLS、2SPS、2SRI叁种两阶段估计方法的优劣,并从检验水平和功效角度评价Wald、LR、LM叁种内生性检验方法的有效性,结果发现:当忽略模型非线性、内生性或错误设定计数数据分布时,2SLS和2SPS均会存在较大的估计偏差,但2SRI估计量具有良好的有限样本特征;基于2SRI的叁种内生性检验方法,在计数数据分布设定正确时都有合理的实际检验水平和功效,但在忽略计数数据过度分散特征时,Wald和LR检验统计量会发生严重的水平扭曲,而LM检验则更有效。(本文来源于《统计与信息论坛》期刊2018年08期)
袁海静[6](2018)在《稳健回归模型的非迭代抽样算法与计数时间序列模型的统计推断》一文中研究指出针对连续型数据中经常呈现的重尾现象以及计数时间序列数据的过度扩散等情况,本文讨论了若干有关的统计模型及其参数估计问题,涉及尺度混合正态回归模型、截尾学生t回归模型、混合负二项整值ARCH模型、Neyman-A型整值GARCH模型,发展了相应的非迭代贝叶斯后验抽样算法、EM算法等。得到了有关模型平稳性的充要条件及模型选择策略。与传统模型和算法相比,所考虑模型和算法在模拟和实例分析中都有满意的表现,在经济、医学等领域有较好的应用。1.尺度混合正态线性回归模型的非迭代贝叶斯抽样算法尺度混合正态(SMN)分布为一类重尾分布族,由于其稳健性,当数据中有异常值时,常用其替代正态分布。关于SMN线性回归及相关模型的统计推断,文献中有基于期望最大化(EM)算法的最大似然估计和基于马氏链蒙特卡洛(MCMC)抽样的贝叶斯推断。例如,Andrews(1974)、Dempster(1980)以及Lange(1993)发展了 SMN分布的(EM)算法,并讨论了它们在稳健回归中的应用。Fernndez and Steel(2000)讨论了 SMN 线性回归下的 MCMC)算法,Abanto-Valle et al.(2010)则从贝叶斯的角度分析了 SMN随机波动性模型。Rosa et al.(2003,2004)将SMN线性回归模型推广到SMN线性混合效应模型,并进行了贝叶斯推断。Garay et al.(2015,2017)将SMN回归模型推广到截尾的情形,并讨论了相应的EM算法和MCMC算法。由于其灵活性和易实施性,Gibbs抽样和其他MCMC抽样算法被广泛用于贝叶斯统计推断,但这些迭代抽样算法有其缺陷,实际应用中容易被忽视。其一,由迭代的MCMC抽样产生的样本很难做到独立;其二,很难确信迭代终止时抽取的马氏链是否达到收敛。Tan et al.(2003)提出了一种缺失数据结构下基于逆贝叶斯公式(IBF)的非迭代抽样算法,该算法可从后验分布中产生(近似)独立同分布(i.i.d.)的样本,所得样本可直接用于贝叶斯统计推断,从而避免了 Gibbs抽样的缺点。受Tan et al.(2003)启发,在第一章中,我们将非迭代抽样算法的思想应用到SMN回归模型中去,发展了非迭代贝叶斯后验抽样算法。该算法把SMN回归模型的稳健性与非迭代抽样的计算有效性结合起来,能够获得来自参数后验分布的独立同分布的样本,从而避免了迭代的Gibbs抽样算法的收敛性诊断问题。我们通过模拟来研究算法的表现,并用该后验样本进行模型选择和影响分析。最后,用该策略分析美国长期国债价格数据集,得到了有意思的结果。与正态回归及迭代的Gibbbs抽样相比,我们的策略在模拟和应用中表现都很好。2.截尾学生t线性回归模型的非迭代贝叶斯抽样算法截尾学生t回归模型((CTR)在处理异常数据时比截尾正态回归模型更稳健。第二章中,我们在贝叶斯框架下,发展了处理截尾学生t回归的非迭代抽样算法。算法的核心在于学生t分布的分层表示和截尾数据的缺失数据结构使得CTR模型很自然具有蒙特卡洛EM(MCEM)结构。首先,将观测数据添加两类潜变量数据,一类是将学生t分布表示成正态分布的混合表示的混合变量,另一类是截尾下的缺失数据,从而获得MCEM结构下的添加条件预测分布。然后,应用EM算法获得后验众数,用其得到最佳重点抽样密度,使得目标后验密度和重点抽样密度间的覆盖区域足够大。最后,两次应用IBF算法和抽样/重点再抽样(SIR)算法,获得来自观测后验分布的近似独立同分布的样本。该样本也被用在模型选择和影响诊断上,能够选择最佳的自由度,并识别潜在的异常值。我们通过模拟来研究CTR算法下的IBF算法的表现,并用该策略分析了两个截尾数据集,一个是左截尾的工资率数据,另一个是右截尾的绝缘寿命数据,发现所用策略比通常的截尾正态线性模型和Gibbs抽样要有效。3.基于混合负二项分布的整值广义自回归条件异方差模型的统计推断为处理过度分散和多峰的计数时间序列,本章中我们建立了基于负二项分布的混合整值自回归条件异方差模型。该模型有多个平稳或非平稳的整值自回归条件异方差过程构成,其中每个混合过程都有着负二项的条件边际分布。相对单个负二项整值自回归条件异方差模型而言,混合模型不仅仅可以处理过度分散,还能较好的处理多峰和具有分平稳混合过程。我们给出了模型具有一二阶平稳解的充分必要条件,也推导了模型的自协方差函数以及自相关系数的递推关系。充分利用模型中的混合性,发展了基于EM算法的最大似然法的参数估计。我们通过模拟研究了估计的表现。最后,通过叁种模型选择方式:AIC、BIC和MRC,对实际数据建立模型进行实证分析。4.A-型Neyman整值广义自回归条件异方差模型的统计推断第四章中,我们讨论一类特殊的复合泊松整值广义自回归条件异方差模型--A-型Neyman整值广义自回归条件异方差模型。对于一般的A-型Neyman整值广义自回归条件异方差模型,导出了其一二阶平稳性条件。我们也特别给出了自协方差函数与自相关系数的递推关系,它们可以用来做部分模型的Yule-Warlker估计。对于模型参数的估计问题,我们考虑了叁种估计方法:Yule-Warler估计(YW),条件最小二乘估计(CLS)和最大似然估计(MLE)。由于A-型Neyman分布的概率分布律的复杂性,极大似然方法中借助于EM算法来最大化似然函数。模拟结果发现,总体上叁种估计方法表现都不错,尤其是当样本量增加时。最后,我们对弯曲杆菌感染的病例的计数数据进行实证分析,通过AIC和BIC准则选择了A-型Neyman整值自回归(NTA-INARCH)模型,并对数据做了拟合与残差诊断。(本文来源于《山东大学》期刊2018-05-18)
刘振球,严琼,左佳鹭,方绮雯,张铁军[7](2018)在《零膨胀计数数据回归模型的选择与比较及R语言的实现》一文中研究指出目的探讨和比较不同模型在零膨胀数据回归分析中的应用。方法在R语言中,拟合HIV合并血友病数据的对数线性模型、零膨胀模型、随机森林、决策树以及支持向量机模型,通过比较标准化均方误差和均方根误差,对模型进行评价与选择。结果从标准化均方误差和均方根误差来看,随机森林是对原始数据拟合的最好的模型,随后是支持向量机和决策树模型,而经典的计数模型表现则相对较差。结论在对零膨胀计数资料进行回归预测时,机器学习方法的效果优于经典的计数模型。(本文来源于《中国卫生统计》期刊2018年02期)
张晓琳[8](2015)在《基于零膨胀计数数据回归模型的贝叶斯分析》一文中研究指出计数数据广泛的存在于生物医学、金融保险、公共健康以及风险控制等领域,零点膨胀是该数据所呈现出的特征之一。所谓零点膨胀,即零观测的比例远超过了拟合分布所允许的范围,也即在零处发生了膨胀。零点膨胀泊松回归模型是拟合上述数据的一般选择。此外,计数数据还常常会呈现出散度偏大的特征,若数据方差的变化大于其均值,则称该数据是散度偏大的。较传统的零点膨胀泊松回归模型而言,零点膨胀下的负二项(ZINB)回归模型更能够解释数据中散度偏大的结构,是分析散度偏大计数数据的有力工具。从已有的研究成果来看,现有的方法和理论大都集中于计数数据的似然分析方面,相比之下,对于现实生活中广泛存在的计数数据的贝叶斯分析仍存在较大的研究空间,特别是对散度偏大计数数据下的层次回归模型的贝叶斯统计推断研究仍有待进一步完善。与极大似然方法相比,贝叶斯方法综合了样本中的先验信息,对于某些分布的建模又具有较灵活的特点,特别是对于缺失数据与复杂模型的研究,贝叶斯方法尤其具有计算的可行性、有效性等方面的优势。因此,本论文将从贝叶斯分析的角度入手,对具有零点膨胀和散度偏大的计数数据进行深入研究。论文首先针对计数数据的零膨胀问题,建立与Probit模型相结合的零膨胀泊松回归模型,同时建立起了结合Gibbs抽样与M-H算法的MCMC技术以获得模型参数的贝叶斯估计,在此基础上,论文采用了DIC信息准则以进行模型之间的比较和选择并进一步考虑了偏后验预测p值以合理评估模型的拟合优度。此外,由于抽样程序及问卷设计的需要,计数数据往往会呈现出组内相关与组间独立的特征,经典的纵向计数数据分析理论总是对随机效应及随机误差均考虑正态分布的情形,然而在实际应用中,这样的假设缺乏统计上的稳健性与建模的灵活性,特别是对于具有尖峰厚尾以及非对称的“非正态型”数据而言,这样的假设会导致有偏甚至无效的统计推断结论。为此,本论文重点考虑了偏斜正态分析下的ZINB层次回归模型的贝叶斯分析问题。具体的,建立起了关于零点膨胀计数数据的ZINB层次回归模型并对随机误差及随机效应考虑偏斜正态分布,在贝叶斯后验推断方面,基于数据添加思想及偏斜正态分布的随机表示理论,建立起了叁层次的贝叶斯分析模型并最终得到模型的后验分布。实际例子表明,该论文提出的方法是有效的。(本文来源于《昆明理工大学》期刊2015-04-01)
曾平[9](2009)在《零过多计数资料回归模型及其医学应用》一文中研究指出事件数(event count)是指单位时间、空间内事件发生次数,变量取值为0,1,2,3,…等非负整数,表现为事件发生次数的离散型随机变量。Poisson回归是计数资料(count data)统计分析的首选模型,也是实际应用中计数资料分析的基本模型。Poisson回归要求事件的发生相互独立,事件的条件均值等于条件方差,这一假设在实际应用常常显得过于严格。负二项回归就是Poisson回归在不同情况下的一种扩展。在计数资料中常存在大量的零计数,当零的比例远超过Poisson回归或负二项回归的预测能力时,表现零膨胀现象(zero-inflated)。零膨胀Poisson模型通过对零计数和非零计数建立混合回归模型,能很好地解决数据中存在的过多零的问题,本文还将ZIP模型扩展到了零膨胀负二项回归模型。本课题针对计数资料过度离散的检验,零膨胀模型构建,基础模型与零膨胀模型的模拟研究,不同模型选择以及实例对比分析等方面展开探讨。其主要结果如下:1.计数资料分析中计数模型有相对经典模型的优势与对计数资料分析误用有序logistic回归或多重线性回归相比,计数模型更加符合计数资料的本质特征。2.过度离散时的模型选择过度离散时,可将Poisson回归作为探索性分析方法,选择负二项回归更合适。3.零膨胀计数模型的BHHH估计在大多数情况下,零膨胀计数模型方差的BHHH估计量比Hessian矩阵简单,但是两个估计量都是渐近等价的,在有限样本中可能给出不同的统计分析结果,本文的第一个实例证实了这一点。4.计数资料模型选择的Vuong检验在非嵌套计数模型选择中Vuong检验有足够高的检验效能,但模拟研究也表明Vuong检验似乎更倾向于复杂的模型。5.ZIM参数的Bootstrap估计ZIM参数的Bootstrap估计结果显示,在实际应用中并不能保证ZIM的极大似然一定收敛于全局最大值处,这可根据Bootstrap估计的结果评价单次ZIM极大似然估计值的稳定性和一致性。(本文来源于《山西医科大学》期刊2009-05-12)
计数回归模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
论文提出了一种利用监控视频对路口车辆进行计数的新的方法。针对路口车辆交通拥堵、遮挡程度高、移动速度缓慢、车行有规律等特征,提出基于回归模型的路口监控视频车辆计数算法。首先对监控视频进行处理,从中提取车流特征。之后,利用SVM对实时道路车辆密度进行辨别,并根据辨别结果,对密度高或低的情况分别应用不同的回归模型进行计数。最后,以实地采集的路口交通视频对该方法进行了验证。实验结果表明,该方法可以在实现较高准确率的基础上,占用较少的计算资源,对路口监控视频的车流进行计数。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
计数回归模型论文参考文献
[1].夏丽丽.一类带约束的零膨胀计数模型的半参数回归分析[D].兰州财经大学.2019
[2].孙耀航,刘萍.基于SVM的回归模型路口车辆计数方法[J].计算机与数字工程.2019
[3].胡良平.过离散计数资料负二项分布模型回归分析[J].四川精神卫生.2018
[4].胡良平.一般计数资料Poisson分布模型回归分析[J].四川精神卫生.2018
[5].赵娜,洪广彬.多项分布内生回归元计数模型的两阶段估计方法研究[J].统计与信息论坛.2018
[6].袁海静.稳健回归模型的非迭代抽样算法与计数时间序列模型的统计推断[D].山东大学.2018
[7].刘振球,严琼,左佳鹭,方绮雯,张铁军.零膨胀计数数据回归模型的选择与比较及R语言的实现[J].中国卫生统计.2018
[8].张晓琳.基于零膨胀计数数据回归模型的贝叶斯分析[D].昆明理工大学.2015
[9].曾平.零过多计数资料回归模型及其医学应用[D].山西医科大学.2009
标签:带约束的零膨胀计数模型; 部分线性可加; 半参数回归; 大样本性质;