一种基于自适应阈值的色谱识别算法实现

一种基于自适应阈值的色谱识别算法实现

(国电南瑞科技股份有限公司江苏南京211106)

摘要:针对变电站变压器油中气相色谱识别的要求,设计一套自适应阈值色谱识别的算法。传统的一阶导数法只用斜率阈值来实现色谱峰识别,因此自动化程度低及容易失真。针对这些缺点,本文在一阶导数法的基础上进行了改进,在数据预处理和峰值识别算法的基础上,加入确定合适阈值,结合谱峰曲线以及标准气体的特性对谱峰进行识别。由于算法的阈值参数可以固定,从而保证了重叠峰检测较少地受到人为的影响,进一步提高了色谱识别的准确性。

关键词:色谱峰识别;阈值参数;重叠峰检测

1引言

变压器作为电力系统的关键性设备,其可靠性是电网安全运行的关键所在,而在线色谱技术是实时监测变压器状态的有效手段[1][2]。因现场环境很恶劣,温度、湿度等变化较大,对于色谱在线监测装置要求抗干扰性要强,并且算法兼容性好,在没有人工参与的基础下自动、准确地完成这些工作。目前运用较多的油色谱峰识别算法有时间窗法[3][4]、曲线拟合法[5]、模式匹配法[6][7]、导数法等。常规的这些算法在峰值识别过程中存在以下不足:即色谱峰起点和终点数组的最少个数由采样频率决定,然而色谱峰的峰形会随着时间的增长而发生改变,因此根据采样频率快慢决定色谱峰的起点和终点数组最小个数具有不确定性,容易引入假峰。本文基于文[8],结合电力变压器油中溶解气体色谱的特点,通过将最大半峰宽作为滑动窗口宽度设定的基准,并且在峰值识别过程中加入适当的阈值,更好的去除杂峰以及对重叠峰的检测准确性大幅提高。

2、自适应阈值的谱峰识别算法

2.1平滑处理

从色谱仪检测器输出的模拟信号经模数转换器转换为数字信号,数字信号经过接口电路输入到计算机。这些信号常伴有高频噪声,因此在谱峰检测前,需要对输入信号进行滤波处理。本文算法采用去极值求平均滤波和逐点求斜率对采集到的色谱数据进行滤噪。

首先对原始数据进行移动窗口平均值进行滤波,接着并对滤波后的数据进行逐点求斜率,然后重复上述步骤,再对求斜率后的数据进行滤波,并再次对滤波后的数据进行逐点求斜率。经过两次滤波以及两次求斜率之后,得到相对平滑的信号曲线。

具体实现步骤为,去极值求平均滤波是把连续M个采样点平均分成N个等份,对每个等份进行去极值求平均滤波,每次取滤波窗口大小K*2的数据,然后进行冒泡排序,去掉J个极值,最后求平均得出新的数据。

逐点求斜率则是把连续M个采样点平均分成N个等份,然后在每个等份中分别进行逐点相减,即将后一点的值减去前一个点的值,将相减后的数据重新整理得出新数据。

2.2找峰

找峰分为两个部分,第一步找出所有峰值,第二步去掉不符合定值所规定条件的峰。

首先对平滑处理后的数据进行操作,设定最小峰斜率值为MinPeakSlope,并且将所有数据分为m个窗口,每个窗口内包含数据n个数据,当窗口内数据满足0<MinPeakSlope<h1<h2⋯<hn时,判断此时h1为峰的起点,继续移动窗口,当窗口内数据满足h1<⋯<hm-1<hm>hm+1>⋯>hk,且hk<hk-1⋯<hm+1<(-0.1),此时到达顶点时,hm为峰的顶点,继续移动窗口,当窗口内数据满足h1<h2⋯<hn<(0-MinPeakSlope)<hn+1时,判断此时hn+1为峰的终点。

找出所有峰值后进行去杂峰操作,设定最小峰高MinHeight,最小峰面积MinArea,最小半峰宽fMinHalfWidth,计算所有峰的峰识别参数,即峰高、峰面积、保留时间、半峰宽,将这些峰识别参数与设定好的定值进行比较,只有同时满足这三个条件的才是所需的峰。

2.3调整峰的起点、终点

找出所需的峰后,对其起点和终点进行调整,具体实施为分别将起点和终点与窗口里的数据进行对比,通过设定条件的判定,将起点和终点的位置进行适当的调整。

2.4处理连峰

针对出峰当中含有连峰的情况,设定最小基线斜率MinBaseSlop和最大峰间隔MaxPeakInterval,计算识别出来峰的斜率以及峰宽,当斜率小于MinBaseSlop或者峰间隔大于MaxPeakInterval时,则判断为连峰,此时第二个峰的起点修正为前一个峰的终点,并且第二个峰的起点和终点均基于实际基线而得,然后计算出连峰的峰高,保留时间以及峰面积。

2.5定性和定量

将标气浓度作为参考对象,对识别的峰值进行定量和定性的分析,定性过程为:首先将所有峰值从小到大排列起来,接着设定最大保留时间误差百分比MaxTimeDiff,将识别出来峰的保留时间与标气浓度出峰时间进行对比,误差小于最大保留时间误差百分比MaxTimeDiff,则此峰属于这个浓度值内,从而将7种气体依次识别出来;定量过程为:每个峰值对应的浓度值计算方法为,将识别峰值与标气峰值相比后乘以标气浓度值,即可得各个识别峰的浓度值。

3、程序的实现

3.1阈值的确定

根据多次试验结果得出,所需的阈值设定如下表所示:

3.2谱图显示及算法效果

根据以上算法以及设定的阈值,可以准确的识别变压器油中溶解的七种气体,谱图显示如下,可以看出谱图当中基线很平稳,谱峰的曲线噪声很少,对于峰高和峰面积均可以很好的计算出来,另外对于CO这个重叠峰也可以很好的检测出来,并且针对重叠峰,将起点的基

准值重新定义,保证了识别的准确性。

4结语

本文提出了基于阈值的变压器色谱识别算法,该算法在传统斜率阈值方法基础上,在峰值识别过程加入合理的阈值,结合了色谱峰的绝对保留时间和识峰窗口对疑似色谱峰加以识别,大大降低了引入假峰的概率,提高了重叠峰检测准确性,实验研究结果表明:该算法识别准确性很好,具有一定的自适应性能,能够满足现场在线监测装置的要求。

参考文献

[1]邹思轶,童晓阳,佟来生,等。电力系统自动化,2003,27(25):61。

[2]李红雷,周方洁,谈克雄,等。电力系统自动化,2005,29(18):62。

作者简介:

王高明(1986-),男,江苏南京人,工程师,从事在线监测装置以及变电站测控装置的研发工作。

标签:;  ;  ;  

一种基于自适应阈值的色谱识别算法实现
下载Doc文档

猜你喜欢