最近仔细看了由中国自动化学会编制的《发电厂热工故障分析处理与预控措施 第四辑》,主要分析了2019年火电机组155起涉及国内各主要发电集团的热控相关故障典型案例。抛开这155起案例不谈,在我们的火电机组,由热工专业造成的机组非停占比还是非常大的。这里面的原因有很多,在此之前的很多文章中我都做了总结分析,无外乎设备和人为两大方面。
关于设备原因,如果没有人为因素的情况下,我们一般不会划分为责任性事件或事故。设备原因一般由两方面造成,一个方面是设备本身存在涉及缺陷、老化、故障等问题,另一方面是人为因素引起设备误动或者拒动,一般这种情况我们在分析人的原因时候,也会在设备上增加防范措施。
设备本身的缺陷,我们可以从几个方面进行分析。热控专业的设备无外乎测量仪表、电动执行机构以及远程控制系统(DCS、DEH、PLC等)。一般情况下,测量仪表是热控专业日常消缺和维护的重点,但不是难点。尤其是在一些恶劣环境中的测量仪表,故障率往往很高。比如一次风流量计,由于测量的介质是风粉,流量计堵塞就成了家常便饭。目前国内很多机组在该类流量计增加了自动吹扫装置,通过压缩空气对设备进行疏通。即便如此,流量计堵塞也还是时有发生,根本原因是测量的介质造成的,与设备本身的质量关系不大。因此,针对这一情况,增加吹堵装置只是弥补措施,但是并不能完全避免问题的发生。
有一些问题是设备质量造成的,比如一些电动执行机构阀杆频繁脱落,模拟量的调节门调节不灵敏、经常卡涩等问题。当然有人会说,这一情况也有可能是投用前阀门调试有问题。的确,热控专业的很多问题往往不是单方面原因造成的,就像流量计堵塞的问题,有一些厂商的产品会考虑这类故障,在产品上进行优化和技改,有一些厂商则不会考虑这些问题。因此,在分析问题的时候,就要从多个角度出发,不能单纯的只摁着一个方面改进,而忽视了其它因素。
一般情况下,电动执行机构阀杆脱落的情况比较少见,但是对于一些行程比较大、操作比较频繁的执行机构,故障时有发生。再加上一个超临界的机组,各种开关量、模拟量的电动执行机构可能多达上百个,哪怕每年1%的故障率,都会造成很大的麻烦。因此,即便单个产品的故障率很低,在全厂统筹考虑的话,故障的次数就会增加。
这一点尤其是在DCS系统中体现的比较明显,而且往往被诟病的比较多。作为全厂控制的大脑,DCS系统要求稳定、安全、精确、灵敏,我总结了三个字就是“稳、准、狠”。目前我们的大机组基本实现了主辅一体化,也就是说现场所有的测点都基本接入到了DCS系统中,对于一台2*660MW的机组,所有的实点可能就3~5万个。对于如此规模的系统,每天1%的系统故障率,都会一场灾难。尤其是对于一些参与了保护和联锁的测点,出现问题后往往会造成问题扩大化。
而对于DCS系统,不仅仅是维护测点这么简单,本身这套系统就是一个组合体,其本身也存在自己的不稳定性。我在之前的文章中跟大家讨论DCS系统的学习方法的时候,就对DCS系统的架构进行过分析。包含三个方面:电源、网络和软件硬件。大家日常在学习DCS系统的时候,更多的去了解软件的组态方式,而忽略了其它方面,当然软件的组态是DCS系统中最高大上也是最难的部分。但是,在日常维护过程中,对于一台运行了三年以上的成熟机组,维护的重点往往在电源、网络和硬件方面。
一般情况下,电源不会出现问题,正常设计两套电源系统,具体到每一套盘柜,无论是工作电源还是查询电源,也都是两路供电,只是不同的DCS系统供电的模式有区别而已。从整体上看,我们一般通过UPS电源和厂用电同时给DCS系统供电,UPS电源作为工作电源,厂用电作为备用电源。有一些系统为了更安全起见,UPS电源也是切换后电源,通常由UPS电源和另一段的厂用电切换后提供。而大部分的DCS系统,工作电源模块、查询电源模块也都是冗余配置,即便同一个电源模块,甚至也可以接收两路电源供电。总之,电源的冗余在DCS系统设计中基本上做到了全覆盖,故障的几率几乎降到了最低。
但是还是会出现电源故障的情况,这里面就需要注意一个问题,电源冗余不等于电源正常。考量电源正常的一个重要的因素是电源切换过程中能否对DCS系统不产生干扰,也就是所谓的无扰切换。在过去几年里,我几乎每年都会遇到电源切换过程中,DCS系统失电的情况。DCS系统失电又分为多种情况,有的是个别模块瞬间失电,造成DCS系统采集到的信号出现瞬间消失的情况。严重的会导致整个盘柜失电,所有信号瞬间消失又恢复。我还遇到个别盘柜主控单元初始化的情况,主要是主控单元掉电保护开关未设置,造成失电后数据清空。
上述三种情况,无论哪一种都可能导致设备故障甚至非停。当然电源故障还会引起一些小的问题,比如个别操作员站失电等,但是基本不会影响机组的正常运行。电源的安全稳定与否,与厂商的产品质量、安装调试阶段的按图施工、电源架构的设计等等都有关系,但是上述原因在生产阶段基本上无法改变了,因此后期的维护就变得异常重要。
关于电源系统,在日常维护过程中,主要做两方面的工作。第一是日常巡检要定期核对电源模块的指示灯是否正常,有一些事故其实都是有征兆的,电源的冗余配置,一般不会造成系统的完全失电,出现完全失电往往是对最早出现的故障没有发现。这是一个责任心的问题,巡检的质量是影响设备安全运行的重要因素。第二是在设备检修期间对电源系统做切换试验以及电源电压测量。如果设备已经存在问题,通过试验和检查一般会暴露出来,这也是我们最低限度的一个工作。当然很多公司要求会更严格一些,还会对电源接地等进行检查,这些也都是很好的保障工作。
关于网络系统的维护,相对电源就比较简单,主要还是进行网络的切换试验。这里面需要注意的一个问题是,对于一些远程柜,尽量避免用网线作为数据传输的手段,网线长度在大于100米之后,往往会出现丢包的情况,造成系统的不稳定。这一点,我在大机组没有遇到过,但是在一些小机组,我确实遇到了远程柜直接用网线连接的情况。此外,对于DCS系统,避免使用无线传输的手段。虽然5G技术很先进,但是对于当前的电厂系统,不建议采用无线传输的模式。在某宝上我看到一些变送器可以使用无线信号,一些DCS系统也有这样的通讯模块,但是不建议使用。
关于DCS系统硬件,我这里主要说的是CPU、IO模块等。一般CPU是冗余配置,目前我用过的DCS系统中,无论是国产还是进口,很少有只配置一块CPU的情况。但是,个别PLC系统会这样设计,是不可取的。对于CPU的维护,主要是做好日常的巡检,说白了就是注意状态指示灯是否正常,其它能做的工作真的有限。一些低级的问题,比如一些掉电开关等的设置,这是DCS系统最基本的工作。在检修阶段,CPU的冗余切换试验必须要做,一些模块的通道测试也要做,尤其是参与保护的重要模块通道。
这里需要补充一点,DCS系统的整体架构是在设计阶段完成的,设计的合理与否将直接影响后期使用的安全状况。在设计阶段,我们要把握几个原则。第一是分散原则,相同的设备要分配到不同的盘柜中,同一设备的相同的测点要分配到不同的模块中。举个例子,比如某机组有六台磨煤机,也就是有六套制粉系统,那么这六套制粉系统的设备要分配到六个控制站,不要出现在同一控制站的可能,避免一个控制站故障造成多套制粉系统故障的问题。此外,设备的相同测点,比如#1磨煤机的六个轴承温度测点,尽量分配到三个以上的温度模块,避免一个模块故障造成所有测点故障的情况。
其次是冗余原则,这里包含两个方面。第一是设备的测点设计尽量冗余,不要出现单点测量的情况,第二是模块尽量留出15%以上的备用点。单点测量在热工保护系统中是大忌,一般成熟的设备厂商对于大型的转动设备,对于同一类型的测点,比如轴承温度、振动等,都会避免单点测量的情况。但是,总是有例外,这几年一些引进的机组,尤其是小机组,包括汽轮机在内,我都遇到了单点测量的情况,这是不可取的。关于模块备用点的问题,相关规程也有规定,主要是为以后的维护和技改留出空间,当然也是尽量减少单个模块的负荷,延长使用寿命。
整体上看,无论是现场的测量仪表、执行机构,还是DCS系统的网络、电源和硬件,都存在一定的安全隐患,故障的几率也要比机务专业的设备高,同时维护更为复杂。但是,一般情况下,并不是所有的热控专业设备故障都会引起设备的异动。在日常的工作中,首先要对重要测点(参与保护和联锁的测点)加强巡检,检修阶段做好设备的检查和试验。如果一旦出现异常,首先要做好异常原因的分析,在精确判断故障之后,再去处理故障。热控专业故障的处理,重要的是原因分析,处理过程中要防止事故的扩大化。
作者:猫 不捉老鼠
共有访客发表了评论
网友评论