Hana AM DCS报警管理系统

1 概述

1.1 报警管理

DCS实时监控报警是对生产工况发生异常时对操作工进行第一时间提醒的重要工具,但有时报警太多会有碍操作人员正常操作,太少又不利于及时发现生产问题,操作人员在短时间只能关注和处理的一定数量的报警,还有许多不容忽视的缺陷值得我们重视。这些的缺陷非但无法协助操作人员,反而可 能成为一种滋扰。应用先进的DCS报警管理技术能够有效的剔除不必要的干扰,让操作人员能够更好的处理装置操作中产生的问题,有效提高装置的稳定性和安全性。报警处理课题一直是近年关注的焦点,世界上发生的多种工业事故与报警管理不当有关,正常操作过程中报警设施繁多、装置发生扰动时又到处充斥报警,这往往与现代集散控制系统有关,而且会给操作人员造成压力,导致不必要的生产损失,并降低装置安全性。

报警管理系统是一套用于建立完整报警系统的商业软件与解决方案。报警管理系统软件的设计和解决方案的实施符合EEMUA 191与ISA-18.2国际标准,可以建立一套有效的报警管理系统,带来如下好处:

  • 提高操作员对异常状况的响应效率和能力,从而提升工厂的安全性;
  • 减少异常状况发生的次数和波动的程度,从而减少非计划停车次数,减少生产损失;
  • 形成一套不断提高管理机制,确保以上两个好处可以被保持和提升。

1.2 报警管理软件

报警管理软件平台是本解决方案的核心软件产品,可用于对全厂或多装置区范围内的报警数据进行在线分析、监视和评估,并帮助用户作出报警系统的维护决策。报警管理软件平台可应用于各类品牌的DCS/ESD系统。

报警管理主要为操作人员、工程人员、技术人员和管理人员提供实时报警数据的监视、分析和展示,实现减少报警数量、消除反复的扰人报警、提供报警统计分析报告等功能。

报警管理软件平台具备如下功能特点:

1)   集成所有控制系统,建立全厂统一的报警管理平台

2)   从各类控制系统实时采集、存储报警及相关事件数据

3)   报警系统性能动态自动监视、分析,集成报警信息,提供完整的事件分析视图

4)   实时进行报警监视与管理,可横跨全装置、全厂或者整个集团公司,使各类用户均可以清楚地了解工厂的当前报警系统性能状况

5)   自动生成基于Web报警管理报告

6)   报警系统强制执行

7)   报警事件电子交接

8)   建立报警处理知识库,并用于培训

报警管理软件平台可以自动地完成下列任务:

1)   采集并存储报警和事件数据

2)   通过分析这些数据来评估工厂报警工作效率并标识问题

3)   与行业标准进行比较并给出结论

报警管理系统通过日常使用,可以检查工厂在报警方面是否符合安全标准,是否存在着偏差或有需要改进的地方。它提供对报警的标识和过滤不相关的报警,使操作人员关注那些涉及安全或有经济损失的报警。

2 关键技术

2.1 数据采集多样性技术

报警管理系统需要从DCS中获取报警数据,如何从不同类型的DCS中获取文本格式的数据是数据采集方面的一个难题。在报警管理系统中,对于不同类型的DCS,根据现场条件的不同有不同的数据采集方案可使用。可以使用TCP/IP协议以文本形式导出数据,也可以使用OPC/AE协议通过OPC接口采集数据

2.2 数据完整性技术

由于企业应用现场的环境比较复杂,一般来说,采集接口机与DCS报警服务器不在一起,需要跨接工控网与管理网联接。网络的可靠性会直接影响到DCS报警信息采集的完整性。当网络中断时,采集系统会临时存储信息在本地机器上,网络恢复故障后会及时把保存的信息完整的存入DCS报警数据库

2.3 DCS信息采集负载均衡技术

DCS报警信息一般是文本信息,大型企业一天的报警信息量在20~30万条,系统如何同时采集、分析、解析、存储这些信息,对采集接口模块及解析存储模块是一个严重的挑战。采用WEBSOCKET的新型方式可以实现负载均衡,使得采集及存储功能比较可靠的运行。

3 功能模块及流程图

3.1整体功能模块图

报警管理系统功能主要包含:报警数据采集、报警数据分类、报警数据归档、实时浏览和在线分析。

3.2系统流程图

4 详细模块介绍

4.1 采集归档模块

报警管理系统由以下功能模块组成:

1)    规则建造器,该模块可以生成一系列信息结构规则,Manager报警管理系统通过这些规则可以完成:

信息的部分内容,并通过这些内容可以标识所接收信息的类型;

信息包含的一些重要属性,如报警类型、事件、以及数值等;

2)    A&E采集器,该模块是信息进入报警管理系统的一个节点。来自某数据源的报警和事件信息可以通过OPC连接(也可以通过TCP/IP、串行通信、ODBC或文本文件)进入一个或多个A&E采集器,报警管理系统还可以读取静态的文本文件,这种方式便于系统测试。

3)    A&E归档器,该模块通过TCP/IP接收来自A&E采集器的原始数据,然后根据规则建造器定义的规则文件来标识信息类型及其下属内容,该模块同时将这些内容传递并存入报警管理数据库中。A&E采集器和A&E归档器按系统后台服务进程方式工作,以确保数据是一直被收集着,即使当用户已经退出或系统重新启动后。

4.2 数据分析模块

在数据采集归档后,报警管理系统通过网站部署的方式,调用数据库的内容,以不同报表的形式提供数据分析功能。

4.2.1 系统界面概览

打开浏览器,在地址栏输入部署的网址进入报警管理系统登陆界面,如下图所示:

输入用户名和密码,登陆系统后,如右图所示:

4.2.2 平台管理功能

如果所登陆账号具有系统的管理员权限,则单击右上角的“平台管理”后,界面左侧的功能报表界面将切换为系统的设置选项,如右图所示:

系统设置包括部门资料管理、事件日志管理与应用权限中心等。

4.2.3 主要报表功能

报警管理系统通过生成不同类型的报警管理相关的报表,辅助用户对当前装置的报警状况做出了解与判断。目前系统包含的报表类型显示如图:

统计类报表能够根据用户的需求,生成以不同的指标与要求下的指标统计信息,供用户了解装置的详细运行情况;

分析类报表能够根据用户需求,生成一段时间内装置的运行情况分析,为用户的改进工作提供直接的分析与指导;

性能类报表通过计算得到装置的EEMUA各项主要指标,列出装置当前各项指标的情况,提供装置整体的报警表现评级与主要指标变化趋势。

系统的主页默认会显示当前一月内各装置几项主要指标的分布情况与每个装置的整体表现评级,可通过单击时间范围来查看不同时间的主要指标情况:

单击打开任意一个报表,在主窗口中,除“报表选项”外,还有一个“过滤器”选项卡处于“报表选项”选项卡的右侧,如右图所示:

点击后显示如左图界面:

该处可根据用户自定义对不同字段进行筛选来过滤某些结果。

报警计数统计报表

报警计数统计报表统计给定时间段内某个装置的报警数量,为用户提供该装置(或班组)在一段时间内报警运行的概览。

报警分布统计报表

报警分布统计报表通过统计给定时间段内某个装置的报警按照给定参数的分布,最常见的如计算高/中/低三个级别报警所占的比例。

震颤报警统计报表

震颤报警统计报表为指定时间段内同一报警位号在设置的短时间范围内(默认为60秒)反复报警的统计报表,显示同一报警位号在指定时间段内震颤报警数量(Chatter Occurrences)及其占此报警位号总报警量(Total Occurrences)的百分比。

干预计数统计报表

干预计数统计报表统计给定时间段内某个装置的干预数量,为用户提供该装置在一段时间内操作工操作的概览。

持续报警统计报表

统计在用户给定的时刻或时段,还没有恢复正常的报警。

频繁报警统计报表:

频繁报警统计报表为指定时间段内所有报警中最频繁的报警列表,使用此报表可快速浏览或查找报警最多的报警位号和报警量。

频繁干预统计报表

最频繁干预统计报表为指定时间段内所有干预中最频繁的干预列表,使用此报表可快速浏览或查找干预最多的位号和干预量。

报警事件明细报表

报警及事件明细报表显示的是指定时间段内选定的装置或区域发生的所有报警及事件明细列表。

报警泛滥分析报表

报警泛滥分析报表提供在给定的时间段内报警大量出现的时间段与数量等详细信息。

报警因果分析报表

报警因果分析报表提供在给定的时间段内不同报警之间是否存在统计学上的因果关系,结合工艺知识可以对报警系统的状态做出进一步的了解。

报警性能概览报表

报警性能概览表用于供用户快速查询每日、每周、每月、每班等的报警性能指标数据。

报警性能散点图

报警性能散点图为按照装置或区域划分,显示指定时间范围内选择的区域报警性能点状分布。根据高峰报警速率、平均报警速率与不良比例对报警系统的运行性能进行评级。

报警性能汇总表

报警系统性能汇总表显示按照装置或区域划分,在指定时间范围内选择的区域在每一个时间间隔内报警系统性能评级图。

报警性能趋势图

报警系统性能趋势图为按照装置或区域划分,显示指定时间范围内选择的区域报警系统性能API各指标数据变化趋势。

评估报告;

分装置按日、月定时生成报警性能评估报告。

5 系统特点

  • 采集DCS完整数据信息;
  • 分类清晰,归档数据时间永久;
  • 提供信息在不同网段的实时在线浏览;
  • 提供强大的报警数据分析功能;
  • 能够有效地辅助报警系统改进;

6 运行环境

6.1 软硬件要求

报警管理系统所需的硬件设备主要包括系统服务器(数量视系统负荷而定)、数采机(数量视需采集的装置数而定)和PC机(客户端网页浏览)。实施报警管理系统的上位机软硬件系统配置如下:

序号 名称 描述
1 系统服务器 操作系统:Win2008 Server R2 CPU:至少2.4 GHz 内存:至少32GB 硬盘:至少1000GB
2 数据采集服务器 (数采机) 操作系统:Win2008 Server SP2 CPU:至少2.4 GHz 内存:至少4GB 硬盘:至少1000GB
3 客户端 操作系统:Windows 7 CPU:至少2.4 GHz 内存:4GB 硬盘:至少500 GB
4 防火墙 根据用户现场环境决定

7 使用报警管理系统辅助报警系统性能提升

在报警管理系统上线以后,可以在系统的辅助下,有效地进行装置的报警管理与报警性能提升工作。

7.1 辅助装置报警系统性能评估

通过报警管理系统对装置的报警系统性能可以做出一个完整的评估,同时对基准进行分析为下一步进一步的合理化给出明确的改进措施。在这个阶段,所有的问题都将被量化,并把问题的严重性清楚地展示出来。

在这个阶段可以分析多种状况和得出现状,有三个方面的分析是基本的,必须首先进行。

第一系统会根据采集的报警数据比对EEMUA的基准自动给出该装置的报警系统整体所处的状态,如下图所示为某LNG接收终端报警系统整体处在Level3 Stable。横轴表示每个操作岗位每小时发生最大的报警数量,纵轴表示表示每个操作岗位每小时平均发生的报警数量。

那么结合EEMUA和装置的实际状况可以制定符合实际可以达到的目标。

例如该LNG将目标定为Level4 Robust,具体KPI指标为:

  • 典型KPI指数1:平均每小时的报警数量不超过60个
  • 典型KPI指数2:每小时报警的数量最大不超过600个

第二可以分析的是对报警优先级分布和报警分布频率的分析。

第三个必须做的分析是引发报警次数最多的报警点的分析。

系统可以给出前20个位号引发报警次数最多的列表,只要将前几个报警点处理好,整体报警数量明显地降低,很容易产生效果。

7.2 辅助装置报警系统性能改进

报警系统改进是报警管理项目的核心内容。它能显著地减少报警点数量,还可以保证选择的报警是合理的,它的直接效果就是报警的发生减少了,操作工的劳动强度降低了,可以有限的精力集中到更重要的报警和过程变化中。

报警合理化工作一般是通过项目组研讨会首先确认原因,然后制定改进措施,落实到部门实施。例如下表准对分析报告列出的问题给出的解决方案建议:

问题类型 问题描述 解决方案建议
最频繁发生的报警 当前系统中发生最频繁的20个报警。在实施报警优化措施之前,少数报警点引起了相当多数量的报警。 跟踪这20 个报警,去检查它们的产生原因是过程噪声,工艺符合扰动还是其他报警影响所致。
反复发生报警 当前系统中反复发生次数最多的20 个报警。(设定10 秒内发生多于1 次即为重复发生) 对于模拟量报警适度报警死区,或者调整变送器的灵敏度; 对于开关量报警,增加报警延迟时间或者增加一些工况判断逻辑。
可预测报警 用以判定多个报警间的因果关系, 发现完全重复的报警定义 根据报警的因果关系压缩报警数量,可以取消重复的报警。
持续发生报警 表明是否存在长时间(可以设定为24 小时)无操作工处理的报警 根据报警性质,确定是否调整报警级别甚至取消报警
不同操作模式下的报警要求不同(包括是否需要报警,报警级别, 报警设定值的区别) 有些报警只有在特定的操作模式下,对操作工才有意义;不同的操作模式下的报警设定值不一样 软件组态中增加相应的逻辑判断条件,根据模式决定是否需要报警,更改报警级别, 修改报警设定值
滋扰报警 由于备用设备没有物料暂时产生很多没用的报警,例如流量和液位低低报等。 可以采用PKS系统提供的报警搁置功能,由操作员或设置触发信号暂时搁置报警,等设备投用后再自动恢复报警或操作员手动恢复。

通过用户培训,用户可以比较好地使用报警管理分析工具,找到需要改进的地方,把它付诸于行动。并在采取改进措施之后,准确地查看改进的效果。

报警系统改进是一个持续的循环过程,每一轮的改进都能够发现并优化当前报警系统中存在的问题,从而不断提高报警系统性能,保证装置的稳定。

7.3 辅助装置日常报警监控与维护

对于现场人员,报警管理系统可以有效地辅助装置的日常生产:

每天:

检查首5个报警(晨会)

检查持续报警

检查被屏蔽/无效化的报警

每周:检查重复报警和错误响应报警

检查最频繁的报警

检查操作工的操作

每月:

比较装置的表现与目标

更细致的分析

每年:

操作工/工艺人员培训

最差区域的分析

文件检查归档(报警策略与报警变更)

对于管理人员,报警管理系统的架构允许管理人员在连接至内网的计算机上随时查看某个装置或区域的当前报警信息、历史报警信息、整体评级表现和操作工干预等等信息。从而实现管理与生产的垂直监控,有利于管理人员了解现场的信息。

8 项目业绩

汉中诺公司于2014-2015年在某国有大型石化企业实施报警管理系统项目,实施范围包括6套装置(炼油部催化裂化装置、炼油部渣油加氢装置、芳烃部2#重整与抽提装置、芳烃部2#歧化异构化装置、2#乙烯新区装置、2#乙烯老区装置),实际完成了12套装置,其余六套分别是(炼油部025(S-Zorb装置)、024(2#气分装置)、039(双脱装置)、030(循环水系统)、027(4#硫磺回收装置)、026(C2回收装置)。在项目实施完成后,装置人员根据每月的评估报告,对装置报警系统中存在的问题进行针对性改进,取得了良好的效果,总体评级与主要指标均有大幅度提升。

以2#乙烯装置老区为例,该装置2015年6月-2016年5月报警系统性能总体评级趋势图如右图:

注:报警系统性能评级分为五个等级,性能从低到高依次为第一等级(Overloaded)、第二等级(Reactive)、第三等级(Stable)、第四等级(Robust)、第五等级(Predictive)

经过报警系统性能评估与合理化改进后,2#乙烯装置老区报警系统性能总体评级由第二等级(Reactive)提升至第四等级(Robust)。可见报警管理系统投用后,借助系统的分析功能,装置对系统报警性能的改进收到了明显的效果。

除总体评级外,报警管理国际指标EEMUA中还以平均报警数、峰值报警数与扰动比例三个指标作为考核报警系统的性能指标KPI。经过多轮报警系统性能评估与合理化改进后,2#乙烯装置老区以上三项主要KPI指标改进效果如下表所示:

主要KPI指标 初次评估值 2015年5月 第十三轮评估值 2016年5月 改进幅度%
高峰报警数(每十分钟*每个内操) 108 11.38 89.46
平均报警数(每十分钟*每个内操) 12.5 0.881 92.95
扰动比例% 48.6 3.605 92.58

2#乙烯装置老区在每一轮评估时的主要KPI变化如下图:

                                     2#乙烯装置老区每轮评估平均报警数变化趋势

       2#乙烯装置老区每轮评估峰值报警数变化趋势

2#乙烯装置老区每轮评估扰动比例变化趋势

由以上图表可见,在多轮的评估和改进后,2#乙烯装置老区的三个主要评估指标均大幅度下降,性能改进幅度超过90%。这反映出经改进提升后的装置报警性能相比改进前有很大提升,装置的操作工能够更高效地处理生产过程中产生的报警信息,了解装置运行情况,对装置的稳定安全生产有极大的好处。

鉴于报警管理项目取得的效果,该公司决定继续由汉中诺公司在本公司内的炼油部、烯烃部和化工部下属共计6套装置上实施报警管理项目二期,优化装置的报警系统性能,提升全厂的报警管理水平。同时针对项目一期的报警管理系统平台,进行系统平台性能提升项目,由汉中诺公司对报警管理系统平台进行进一步的功能开发与性能优化。