吳長河
(鞍鋼股份皺魚圈鋼鐵分公司設備煉鋼部 營口 115007)
【摘要】轉爐二級系統為轉爐煉鋼的重要過程控制系統,負責模型計算、與一級和與三級的通信控制。該文論述了轉爐二級系統存在的主要問題及對這些問題的優化過程。
【關鍵詞】轉爐二級;系統優化;系統資源
1 轉爐二級系統簡介
轉爐二級系統軟件部分為德國kuttner公司開發的OTCBM應用程序,硬件部分服務器主機采用的是美國容錯雙機熱備。主要分為三部分,第一部分采用IBM公司的MQ中間件與三級通信,接收三級的生產計劃、鋼水鐵水成分等重要生產數據。同時將生產實際數據以電文的方式傳遞給三級。第二部分是二級系統的OTCBM應用程序,通過在二級畫面進行操作,給一級發送指令進行過程自動化控制。第三部分是與一級通信,采用的是si-mens 的simatic net軟件配置與一級PLC的通信,實現自動化控制與一級生產實際數據的采集工作。
2存在的主要問題
(1)系統資源不釋放,資源占用率居高不下問題。轉爐二級服務器運行7天就會發生無法自動上傳數據或者丟失部分數據的現象,多次聯系外方專家調試都無法查明原因,只能在運行第6天進行重啟以保證生產的正常進行。在轉爐服務器重啟的過程中,3個轉爐都需要進行手動生產,操作工手動補錄數據,影響生產節奏和生產數據統計的準確性。同時由于手動生產,二級系統會認為轉爐處于停機狀態,會將停機信號上傳給三級,三級收到停機信號后宜接上傳給四級ERP系統 而操作工又將當前爐次的生產數據手動通過三級界面錄入上傳ERP,因而在分公司總調度室的ERP生產實際統計圖中會岀現當前爐次即為生產狀態又為停機狀態的矛盾現象,影響分公司對生產實際的統計。
(2)轉爐二級系統終端機原設計為遠程連接操作服務器模式,導致服務器資源使用率過高,服務器卡頓現象,數據傳輸延時,終端機操作反應慢等現象時有發生。
轉爐二級終端機原設計為HP瘦客戶機,該機器無硬盤、無風扇、自帶XP超級精簡版系統,僅僅可以進行遠程連接操作。原二級系統設計為10臺終端機同時對服務器進行遠程連接,10個不同的賬戶同時對服務器進行操作,后因為實際生產需要,海邊廢鋼和鐵水倒罐不使用二級系統,且機房二級終端機和自動化煉鋼二級終端機不是經常在線,造成6臺終端機經常在線操作服務器,2臺終端機偶爾在線操作服務器,峰值會有8個賬戶同時操作二級服務器,隨著遠程連接用戶在線時間的增長,資源的占用率越來越大,最后導致只能將二級服務器重啟釋放資源。
(3)與三級系統通信存在設計缺陷,導致一定時間后二三級通信故障。
缺陷一:二級系統無法正常接收三級系統下發的作業計劃,生產無法繼續進行。外方在設計之初是想將二、三級通信電文產生的報告信息放在WR.QM管理器的WR.R隊列中,但是經過MQ命令查詢,外方根本就沒有建立WR.QM管理器,所以導致此報告信息(report message)被放到了 MQ自帶的死信隊列(dead-letter queue)里。當達到一定時間后,死信隊列中的信息會以10 000條為一次被加載到與三級通信的MQ管理器(BYQKT. QM)的隊列中。具體缺陷如圖1所示。
缺陷二:二、三級通信徹底中斷,計劃無法下達,數據無法采集。
MQ自帶的死信隊列(dead-letter queue)里面的信息是不斷的往里面存儲,卻從來不刪除,當死信隊列(dead-letter queue)中的數據量過大(超過幾十萬條),會導致MQ管理器(BYQKT.QM)的接收通道一直處于讀取死信隊列中報告信息(report message)的狀態,系統資源使用率居高不下,最后資源耗盡,與三級通信的MQ管理器(BYQKT.QM) 會自動停止,導致與三級通信徹底中斷。
缺陷三:無法查詢2天前的MQ運行情況。通常MQ的日志不需要設置備份,但是轉爐二級系統二、三級通信因為前面兩個缺陷導致MQ日志中包含了大量的無用重復信息,最多保存2天的 信息。
3優化過程
3.1 對服務器進行優化
(1) 服務器原有硬盤分區不合理,系統盤所占空間非常小,使用率過高。在保證原有分區數據不受影響的情況下,對硬盤的分區大小進行修改, 增加系統盤所占用的空間,增加數據讀寫操作所需空間,減少頁面訪問錯誤的發生,保證系統運行穩定。
(2)對服務器數據庫內存占用上限屬性重新設置,原服務器數據庫內存占用上限為512MB,無法滿足數據庫對內存運行空間的需求,現將其調整為1GB,運行中觀察正常的峰值大概需要820MB左右的空間。
(3) 對服務器的數據庫超時連接屬性進行重新設置,服務器運行一段時間后總會報一個數據庫連接超時的錯誤,影響二級正常運行,將數據庫連接超時屬性設置為連接超時無限制后此問題再沒有出現。如圖2所示,將600改為0即為無限制。
經過上述設置的調整,轉爐二級服務器運行時間可以延長到42天左右。在這42天內,找到一個特定的時間段“其中一個轉爐定修,一個轉爐補爐”,等待正在生產的轉爐出鋼結束后將二級服務器重啟,只有這個特定的時間段(8分鐘左右 內進行重啟操作,才能保證生產數據不丟失,保證分公司總調度室的ERP生產實際統計圖中不會出現當前爐次即為生產狀態又為停機狀態的矛盾現象。
3.2用普通計算機代替二次終端機
經過長時間對外方應用程序的研究,發現此應用程序是可以改裝在普通計算機上運行的。只需要以下兩個步驟:
(1) 將轉爐二級終端更換為一臺普通計算機,在計算機上安裝一個微軟的.net2.0運行環境。
(2) 將數據庫配置文件修改為網絡數據庫。具體操作如圖3所7K,將value的值由localhost改為服務器的IP地址192.2.12.2,客戶端的HMI畫面就可以通過網絡訪問服務器的數據庫通過以上設置就實現了所有對應用程序的操作都在本地終端機上操作,占用客戶機資源,而數據通過網絡傳輸到服務器的數據庫中,間接的實現了 C/S(客戶端/服務器)模式,大大減輕了服務器 的資源使用率。
3.3刪除原有死信隊列信息
(1)編寫批處理程序定期(一周)自動將死信隊列(dead-letter queue)里面的信息通過MQ命令全部刪除。
(2 )將原有的死信隊列(dead-letter queue )里面的信息通過MQ命令全部刪除。
通過cmd命令啟動命令行一>輸入runmqsc命 令啟動隊列管理器-輸入diS(*)查看所有的隊列-»輸入CLRAR QLOCAL(SYSTEM.DEAD.LETTER. QUEUE命令清除所有死信隊列里面的信息。
(3)編寫批處理程序自動將MQ的日志文件按日期備份到機房終端機中,如圖4所示。
4實施效果與驗證
(1)系統運行更加穩定,運行時間得到延長(從每6天重啟一次延長到42天重啟一次),減少轉爐手動操作的次數,使數據統計更加準確,分公司ERP系統對生產實際統計矛盾等問題不再出現。
修改前:服務器每6天重啟一次,重啟次數為61次,每次重啟影響3個轉爐,需要手動操作爐次總計為61 x 3=183爐次。
修改后:服務器每42天重啟一次,42天內只要保證在特定的時間進行重啟操作,就會使對生產的影響降到最低。
(2) 服務器使用率下降明顯,正常使用不再岀現卡頓現象,不會岀現數據傳輸延時、終端機操作反應慢等現象。
修改前:CPU使用率平均75%左右,內存使用率峰值為85%左右。
修改后:CPU使用率下降到平均50%左右,內存使用率下降到峰值為70%左右。
(3) 修改后,現場生產至今未出現因為此問題導致的二、三級通信問題。