DCS中人機界面死機現(xiàn)象及處理辦法
DCS死機現(xiàn)象有兩種:人機界面死機、控制器死機。前者比后者損失要小。控制器死機是I/O卡件安排太多或存儲器容量不夠,一旦控制器程序運行到某一位置,就停留在該位置,程序不再往下走,即使重啟也無濟于事。
人機界面(主要是操作站)死機現(xiàn)象所有DCS都不同程度地存在,只是頻繁程度不同。另外與DCS使用時間長短有關。因硬件引起的死機,顯示不再能恢復。如操作站電源電壓偏低,很容易使操作站死機。由于軟件和通信連線的速率選擇不合適引起的死機現(xiàn)象經(jīng)一段時間仍能恢復。操作站操作系統(tǒng)與監(jiān)控軟件磨合不好也能引起死機,對此維護人員毫無辦法,稱為原發(fā)性死機。由于某些配置不合理引發(fā)網(wǎng)絡堵塞、內(nèi)存太小等原因造成的死機,過幾分鐘后自己能恢復。
一、DCS人機界面的死機現(xiàn)象
近來,由于MIS系統(tǒng)需從DCS中讀取生產(chǎn)實時數(shù)據(jù)。在網(wǎng)絡中接進動態(tài)數(shù)據(jù)服務器,有的采用DDE方式,在讀取數(shù)據(jù)較多情況下(如3000點),由于DDE消耗資源較多,網(wǎng)絡堵塞現(xiàn)象就變得十分頻繁,并使得各種人機界面的節(jié)點死機現(xiàn)象變得嚴重。
網(wǎng)絡堵塞現(xiàn)象的嚴重程度與多種因素相關。從操作站取數(shù)據(jù),采用DDE方式,如果取的數(shù)據(jù)在500點以下,問題還不算太大。如果取幾千點數(shù)據(jù),操作站死機幾乎是必然的。如果把節(jié)點連到DCS的通信網(wǎng)絡上,從網(wǎng)絡接口取數(shù)據(jù),情況要好一些。
控制器把數(shù)據(jù)送到接口,人機界面從網(wǎng)絡接口讀取數(shù)據(jù)應遵守網(wǎng)絡通信協(xié)議。網(wǎng)絡物理結(jié)構(gòu)有環(huán)型和總線型兩種,總線網(wǎng)絡在邏輯上也是環(huán)型的。星型網(wǎng)絡只用于小系統(tǒng)(100個I/O點內(nèi))。常用通信協(xié)議是廣播式,網(wǎng)絡上的節(jié)點只要把數(shù)據(jù)送到網(wǎng)絡上,它就要不斷廣播數(shù)據(jù),需要數(shù)據(jù)的節(jié)點就接收數(shù)據(jù)。廣播式協(xié)議的網(wǎng)絡除這種方式外,還有一種方式:一個節(jié)點向網(wǎng)上其他節(jié)點問詢數(shù)據(jù),如其他節(jié)點沒有,它就反復進行問詢直至讀取到這個數(shù)據(jù)。如果網(wǎng)絡上根本沒有這個數(shù)據(jù),就會造成網(wǎng)絡堵塞。
為使運行人員熟練DCS操作站的操作,可采用仿真系統(tǒng),了解DCS的鍵盤,以減少誤操作引起死機;也可了解操作站死機情況。
在DCS運行時間較長的情況下,組態(tài)只加不減,有一部分組態(tài)實際上已沒有與真正的I/O點相連,與控制無關。在工程師站的用戶應用程序中有這樣的I/O點。動態(tài)數(shù)據(jù)服務器接入時,欲將DCS上所有數(shù)據(jù)點都讀上去,因其中有大量數(shù)據(jù)點無效而造成網(wǎng)絡堵塞,所以人機界面就發(fā)生死機。這時可用逆向工程師站讀取控制器中的組態(tài),與正向工程師站的內(nèi)容進行比較,刪除無效點,就可避免網(wǎng)絡堵塞。
另一個應注意問題是在接入動態(tài)數(shù)據(jù)服務器時,應檢查所有接口的軟件版本是否一致,否則會影響數(shù)據(jù)傳遞。
解決網(wǎng)絡堵塞的第三種方法是:如果采用例外報告方式,可加大例外報告區(qū)域以減少網(wǎng)絡通信量。例外報告是指現(xiàn)場某點只在發(fā)生變化時把數(shù)據(jù)送到網(wǎng)絡上。為防止點已壞而人機界面未知的情況,即使點不變化,超過一段時間也要報告。為減少網(wǎng)絡上的通信量,把例外報告的兩個參數(shù)都適當加大,也能達到減少數(shù)據(jù)量的目的。
最近推出的通用操作站多采用Windows NT/2000操作系統(tǒng),監(jiān)控軟件也通用,如FIX、InTouch等。由于軟件銷售量大,存在問題較少,通用操作站開放性好,死機現(xiàn)象大大減少。如果驅(qū)動軟件不太好,也會引起死機。重要的是,它無論維護成本、備件采購都不受DCS制造廠家的限制。但為防黑客、病毒侵入,防火墻不可缺少。
二、C/S結(jié)構(gòu)的人機界面的死機現(xiàn)象
1. C/S結(jié)構(gòu)
DCS人機界面采用普通PC、Windows操作系統(tǒng)以后,為增加人機界面數(shù)量,采用C/S結(jié)構(gòu),只要控制器上通過接口與服務器相連,服務器和客戶機上使用網(wǎng)絡接口適配器用電纜連接,就成為C/S結(jié)構(gòu)。
客戶機共享服務器的資源。服務器通常安裝在安全場所,保存DCS控制器送來的最有價值的現(xiàn)場生產(chǎn)數(shù)據(jù)。
作為服務器的計算機可能同時為幾臺或十幾臺客戶機服務,所以服務器須要具有比客戶機更快的處理器、較大的內(nèi)存和更大的存儲空間。
客戶機是標準的PC運行Windows操作系統(tǒng),僅與服務器通信,不和其他客戶機通信,有自備軟件包。在作DCS操作站時,服務器和客戶機可運行同一監(jiān)控軟件,以便共享服務器資源。兩者所裝軟件的區(qū)別是服務器應有DCS控制器驅(qū)動軟件而客戶機不需要。
還有一種情況是,在服務器監(jiān)控軟件上安裝OPC服務器,在客戶機監(jiān)控軟件上安裝OPC Client,客戶機就可訪問服務器。如在服務器上不需用圖形方式觀察現(xiàn)場設備運行情況,在服務器上也可不安監(jiān)控軟件,而只安OPC服務器,只是在查找故障時,才需要顯示器。
采用C/S結(jié)構(gòu)可節(jié)省DCS昂貴的網(wǎng)絡專用接口。為系統(tǒng)可靠運行,采用雙服務器冗余運行,這就是雙機雙網(wǎng)。一個系統(tǒng)最多用到兩個專用接口。
最終用戶反映,采用多個接口的多主站結(jié)構(gòu)較好,原因是服務器和客戶機安排不合適容易死機。如INFI90的Conductor NT和Honeywell的GUS在版本較低情況下都容易死機。
2. C/S結(jié)構(gòu)死機現(xiàn)象的產(chǎn)生
C/S結(jié)構(gòu)網(wǎng)絡的兩種硬件,通常稱為客戶PC和服務器。客戶PC在中央控制室,而服務器放在安全的地方。DCS操作站死機的原因錯綜復雜。本文僅限于分析由于采用C/S結(jié)構(gòu)引起的死機原因,有兩種情況:
控制器、服務器和客戶機三者之間的連接有兩種情況:一是DCS控制器有以太網(wǎng)接口,三者用以太網(wǎng)交換機來連接。交換機有多種端口,每個端口數(shù)據(jù)傳輸速率可以不等。端口數(shù)量由連接的計算機臺數(shù)決定。交換機主要指標是背板寬度和存儲器大小。如果采用以太網(wǎng)電纜如10BASE、100BASE等的速率都可傳輸,如采用5類線只能是10BASE。在圖2以太網(wǎng)的連接是星型。使用離散的
電纜將每臺計算機連接到中央連接點,通常稱為網(wǎng)絡集線器。每臺計算機使用獨立電纜,連接失敗只影響有關的單臺計算機,其他計算機可繼續(xù)運行。如果各臺機器適配器速率相同,以太網(wǎng)星型連接通常使用10BaseT電纜。
控制器把信息送給服務器,客戶機從服務器讀寫數(shù)據(jù),由于客戶機數(shù)量較多,如果它們之間采用一樣的連線就可能死機。各臺客戶機從服務器讀取的數(shù)據(jù)可以一樣,也可以不一樣。也可以是所有客戶機顯示內(nèi)容一樣,多臺操作站冗余運行。每臺操作站與服務器交換的數(shù)據(jù)較多,可采用100BASE端口,服務器和控制器數(shù)據(jù)交換較少,該采用10BASE端口,客戶機之間基本不交換數(shù)據(jù),也可采用10BASE端口。如果不這樣,很可能產(chǎn)生客戶機死機。
客戶PC和服務器的配置不合適